MSN bot se asi zbláznil
Při sledování týdenních statistik návštěvnosti jsem narazil na zajímavý problém. Návštěvnost mi stoupnula o 150%. Po chvilce probírání statistik jsem našel důvod – může za to splašený MSN bot. Ne že by mi to přímo vadilo, ale dost to zkresluje moje data a musím se probrat balastem než zjistím to, co potřebuji.
Všechny přístupy Bota jsou zaznamenány z prohlížeče WebKit a OS Windows 7. Je mi jasné, že to je automat, ale nechápu proč tolik přístupů za den, ke všemu se snaží indexovat pouze hlavní stránku. Celkem se zatím jednalo o 52 různých IP adres, některé navštíví web i 5x denně.
Zkoušel jsem hledat, jestli už někdo neřešil stejný problém, a nejsem sám. Jediné, co jsem se dozvěděl, bylo zakázání přístupu v robots.txt. To se mi nechce dělat, už jenom z toho důvodu, že bych se zbavil potencionálních přístupů z vyhledávače Bing.
Buď se jedná o chybu v Botovi nebo je pro Microsoft jednodušší si naindexovat web v každém datacentru zvlášť než si nasbíraná data mezi sebou periodicky synchronizovat. Nicméně to nevysvětlí, proč navštěvuje web z jedné IP adresy několikrát denně.
Jediná ochrana by byla ošetřit detekci návštěvníka a MSN bota nezaznamenávat. U TopListu a dalších veřejných počítadel to budeme muset zkousnout.
Nemůže to být nějaký reindex?
I kdyby to byl reindex, tak tech navstev (i duplicitnich) je zbytecne moc.
Bot ti chce udělat DoS? 😀
To by musel v poctech dotazu pridat :). Cetl jsem prispevek s nadpisem „MSN bot must die“, kde se rozebiraly problemy pripadnyho DDoS ze strany MSN a preventivne radili zablokovat IP adresy. Byl to starsi clanek, tak se to doufam pohlo k lepsimu :). Rozhodne radsi zacnu kesovat stranku.
Smiř se s tím, že jsou na světě i tací, co k tobě na web rádi chodí. Jenom proto, že je to Bot, bys ho neměl diskriminovat a bránit mu v přístupu. Dozvědět se to pak někdo z Bruselu, tak máš po křížalkách.