Dnešním dnem vrcholí naše intenzivní práce na řešení problému spammových blogů, jejichž hromadný vznik v poslední době zatěžoval provoz Blog.cz. Dnes jsme nasadili novou ochranu proti těmto nežádoucím blogům, která by měla jejich škodlivost významně omezit.
O problému se spamem byli uživatelé informováni v říjnu loňského roku:
Spam. Připomeňme jen to nejdůležitější: splogy (= spam blogy) jsou blogy, které nějakým způsobem těží z toho, jak pracují současné internetové vyhledávače, které hodnotí počet a váhu zpětných odkazů.
Nejsou zakládány lidmi, ale anonymními internetovými roboty (tzv. botneti), kteří jsou schopni generovat v krátkém čase ohromné množství nových blogů zaplněných nejrůznějším obsahem, nejčastěji zkopírovaným z různých internetových stránek.
Budování tzv. link farem prostřednictvím tisíců splogů plných zpětných odkazů je nešvar moderního internetu a problém, kterému čelí většina provozovatelů služeb umožňujících založení vlastní stránky. Tyto falešné blogy koncovým uživatelům nic dobrého nepřináší, naopak zabírají místo v databázích, obsazují uživatelská jména, spotřebovávají síťové kapacity, zanáší vyhledávače irelevantními výsledky, často slouží k šíření počítačových virů, atd. Jejich vznik a existence je tedy nežádoucí.
Na Blog.cz jsme analyzovali nejčastější domény, na které vedou odkazy ze spammových článků na blozích, které byly pravděpodobně založeny roboty. Vznikl tak seznam domén, který může sloužit jako vodítko pro určení, zda daný blog je či není spam. Seznam naleznete na konci tohoto článku. Pokud jakýkoli blog obsahuje odkazy na domény z tohoto seznamu, je zde poměrně velká pravděpodobnost, že se jedná o spam.
Při tomto posuzování se kontrolují ještě další hlediska, jako je například doba provozování blogu a celkový počet článků s odkazy na domény ze zmíněného seznamu.
Samotný seznam domén, na které odkazují spam blogy, nechápejte prosím jako označení nebezpečných či jinak problematických stránek. Nejčastěji se jedná o různé zahraniční služby, které podobně jako Blog.cz umožňují založení vlastní stránky a které botneti zneužívají k budování link farem.
Poté, co jsme pomocí výše popsaných kritérií odlišily spam blogy od normálních blogů, nastoupil další krok, a hromadně jsme
zablokovali všechny blogy, které byly
označeny jako spam. Tyto blogy jsou nahrazeny informační stránkou upozorňující na to, že porušují naše
podmínky.
Majitel každého zablokovaného blogu obdrží informační e-mail, že systém jeho blog považuje za spam, a proto byl zablokován. Další upozornění se bude zobrazovat v administraci zablokovaného blogu, kde uživatel najde i odkaz na formulář, jehož prostřednictvím nás bude moci případně kontaktovat.
Znepřístupněný blog bude možné odblokovat tak, že uživatel ze svého blogu odstraní odkazy (včetně samotného textu) na závadné domény ze seznamu na konci tohoto článku. Tzn. pokud se vám stalo, že byl váš blog zablokován kvůli podezření na spam, projděte si seznam zakázaných domén na konci tohoto článku, a poté ze svého blogu odstraňte co nejvíce odkazů na tyto domény. Jakmile odstraníte dostatek závadných odkazů (nemusíte tedy odstranit všechny), blog se vám automaticky odblokuje.
Pokud nás majitel zablokovaného blogu do 14 dnů nekontaktuje nebo neodstraní odkazy na závadné domény, systém bude jeho blog považovat definitivně za spam, a blog bude nevratně zrušen.
Postup na rozpoznávání spamu bude uplatněn jak na všechny nové, tak i na již existující blogy. Tzn. kromě zablokování již existujících spam blogů budeme neustále automaticky vyhodnocovat všechny zveřejněné (či aktualizované) články na Blog.cz, zda se nejedná o spam, a pokud toto riziko vznikne, spam blog bude zablokován a po 14 dnech zrušen.
V nejbližší době je teoreticky možné, že nástroj pro rozpoznávání spammových blogů bude potřeba doladit, protože nerozpozná úplně všechny spam blogy. Výhledově bychom ale rádi spam blogy z Blog.cz zcela vymýtili, aby neobtěžovaly naše uživatele a nezobrazovaly se nikde v žebříčcích apod.
Pevně věříme, že se nám tímto způsobem podaří problém spamu na Blog.cz vyřešit.
—
Příloha – seznam domén, na které nejčastěji odkazují spam blogy na Blog.cz:
Seznam si lze vyžádat na e-mailové adrese blog@blog.cz.
Líbí se mi to:
Líbí Načítání...
Související
Publikoval Jakuta
Četla jsem, že žena dva roky po nástupu na rodičovskou, prožívá nejhlubší pád svého sebevědomí. Určitě to byl moudrý článek. O tom, co sebevědomí udělá během dalších přibývajících roků bez sociální masáže v zaměstnání, nepsali.
Každopádně jsem se nestala nejlepší matkou na světě (ano, to jsem v plánu měla), zjistila jsem, že vařit-prát-oblékat-žít ekologicky nejde (to jsem aspoň zkoušela), nenaučila jsem se nový jazyk (to možná ještě zkusím), ani nazaložila firmu, nedodělala doktorát ani nezískala nový titul, nepohnula lokální ani světovou politikou, nezačala chovat včely... Zkrátka, že není nic, čím bych se tu blyštěla a jiskřil
Jediné, co trénuji donekonečna je trpělivost, plánovací + slaďovací schopnosti a odvahu. Běhání a psaní blogu jsou dva úniky, které si držím chráněné jako výsostné vody jejího veličenstva. To je to, co mě spojuje s dobou bez dětí a co mi umožňuje vracet se pouze a jenom k sobě. Obé je zdrojem endorfinů. Kladný vliv běhu pociťuje zejména rodina - když se vrátí úplně jiná žena/máma. A když blogem potěším někoho z vás, bude to bezmezně těšit i mě. Jiné ambice nemám. Světlu vstříc!!
Zobrazte více příspěvků