Jak funguje ochrana proti spamu

Zajímá vás, jak se na Blog.cz bráníme proti spamu? A jak moc jsme v tom (ne)úspěšní? Pak si nenechte ujít následující článek.

Ochranu proti spamu lze rozdělit na dva stupně: v prvním kroku bráníme již samotnému vzniku nového spam blogu. V druhém kroku potom automaticky blokujeme již existující spam blogy.
1) Kontrolní otázky v registračním formuláři
Registrační formulář na stránce blog.cz/registrace byl nedávno obohacen o kontrolní otázky. Ty byly vymyšleny tak, aby na ně normální uživatel snadno z hlavy věděl odpověď, ale spammerovi by měly výrazně ztížit (ideálně zcela znemožnit) založení nového blogu. Otázek je relativně velké množství, ve formuláři se zobrazují současně 4 náhodně vybrané otázky, a uživatel musí správně zaškrtnout odpověď u všech 4 otázek.
Předpokládáme, že spammeři odpovědět otázky nemohou, a pokusí se tedy správnou odpověď tipnout. Pokud se ale netrefí (šance, že NÁHODNĚ správně uhádnete všechny 4 odpovědi, je velice malá), registrační formulář jim nový blog založit nedovolí.
A pokud to bude spammer zkoušet s tipováním dál, systém mu po 4 neúspěšných pokusech zobrazí následující hlášku:
Spammer má následně na hodinu znemožněno dostat se na registrační formulář.
Kontrolní otázky jsou v registračním formuláři nasazeny teprve krátce, ale zatím se zdá, že mají 100% účinnost: normální uživatelé si dál běžně zakládají své blogy, ale spammeři mají smůlu – přes kontrolní otázky se nedostanou a nové spam blogy už nevznikají.
Pořád jsou tu ale již existující spam blogy, které vznikly v minulosti. Ty jsou postupně likvidovány prostřednictvím druhého stupně ochrany proti spamu.
2) Automatické blokování spam blogů
Spam blogy na Blog.cz vznikaly nejčastěji proto, aby budovaly odkazově provázanou síť link farem, podporujících nejrůznější pochybné zahraniční stránky. Proto jsme analyzovali nejčastější domény, na které vedou odkazy ze spammových článků na blozích. Vznikl tak seznam domén, který slouží jako vodítko pro určení, zda daný blog je či není spam. Tento seznam najdete zde.
Při zveřejnění každého nového článku na Blog.cz dojde ke kontrole, zda článek neobsahuje některou ze závadných domén (z průběžně aktualizovaného) seznamu zmíněného výše. Pokud systém v článku odhalí jakoukoli ze zakázaných domén, uživatel je na to při zveřejnění článku upozorněn.
Uživatel přesně vidí, jaký zakázaný výraz ve svém článku použil, a může ho proto smazat. Současně je upozorněn, že mu blog můžeme zrušit. Běžný uživatel závadnou doménu z článku smaže a dál nemusí nic řešit. Spammer ale potřebuje dál pokračovat v publikování článků s odkazy na zakázané domény, a tak varování ignoruje.
Následně proto narazí na limit 20 článků – pokud uživatel na svém blogu zveřejní 20 článků, z nichž každý obsahuje alespoň jeden odkaz na závadnou doménu ze seznamu, systém blog automaticky zablokuje a nahradí informační stránkou s upozorněním, že blog porušuje podmínky Služby.
Uživatele o tom informujeme e-mailem i upozorněním v administraci.
Je mimochodem zajímavé, že spammeři na svém blogu často dál publikují nové články i poté, co jim blog zablokujeme. Ale to již nemusí vadit, protože články ze zablokovaného blogu se nikde nezobrazují – v žebříčcích ani ve vyhledávačích.
Pokud spammer z blogu závadné domény neodstraní, blog je po 14 dnech definitivně zrušen. Běžný uživatel se tak vůbec nemusí ničeho obávat. Limit 20 článků byl nastaven právě tak, aby dostatečně nastavil hranici, u níž lze bezpečně odlišit blog normálního uživatele (který nechtěně použil v článku odkaz na závadnou doménu) od spammera, který cíleně publikuje velké množství článků se závadnými odkazy.
Výsledek? Podívejte se sami do žebříčku Nejnovějších článků. Je velice pravděpodobné, že tam už nenajdete jediný spam blog. A pokud se tam ojediněle nějaký článek ze spam blogu vyskytne, pak se jedná o blog, který bude stejně za chvíli automaticky zablokován a ze žebříčku následně zmizí. (A nový blog už si spammer nezaloží, protože se nedostane přes kontrolní otázky).
Neradi bychom se radovali předčasně, ale vše nasvědčuje tomu, že problém spamu, který trápil Blog.cz dlouhé měsíce, se nám podařilo definitivně vyřešit.
Předchozí vývoj si můžete připomenout v těchto článcích:

Publikoval Jakuta

Četla jsem, že žena dva roky po nástupu na rodičovskou, prožívá nejhlubší pád svého sebevědomí. Určitě to byl moudrý článek. O tom, co sebevědomí udělá během dalších přibývajících roků bez sociální masáže v zaměstnání, nepsali. Každopádně jsem se nestala nejlepší matkou na světě (ano, to jsem v plánu měla), zjistila jsem, že vařit-prát-oblékat-žít ekologicky nejde (to jsem aspoň zkoušela), nenaučila jsem se nový jazyk (to možná ještě zkusím), ani nazaložila firmu, nedodělala doktorát ani nezískala nový titul, nepohnula lokální ani světovou politikou, nezačala chovat včely... Zkrátka, že není nic, čím bych se tu blyštěla a jiskřil Jediné, co trénuji donekonečna je trpělivost, plánovací + slaďovací schopnosti a odvahu. Běhání a psaní blogu jsou dva úniky, které si držím chráněné jako výsostné vody jejího veličenstva. To je to, co mě spojuje s dobou bez dětí a co mi umožňuje vracet se pouze a jenom k sobě. Obé je zdrojem endorfinů. Kladný vliv běhu pociťuje zejména rodina - když se vrátí úplně jiná žena/máma. A když blogem potěším někoho z vás, bude to bezmezně těšit i mě. Jiné ambice nemám. Světlu vstříc!!

Zanechat odpověď

Vyplňte detaily níže nebo klikněte na ikonu pro přihlášení:

Logo WordPress.com

Komentujete pomocí vašeho WordPress.com účtu. Odhlásit /  Změnit )

Google photo

Komentujete pomocí vašeho Google účtu. Odhlásit /  Změnit )

Twitter picture

Komentujete pomocí vašeho Twitter účtu. Odhlásit /  Změnit )

Facebook photo

Komentujete pomocí vašeho Facebook účtu. Odhlásit /  Změnit )

Připojování k %s

%d blogerům se to líbí: