Att hjälpas åt när vi loggar in

Ni kanske har sett den här händelsen senaste dagarna: en kvinna ska beställa sin flygresa och Ryanair använder sig av ett säkerhetssystem för att undvika spam som kallas ReCaptcha (som ägs av Google) som är ett vanligt sätt att säkra upp kommentarer, beställningar etc. Ni har säkert sett det hos Facebook om ni lagt upp länkar, när ni beställt resor, skrivit kommentarer eller liknande.

För att förbättra systemen har man valt att använda riktiga ord som slumpmässigt och visuellt stökigt (bilder) visas för att på så sätt skapa en barriär mot script och automatiserade tjänster ska kunna förstöra eller spamma.

Ett captcha eller som det är en förkortning av ”Completely Automated Public Turing test to tell Computers and Humans Apart”. Vanliga captcha tenderar ofta att vara meningslösa ord som sätts samman slumpmässigt men det har visat sig vara otillräckligt. Recaptcha som används i det här fallet är ord och meningar från scannade upplagor av New York Times eller böcker – och i sig handlar det om att lära datorerna att bättre känna igen tecken då ett av de ord som skrivs in inte kunnat lösas av scanningens igenkänning därmed blir en del av det optiska igenkänningsystemets läroprocess eftersom man utgår från att människan skriver rätt.

Så om du får underliga ord när du beställer saker så är det en del av något större – digitalisering av mängder av böcker och skrifter. En gigantisk crowdsourcing-kampanj om läsning, om att digitalisera textarkiv mm.

Se en bra genomgång av hur systemet är uppbyggt från TED: