
Ett captcha eller som det är en förkortning av ”Completely Automated Public Turing test to tell Computers and Humans Apart”. Vanliga captcha tenderar ofta att vara meningslösa ord som sätts samman slumpmässigt men det har visat sig vara otillräckligt. Recaptcha som används i det här fallet är ord och meningar från scannade upplagor av New York Times eller böcker – och i sig handlar det om att lära datorerna att bättre känna igen tecken då ett av de ord som skrivs in inte kunnat lösas av scanningens igenkänning därmed blir en del av det optiska igenkänningsystemets läroprocess eftersom man utgår från att människan skriver rätt.
Så om du får underliga ord när du beställer saker så är det en del av något större – digitalisering av mängder av böcker och skrifter. En gigantisk crowdsourcing-kampanj om läsning, om att digitalisera textarkiv mm.
Se en bra genomgång av hur systemet är uppbyggt från TED: