fredag 23 oktober 2009

Google och myten

Jag hörde något igår som jag inte vet om det är en modern myt eller inte.
Så här: Google ska ha köpt det företag som gör såna där små textrutor man får fylla i för att inte vara ett spam. Ni vet de står två underliga ord på engelska och man ska pliktskyldigtast fylla i dem igen.
Och nu påstår myten, ryktet, att när vi gör de så "hjälper" vi Google att översätta ord som inskanningsmaskinerna gått bet på. På så sätt fylls de i även i de där böckerna.

Vad ska man tro om det?

5 kommentarer:

Jorun sa...

En rolig myt men jag tror inte på den - för om Google inte redan vet vad krumelurerna betyder kan de ju inte kolla om man skriver in rätt ord.

Karin S sa...

Jorun,
Det ligger något i det.
Det är väl tanken på hur hela jordens befolkning sitter där och mot bättre vetande ser till att det här blir gjort, som gör att jag ändå på något vänster tror på det.
Fast du har förstås rätt.

Hanna sa...

Så har det varit länge. Det finns de system som utnyttjar vanliga, ovetande internetanvändare till att lära upp OCR-program. Ett ord används för att kolla att du är en person och inte en robot, medan det andra används som träningsdata. Om användarna är tillräckligt ense om vad det står, så antas detta vara rätt svar och systemet kan använda den bilden att öva på.

De små textrutorna heter för övrigt captcha.

Karin S sa...

Hanna,
Tack för upplysningen. I och för sig vet jag inte vad OCR-program är, men resten begriper jag, tror jag.
Det projekt jag tänkte på var alltså det stora inskanningsprojektet av jordens alla böcker. Vilket borde vara något annat, men å andra sidan bordet den metod du beskriver kunna tillämpas även på det. Kanske.

Hanna sa...

OCR står för Optical Character Recognition och har i högsta grad relevans i samband med inscannandet av böcker. Det handlar nämligen om tekniken som används för att omvandla en bild av en boksida till en text. Mycket användbart om man vill kunna lagra ett stort antal böcker i elektronisk form.