Bücher digitalisieren mit CAPTCHA

Ich habe soeben erfahren das es eine „neue“ Art von CAPTCHA gibt. CAPTCHA sind kleine Bilder auf denen, meist verschnörkelt Buchstaben und Zahlen abgebildet sind. Damit ist es möglich seine Webseite vor Spam zu schützen oder zumindest es den Spammern zu erschweren (siehe Gästebuch)

Nun aber was ist so anders an der „neuen“ Methode, sie hat den netten Nebeneffekt das so Bücher Digitalisiert werden. Wie lange es allerdings dauert bis ein Buch vollständig digitalisiert ist, wird sich noch zeigen, auf alle Fälle ist das System sehr interessant.


„But if a computer can’t read such a CAPTCHA, how does the system know the correct answer to the puzzle? Here’s how: Each new word that cannot be read correctly by OCR is given to a user in conjunction with another word for which the answer is already known. The user is then asked to read both words. If they solve the one for which the answer is known, the system assumes their answer is correct for the new one. The system then gives the new image to a number of other people to determine, with higher confidence, whether the original answer was correct.“

Na mal schauen ob sich das ganze durchsetzt.