Vous avez sûrement déjà croisé le système de vérification humaine reCAPTCHA qui permet de lutter contre le spam, en retapant 2 mots écrits dans un formulaire. Mais saviez-vous que ce système permet de manière astucieuse de numériser des milliers de livres papier grâce à votre propre contribution ? En effet, sur les 2 mots que vous tapez, un seul est connu et vérifié.
L'autre n'est pas connu, mais en le proposant à des centaines d'internautes différents et en ayant toujours la même réponse de leur part, le système sait alors que l'association entre ce qui a été scanné et ce qui a été tapé par les internautes est correct. Et voilà comment on arrive à numériser des milliers d'ouvrages avec un système antispam ! L'OCR (système de reconnaissance des caractères automatique par informatique) n'est aujourd'hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain, on arrive à de bien meilleurs résultats. Le slogan de la société (qui a été rachetée par Google) incarne bien le fonctionnement de ce système : "stop spam, read books".
Tous les commentaires (107)
C'est ce qui est écrit en simplifié
PS : moi g compris que le commentaire de vb73 c'est l'anecdote qui n'est pas très claire
En gros des mec prennent du temps à inventer des sistèmes pour que Google les rachètent derrière en gros c comme si toi tu bossait et que c'était ton voisin qui était récompensé c'est super injuste et sa me donne un peu l'impression que Google n'as pas d'ingénieurs mais un gros compte en banque
On travaille pour Google et on n'est pas payé? Inadmissible!
Sinon, on pourrait écrire n'importe quoi sur les mots non reconnus? :o
Chapeau à celui qui a eu l'idée de créer ca c'est très ingénieux ! Sachant qu'on me met une captcha a chaque téléchargement j'ai bien du numériser trois quatre livres ^^
C est pour ça que defois je tape un mot en me disant : what the f**k !? Et que le captcha valide .
Au passage c'est cool l'OCR mais c'est très approximatif (comme pas mal de service Google en fait) et interchange souvent les i et les l et les remplacé même des fois par des virgules.
intéressant mais j'ai rien compris !! lol