Vous avez sûrement déjà croisé le système de vérification humaine reCAPTCHA qui permet de lutter contre le spam, en retapant 2 mots écrits dans un formulaire. Mais saviez-vous que ce système permet de manière astucieuse de numériser des milliers de livres papier grâce à votre propre contribution ? En effet, sur les 2 mots que vous tapez, un seul est connu et vérifié.
L'autre n'est pas connu, mais en le proposant à des centaines d'internautes différents et en ayant toujours la même réponse de leur part, le système sait alors que l'association entre ce qui a été scanné et ce qui a été tapé par les internautes est correct. Et voilà comment on arrive à numériser des milliers d'ouvrages avec un système antispam ! L'OCR (système de reconnaissance des caractères automatique par informatique) n'est aujourd'hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain, on arrive à de bien meilleurs résultats. Le slogan de la société (qui a été rachetée par Google) incarne bien le fonctionnement de ce système : "stop spam, read books".

Tous les commentaires (107)
À mon avis c'est aléatoire, sinon ça rendrait le travail des robots beaucoup plus facile
C'est simple
Tu as deux mots à entrer et généralement 1 veut vraiment dire quelque chose et c'est comme ça que des livres sont numérisés (pour êtres lus avec des liseuses par exemple)
C'est pour ça que dans mon esprit rebelle, je tape le premier mot juste et le deuxième je tape n'importe quoi. Essayez ça marche.
Très ingénieux.
Merci ton commentaire et plus compréhensible que l’anecdote...
Voilà comment on développe une " IA " ...
Donc un robot qui te demande de prouver que tu t’es pas un robot c’est ça ?