Vous avez sûrement déjà croisé le système de vérification humaine reCAPTCHA qui permet de lutter contre le spam, en retapant 2 mots écrits dans un formulaire. Mais saviez-vous que ce système permet de manière astucieuse de numériser des milliers de livres papier grâce à votre propre contribution ? En effet, sur les 2 mots que vous tapez, un seul est connu et vérifié.
L'autre n'est pas connu, mais en le proposant à des centaines d'internautes différents et en ayant toujours la même réponse de leur part, le système sait alors que l'association entre ce qui a été scanné et ce qui a été tapé par les internautes est correct. Et voilà comment on arrive à numériser des milliers d'ouvrages avec un système antispam ! L'OCR (système de reconnaissance des caractères automatique par informatique) n'est aujourd'hui pas assez au point pour être suffisamment fiable. En utilisant le cerveau humain, on arrive à de bien meilleurs résultats. Le slogan de la société (qui a été rachetée par Google) incarne bien le fonctionnement de ce système : "stop spam, read books".
Tous les commentaires (107)
Ceci explique le fait que même si l on écrit mal l un des deux mots, notre saisie est parfois acceptée. Je comprend mieux du coup!
Mais alors si cest pour les aider a numeriser des livres comment savent tils si on a mis les bonnes lettres ??? Busted
je me disais justement que c'était étrange d'écrire des mots qui n'avait aucun sens tout les deux
Ha oui? Alors comment le site reconnaît il une erreur dans un captcha?
Il y a quand meme des fois où les mots ne veulent rien dire !
Bravo ;) je me coucherai moin bête...
En effet, cette anecdote est très intéressante mais elle devrait être reformulée! J'ai relu plusieurs fois en me disant finalement que ce devait être quelque chose que je ne connaissais pas...C'est lisant les commentaires que j'ai compris que c'était la case de confirmation écrite en lettres bizarres à la fin d'un formulaire qui sert d'anti-robot....
Très bonne explication vb73
Pour la première fois sur SCMB, je n'ai rien compris!
Ce qui me rassure, c'est Fancat n'a pas compris non plus... Lol!
Bonne journée
Pour le premier captcha c'est simple des lettres connue de google sont proposer pour vérification et s'assurer qu'on est bien humain, par contre pour le second:
J'ai vraiment mis du temps à comprendre mais j'explique :
une page d'un livre est scanné celle ci est lus par un logiciel de détection de lettres pour les retranscrire sur l'ordinateur et puissent être lus sous word par exemple, cependant la détection des lettres et quelque chose de difficile pour un ordinateur car les lettre sont souvent comme on le vois dans les captcha difficile a lire donc ici google va demander au utilisateur de rentrer les lettre que eux il interprète en lisant celles proposer.
Par exemple:
le logiciel scan un mot, ce mot est alors découper pour chacune de ces lettres, exemple le mot "ordinateur" le scan va d'abord découper l'image en plusieurs images pour chaque lettre et les images ou il ne pourra pas reconnaitre la lettre il va alors nous les présenter ainsi on pourra lui dire a quelle lettre correspond chaque image, dans le scan de "ordinateur" il a n'a réussit à comprendre les 4 images des lettres (d n a u) il va alors nous montrer les 4 images des lettres et on va lui dire a quoi elles correspondent :)
Autre exemple possible ou le logiciel scan un mot et le demande en entier ici dans l'annectode "network" il va montrer l'image et on va lui dire ce qu'on lis comme mot..
Suite a un grand nombre de même réponses pour la correspondance des lettres et vus qu'on a réussis le premier captcha il en conclu que les images correspondent donc aux réponses fournis. ;)
J'ai fait long mais au moins c'est clair maintenant :D
Je comprend mieux maintenant pourquoi quand j'arrivais pas à lire le 2ème mot et que je mettais n'importe quoi ça passais quand même... Grosse info :)
Ca, c'est de la super anecdote. Maintenant je sais pourquoi il y a des mots complètement indéchiffrables dans ces foutus CAPTCHAS.
Alors ce soir je me couche vraiment moins bête, j'avais aucune connaissance de ce procédé donc merci pour l'info.
Google est présent partout dans le domaine de l'informatique ...