reCAPTCHA

Posted on Monday, September 17th, 2007 at 09:38, under tech. Tags: ,

Probabilmente tutti quanti abbiamo incontrato, almeno una volta nelle nostre navigazioni, un captcha: un’immagine che rappresenta una serie di lettere fortemente distorte da riconoscere e inserire in una form apposita, per dimostrare di essere umani.
Il principio fondamentale del captcha è che i software di riconoscimento immagini non sono ancora bravi quanto l’occhio umano e non sono quindi in grado di riconoscere le lettere distorte (mentre noi si).

reCAPTCHA è un’idea della Carnegie Mellon University che si basa su questo principio, ma da una prospettiva leggermente diversa.
Nei processi di digitalizzazione di libri tutte le pagine passano attraverso un software di OCR (optical character recognition) per trasformare le immagini scannerizzate in testi (più leggeri e leggibili): gli stessi problemi che hanno con i captcha, però, si presentano anche con alcune delle parole contenute nei libri, a causa delle distorsioni dovute alla stampa ed al tempo.

reCAPTCHA presenta quindi all’utente un normale captcha (per controllo) affiancato ad una di queste parole non riconosciute, in modo che sia un essere umano a fare la funzione dell’OCR. Le stesse parole vengono proposte a più utenti diversi in modo che statisticamente si possa essere sicuri di eliminare eventuali errori.

Il principio è semplice e geniale. Inoltre inserire le parole può diventare un’attività piuttosto addictive… provare per credere ;)

One Response to “reCAPTCHA”

  1. Be A Good Son Says:

    Hi your message is delightful.
    I like your blog..
    bye