reCaptcha, reconocimiento de términos de forma distribuida mediante captchas

reCaptcha, reconocimiento de términos de forma distribuida mediante captchas
Facebook Twitter Flipboard E-mail

Día a día, los que navegamos por internet, en muchas ocasiones tendremos que descrifrar los captchas para abrirnos una cuenta en algún servicio o dejar algún comentario en otros. Por otro lado, cuando usamos un escaner mediante OCR, siempre tendremos que revisar las palabras del texto ya que el sistema OCR no es capaz de traducirlo correctamente.

¿Qué tiene que ver una cosa con la otra? Pues muy sencillo, ya que se trata de reCaptcha, un proyecto para la digitalización de libros y documentos escaneados del Internet Archive de la escuela de Ciencias de la computación de la Universidad de Carnegie Mellon que pretende la revisión distribuida de los términos que no ha podido convertir a texto mediante el escaneo con el sistema OCR, por el que se nos ofrece la palabra a descifrar como captcha y otro término para su comprensión.

De esta manera, se pretenden digitalizar los contenidos de los libros a textos, y de manera distribuida mediante captchas los usuarios ayudarán a descifrar los términos que el sistema OCR no ha sido capaz de averiguar, permitiendo validar la fiabilidad de los términos introducidos por los usuarios, y que actualmente reCaptcha está colaborando de esta manera en la digitalización de libros y documentos del Internet Archive.

Actualmente podemos encontrar plugins para WordPress, MediaWiki, phpBB, y PHP.

Vía | Webware Enlace | Sitio oficial de reCaptcha

Comentarios cerrados
Inicio