Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cpcha Wiki
Cpcha Wiki
de una computadora es humano (normalmente para proteger sitios web contra bots ) y,
al mismo tiempo, asiste en la digitalizaci�n de libros. reCAPTCHA fue desarrollado
originalmente por Luis von Ahn , David Abraham, Manuel Blum , Michael Crawford, Ben
Maurer, Colin McMillen y Edison Tan en el campus principal de Pittsburgh de la
Carnegie Mellon University . [1] Fue adquirido por Google en septiembre de 2009.
[2]
reCAPTCHA ha digitalizado completamente los archivos de The New York Times y los
libros de Google Books a partir de 2011. [3] El archivo se puede buscar en el
archivo de art�culos del New York Times , donde se han archivado m�s de 13 millones
de art�culos en total. Desde 1851 hasta nuestros d�as. [4] A trav�s de la
colaboraci�n masiva , reCAPTCHA ayud� a digitalizar libros que son demasiado
ilegibles para ser escaneados por computadoras, as� como a traducir libros a
diferentes idiomas, a partir de 2015. [5]
Se ha informado que el sistema muestra m�s de 100 millones de CAPTCHA por d�a, [6]
en sitios como Facebook , TicketMaster , Twitter , 4chan , CNN.com , StumbleUpon ,
[7] Craigslist (desde junio de 2008), [8] y EE.UU. Nacional de Telecomunicaciones e
Informaci�n 's convertidor digital de TV cuadro sitio web del programa de cupones
(como parte de la transici�n de EE.UU. DTV ). [9]
Contenido
1 Origen
2 Operaci�n
2.1 No CAPTCHA reCAPTCHA
3 Implementaci�n
4 criticas
5 seguridad
6 proyectos derivados
7 solucionadores automatizados
8 referencias
9 Lectura adicional
10 enlaces externos
Origen
Distributed Proofreaders fue el primer proyecto que ofreci� voluntariamente su
tiempo para descifrar el texto escaneado que OCR no pudo leer. Trabaja con el
Proyecto Gutenberg para digitalizar material de dominio p�blico y utiliza m�todos
muy diferentes de reCAPTCHA.
Operaci�n
Un ejemplo de c�mo se vio un desaf�o reCAPTCHA en 2007, [17] que contiene las
palabras "siguiente hallazgo". La ondulaci�n y el golpe horizontal se agregaron
para aumentar la dificultad de romper el CAPTCHA con un programa de computadora.
El texto escaneado se somete a an�lisis mediante dos reconocimiento �ptico de
caracteres diferentesprogramas Sus salidas respectivas se alinean entre s� mediante
algoritmos est�ndar de concordancia de cadenas y se comparan entre s� y con un
diccionario de ingl�s. Cualquier palabra que se descifre de manera diferente por
ambos programas de OCR o que no est� en el diccionario de ingl�s se marca como
"sospechosa" y se convierte en un CAPTCHA. La palabra sospechosa se muestra, fuera
de contexto, a veces junto con una palabra de control ya conocida. Si el humano
escribe la palabra de control correctamente, entonces la respuesta a la palabra
cuestionable se acepta como probablemente v�lida. Si suficientes usuarios
escribieran correctamente la palabra de control, pero escribieran incorrectamente
la segunda palabra que OCR no hab�a reconocido, entonces la versi�n digital de los
documentos podr�a terminar conteniendo la palabra incorrecta. La identificaci�n
realizada por cada programa OCR recibe un valor de 0.5 puntos, y cada
interpretaci�n por un humano tiene un punto completo. Una vez que una
identificaci�n dada llega a 2.5 puntos, la palabra se considera v�lida. Esas
palabras a las que los jueces humanos otorgan sistem�ticamente una sola identidad
se reciclan posteriormente como palabras de control.[18] Si las tres primeras
suposiciones coinciden entre s� pero no coinciden con ninguna de las OCR, se
consideran una respuesta correcta y la palabra se convierte en una palabra de
control. [19] Cuando seis usuarios rechazan una palabra antes de elegir la
ortograf�a correcta, la palabra se descarta como ilegible. [19]
El m�todo reCAPTCHA original fue dise�ado para mostrar las palabras cuestionables
por separado, como correcci�n fuera de contexto, en lugar de en uso, como dentro de
una frase de cinco palabras del documento original. [20] Adem�s, la palabra de
control podr�a confundir el contexto de la segunda palabra, como una solicitud para
que "/ metal / / fife /" se ingrese como "archivo de metal" debido a que la
conexi�n l�gica de archivo con una herramienta de metal se considera m�s Com�n que
el instrumento musical " fife ". [ cita requerida ]
En 2012, reCAPTCHA comenz� a usar fotograf�as de los n�meros de las casas tomadas
del proyecto Street View de Google , adem�s de las palabras escaneadas. [21]
No CAPTCHA reCAPTCHA
El noCAPTCHA reCAPTCHA
En 2014, reCAPTCHA comenz� a implementar un an�lisis de comportamiento de las
interacciones del navegador con el CAPTCHA para predecir si el usuario era un
humano o un bot antes de mostrar el captcha, y presentaba un captcha
"considerablemente m�s dif�cil" en los casos en que ten�a razones para pensar que
el usuario podr�a ser un bot. A finales de 2014, este mecanismo comenz� a
implementarse en la mayor�a de los servicios p�blicos de Google. [23] Debido a que
NoCAPTCHA se basa en el uso de cookies de Google que tienen al menos unas semanas
de antig�edad, reCAPTCHA se ha vuelto casi imposible de completar para las personas
que borran sus cookies con frecuencia. [ cita requerida ]
Implementaci�n
Las pruebas reCAPTCHA se muestran desde el sitio central del proyecto reCAPTCHA,
que proporciona las palabras para ser descifrado. Esto se hace a trav�s de una API
de JavaScript con el servidor haciendo una devoluci�n de llamada a reCAPTCHA
despu�s de que se haya enviado la solicitud. El proyecto reCAPTCHA proporciona
bibliotecas para varios lenguajes de programaci�n y aplicaciones para facilitar
este proceso. reCAPTCHA es un servicio gratuito que se proporciona a los sitios web
para asistencia con el desciframiento, [25] pero el software reCAPTCHA no es de
c�digo abierto . [26]
La cr�tica
Algunos han criticado a Google por usar reCAPTCHA como fuente de trabajo no
remunerado. [28] Dicen que Google est� utilizando injustamente a personas de todo
el mundo para ayudarlo a transcribir libros, direcciones y peri�dicos, y etiquetar
los datos de imagen para su esfuerzo de auto sin conductor sin ninguna
compensaci�n. [29] En respuesta a esta cr�tica, los competidores han surgido
prometedoras propuestas de valor �nicas como compensar al host del sitio web o al
usuario final por el trabajo que realizan. [30]
El uso de reCAPTCHA ha sido calificado como "una seria barrera para el uso de
internet" para personas con problemas de visi�n o discapacidades, como dislexia,
por la periodista de la BBC Stephanie Hegarty. [31]
reCAPTCHA tambi�n es una barrera para el uso de Internet en �reas del mundo donde
existe una gran censura de Internet y los sitios habilitantes subyacentes est�n
bloqueados.
Seguridad
El 27 de junio de 2012, Claudia Cruz, Fernando Uceda y Leobardo Reyes (un grupo de
estudiantes de M�xico) publicaron un art�culo que muestra un sistema que funciona
con im�genes de reCAPTCHA con una precisi�n del 82%. [41] Los autores no han dicho
si su sistema puede resolver im�genes reCAPTCHA recientes, aunque afirman que su
trabajo es OCR inteligente y robusto para algunos, si no todos, los cambios en la
base de datos de im�genes.
Solo las palabras que ambos programas de OCR no reconocieron se usan como palabras
de control. Por lo tanto, cualquier programa que pueda reconocer estas palabras con
una probabilidad no insignificante representar�a una mejora sobre los programas de
OCR de vanguardia. [19]
Proyectos derivados
reCAPTCHA tambi�n cre� el proyecto Mailhide, que protege las direcciones de correo
electr�nico de las p�ginas web para que no sean recolectadas por los spammers .
[43] De forma predeterminada, la direcci�n de correo electr�nico se convirti� a un
formato que no permit�a que un rastreador viera la direcci�n de correo electr�nico
completa; por ejemplo, "mailme@example.com" se habr�a convertido a "mai ... @
example.com". Luego, el visitante har�a clic en "..." y resolver�a el CAPTCHA para
obtener la direcci�n de correo electr�nico completa. Tambi�n se puede editar el
c�digo emergente para que ninguna de las direcciones sea visible. Mailhide se
suspendi� en 2018 porque depend�a de reCAPTCHA V1. [44]