Está en la página 1de 4

reCAPTCHA es un sistema similar a CAPTCHA dise�ado para establecer que un usuario

de una computadora es humano (normalmente para proteger sitios web contra bots ) y,
al mismo tiempo, asiste en la digitalizaci�n de libros. reCAPTCHA fue desarrollado
originalmente por Luis von Ahn , David Abraham, Manuel Blum , Michael Crawford, Ben
Maurer, Colin McMillen y Edison Tan en el campus principal de Pittsburgh de la
Carnegie Mellon University . [1] Fue adquirido por Google en septiembre de 2009.
[2]

reCAPTCHA ha digitalizado completamente los archivos de The New York Times y los
libros de Google Books a partir de 2011. [3] El archivo se puede buscar en el
archivo de art�culos del New York Times , donde se han archivado m�s de 13 millones
de art�culos en total. Desde 1851 hasta nuestros d�as. [4] A trav�s de la
colaboraci�n masiva , reCAPTCHA ayud� a digitalizar libros que son demasiado
ilegibles para ser escaneados por computadoras, as� como a traducir libros a
diferentes idiomas, a partir de 2015. [5]

Se ha informado que el sistema muestra m�s de 100 millones de CAPTCHA por d�a, [6]
en sitios como Facebook , TicketMaster , Twitter , 4chan , CNN.com , StumbleUpon ,
[7] Craigslist (desde junio de 2008), [8] y EE.UU. Nacional de Telecomunicaciones e
Informaci�n 's convertidor digital de TV cuadro sitio web del programa de cupones
(como parte de la transici�n de EE.UU. DTV ). [9]

El eslogan de reCAPTCHA era "Stop Spam, Read Books". [10] Despu�s de la


introducci�n de una nueva versi�n del complemento reCAPTCHA en 2014, el eslogan
ahora es "F�cil para los seres humanos, Duro en los botes". [11] Tambi�n se
introdujo un nuevo sistema con verificaci�n de im�genes. En este sistema, se les
pide a los usuarios que simplemente hagan clic en una casilla de verificaci�n (el
sistema verificar� si el usuario es humano o no, por ejemplo, con algunas pistas
como cookies ya conocidas o movimientos del mouse dentro del marco de ReCAPTCHA) o,
si falla, seleccione una o m�s im�genes de una selecci�n de un conjunto de
im�genes. [12]En 2018, Google comenz� la prueba beta de un sistema reCAPTCHA
completamente invisible que no presenta ninguna verificaci�n humana visualmente. En
su lugar, el nuevo sistema supervisa activamente las acciones del usuario en toda
la propiedad y devuelve una puntuaci�n que representa la probabilidad si es un
humano o un bot. [13]

Contenido
1 Origen
2 Operaci�n
2.1 No CAPTCHA reCAPTCHA
3 Implementaci�n
4 criticas
5 seguridad
6 proyectos derivados
7 solucionadores automatizados
8 referencias
9 Lectura adicional
10 enlaces externos
Origen
Distributed Proofreaders fue el primer proyecto que ofreci� voluntariamente su
tiempo para descifrar el texto escaneado que OCR no pudo leer. Trabaja con el
Proyecto Gutenberg para digitalizar material de dominio p�blico y utiliza m�todos
muy diferentes de reCAPTCHA.

El programa reCAPTCHA se origin� con el cient�fico inform�tico guatemalteco Luis


von Ahn , [14] y fue ayudado por una beca MacArthur . Como uno de los primeros
desarrolladores de CAPTCHA, se dio cuenta de que "hab�a creado, sin saberlo, un
sistema que estaba desperdiciando, en incrementos de diez segundos, millones de
horas de un recurso muy valioso: los ciclos del cerebro humano". [15] [16]

Operaci�n

Un ejemplo de c�mo se vio un desaf�o reCAPTCHA en 2007, [17] que contiene las
palabras "siguiente hallazgo". La ondulaci�n y el golpe horizontal se agregaron
para aumentar la dificultad de romper el CAPTCHA con un programa de computadora.
El texto escaneado se somete a an�lisis mediante dos reconocimiento �ptico de
caracteres diferentesprogramas Sus salidas respectivas se alinean entre s� mediante
algoritmos est�ndar de concordancia de cadenas y se comparan entre s� y con un
diccionario de ingl�s. Cualquier palabra que se descifre de manera diferente por
ambos programas de OCR o que no est� en el diccionario de ingl�s se marca como
"sospechosa" y se convierte en un CAPTCHA. La palabra sospechosa se muestra, fuera
de contexto, a veces junto con una palabra de control ya conocida. Si el humano
escribe la palabra de control correctamente, entonces la respuesta a la palabra
cuestionable se acepta como probablemente v�lida. Si suficientes usuarios
escribieran correctamente la palabra de control, pero escribieran incorrectamente
la segunda palabra que OCR no hab�a reconocido, entonces la versi�n digital de los
documentos podr�a terminar conteniendo la palabra incorrecta. La identificaci�n
realizada por cada programa OCR recibe un valor de 0.5 puntos, y cada
interpretaci�n por un humano tiene un punto completo. Una vez que una
identificaci�n dada llega a 2.5 puntos, la palabra se considera v�lida. Esas
palabras a las que los jueces humanos otorgan sistem�ticamente una sola identidad
se reciclan posteriormente como palabras de control.[18] Si las tres primeras
suposiciones coinciden entre s� pero no coinciden con ninguna de las OCR, se
consideran una respuesta correcta y la palabra se convierte en una palabra de
control. [19] Cuando seis usuarios rechazan una palabra antes de elegir la
ortograf�a correcta, la palabra se descarta como ilegible. [19]

El m�todo reCAPTCHA original fue dise�ado para mostrar las palabras cuestionables
por separado, como correcci�n fuera de contexto, en lugar de en uso, como dentro de
una frase de cinco palabras del documento original. [20] Adem�s, la palabra de
control podr�a confundir el contexto de la segunda palabra, como una solicitud para
que "/ metal / / fife /" se ingrese como "archivo de metal" debido a que la
conexi�n l�gica de archivo con una herramienta de metal se considera m�s Com�n que
el instrumento musical " fife ". [ cita requerida ]

En 2012, reCAPTCHA comenz� a usar fotograf�as de los n�meros de las casas tomadas
del proyecto Street View de Google , adem�s de las palabras escaneadas. [21]

Identificaci�n de la imagen captcha


En 2014, reCAPTCHA implement� otro sistema en el que los usuarios deben seleccionar
una o m�s im�genes de una selecci�n de nueve im�genes. [12]

En 2017, reCAPTCHA se mejor� para no requerir interacci�n para la mayor�a de los


usuarios. [22]

No CAPTCHA reCAPTCHA

El noCAPTCHA reCAPTCHA
En 2014, reCAPTCHA comenz� a implementar un an�lisis de comportamiento de las
interacciones del navegador con el CAPTCHA para predecir si el usuario era un
humano o un bot antes de mostrar el captcha, y presentaba un captcha
"considerablemente m�s dif�cil" en los casos en que ten�a razones para pensar que
el usuario podr�a ser un bot. A finales de 2014, este mecanismo comenz� a
implementarse en la mayor�a de los servicios p�blicos de Google. [23] Debido a que
NoCAPTCHA se basa en el uso de cookies de Google que tienen al menos unas semanas
de antig�edad, reCAPTCHA se ha vuelto casi imposible de completar para las personas
que borran sus cookies con frecuencia. [ cita requerida ]

En 2017, Google mejor� este mecanismo, llam�ndolo "reCAPTCHA invisible". De acuerdo


con Shuman Ghosemajumder , el ex jugador de Google, "haga clic en el fraude del
fraude" , esta capacidad "crea un nuevo tipo de desaf�o que los bots muy avanzados
todav�a pueden sortear, pero introducen mucha menos fricci�n al ser humano
leg�timo". [24]

Implementaci�n
Las pruebas reCAPTCHA se muestran desde el sitio central del proyecto reCAPTCHA,
que proporciona las palabras para ser descifrado. Esto se hace a trav�s de una API
de JavaScript con el servidor haciendo una devoluci�n de llamada a reCAPTCHA
despu�s de que se haya enviado la solicitud. El proyecto reCAPTCHA proporciona
bibliotecas para varios lenguajes de programaci�n y aplicaciones para facilitar
este proceso. reCAPTCHA es un servicio gratuito que se proporciona a los sitios web
para asistencia con el desciframiento, [25] pero el software reCAPTCHA no es de
c�digo abierto . [26]

Adem�s, reCAPTCHA ofrece complementos para varias plataformas de aplicaciones web,


incluidas ASP.NET , Ruby y PHP , para facilitar la implementaci�n del servicio.
[27]

La cr�tica
Algunos han criticado a Google por usar reCAPTCHA como fuente de trabajo no
remunerado. [28] Dicen que Google est� utilizando injustamente a personas de todo
el mundo para ayudarlo a transcribir libros, direcciones y peri�dicos, y etiquetar
los datos de imagen para su esfuerzo de auto sin conductor sin ninguna
compensaci�n. [29] En respuesta a esta cr�tica, los competidores han surgido
prometedoras propuestas de valor �nicas como compensar al host del sitio web o al
usuario final por el trabajo que realizan. [30]

El uso de reCAPTCHA ha sido calificado como "una seria barrera para el uso de
internet" para personas con problemas de visi�n o discapacidades, como dislexia,
por la periodista de la BBC Stephanie Hegarty. [31]

reCAPTCHA tambi�n es una barrera para el uso de Internet en �reas del mundo donde
existe una gran censura de Internet y los sitios habilitantes subyacentes est�n
bloqueados.

El ingeniero de software Andrew Munsell, en su art�culo "Los captchas se est�n


volviendo rid�culos", afirma que "hace un par de a�os, no recuerdo haber estado
realmente desconcertado por un captcha. De hecho, reCAPTCHA fue uno de los mejores
sistemas que hab�a visto. No fue dif�cil de resolver, y pareci� funcionar cuando lo
us� en mis propios sitios web ". [32] Munsell contin�a con su estado despu�s de
encontrar una serie de im�genes ininteligibles que, a pesar de la actualizaci�n
"Una y otra y otra vez. Los captchas no solo eran dif�ciles de leer para una
computadora, sino que eran imposibles para un humano". Munsell luego proporcion�
numerosos ejemplos.

Seguridad

Un ejemplo de c�mo se presentaron los desaf�os de reCAPTCHA en 2010, [33] que


contiene las palabras "y cinceles"
El prop�sito principal de un sistema CAPTCHA es evitar el acceso automatizado a un
sistema mediante programas inform�ticos o "bots". El 14 de diciembre de 2009,
Jonathan Wilkins public� un documento que describe las debilidades en reCAPTCHA que
permitieron una tasa de resoluci�n del 18%. [34] [35] [36]

El 1 de agosto de 2010, Chad Houck dio una presentaci�n a la Conferencia de pirateo


de DEF CON 18 que detalla un m�todo para revertir la distorsi�n agregada a las
im�genes que permiti� que un programa de computadora determinara una respuesta
v�lida el 10% del tiempo. [37] [38] El sistema reCAPTCHA se modific� el 21 de julio
de 2010, antes de que Houck hablara sobre su m�todo. Houck modific� su m�todo a lo
que describi� como un CAPTCHA "m�s f�cil" para determinar una respuesta v�lida el
31.8% del tiempo. Houck tambi�n mencion� las defensas de seguridad en el sistema,
incluido un bloqueo de alta seguridad si se da una respuesta inv�lida 32 veces
seguidas. [39]

El 26 de mayo de 2012, Adam, CP y Jeffball de DC949 realizaron una presentaci�n en


la conferencia de piratas inform�ticos LayerOne en la que se detalla c�mo pudieron
lograr una soluci�n automatizada con una tasa de precisi�n del 99,1%. [40]Su
t�ctica fue utilizar t�cnicas de aprendizaje autom�tico, un subcampo de
inteligencia artificial, para analizar la versi�n de audio de reCAPTCHA que est�
disponible para personas con discapacidades visuales. Google lanz� una nueva
versi�n de reCAPTCHA solo unas horas antes de su conversaci�n, realizando cambios
importantes en las versiones de audio y visual de su servicio. En esta versi�n, la
versi�n de audio aument� de 8 segundos a 30 segundos, y es mucho m�s dif�cil de
entender, tanto para humanos como para robots. En respuesta a esta actualizaci�n y
la siguiente, los miembros de DC949 lanzaron dos versiones m�s de Stiltwalker que
superaron a reCAPTCHA con una precisi�n de 60,95% y 59,4%, respectivamente. Despu�s
de cada pausa sucesiva, Google actualiz� reCAPTCHA en unos pocos d�as. De acuerdo
con DC949, a menudo volv�an a las caracter�sticas que hab�an sido hackeadas
previamente.

El 27 de junio de 2012, Claudia Cruz, Fernando Uceda y Leobardo Reyes (un grupo de
estudiantes de M�xico) publicaron un art�culo que muestra un sistema que funciona
con im�genes de reCAPTCHA con una precisi�n del 82%. [41] Los autores no han dicho
si su sistema puede resolver im�genes reCAPTCHA recientes, aunque afirman que su
trabajo es OCR inteligente y robusto para algunos, si no todos, los cambios en la
base de datos de im�genes.

En una presentaci�n de agosto de 2012 realizada en BsidesLV 2012, DC949 llam� a la


�ltima versi�n "insosteniblemente imposible para los humanos", ya que tampoco
pudieron resolverlos manualmente. [40] La organizaci�n de accesibilidad web WebAIM
inform� en mayo de 2012, "M�s del 90% de los encuestados [usuarios de lectores de
pantalla] consideran que el CAPTCHA es muy o algo dif�cil". [42]

reCAPTCHA modifica con frecuencia su sistema, requiriendo que los spammers


actualicen con frecuencia sus m�todos de decodificaci�n, lo que puede frustrar a
los posibles abusadores. [ cita requerida ]

Solo las palabras que ambos programas de OCR no reconocieron se usan como palabras
de control. Por lo tanto, cualquier programa que pueda reconocer estas palabras con
una probabilidad no insignificante representar�a una mejora sobre los programas de
OCR de vanguardia. [19]

Proyectos derivados
reCAPTCHA tambi�n cre� el proyecto Mailhide, que protege las direcciones de correo
electr�nico de las p�ginas web para que no sean recolectadas por los spammers .
[43] De forma predeterminada, la direcci�n de correo electr�nico se convirti� a un
formato que no permit�a que un rastreador viera la direcci�n de correo electr�nico
completa; por ejemplo, "mailme@example.com" se habr�a convertido a "mai ... @
example.com". Luego, el visitante har�a clic en "..." y resolver�a el CAPTCHA para
obtener la direcci�n de correo electr�nico completa. Tambi�n se puede editar el
c�digo emergente para que ninguna de las direcciones sea visible. Mailhide se
suspendi� en 2018 porque depend�a de reCAPTCHA V1. [44]

También podría gustarte