Está en la página 1de 18

¿Serías capaz de identificar una IA?

____________________________________________________________________________________________

José Luis Casado Gil


Héctor Serrano Plá
Juan Antonio Tortosa Lasheras

2º Bachillerato Ciencias

Prof. Francisco Rodríguez Gonzálvez


Virginia Verdú Tortosa
ÍNDICE

- RESUMEN………………………………………….……………………………………………..…………2
- ABSTRACT………………………………………………………………………….………………………2

1. INTRODUCCIÓN. ¿COMO SE HIZO?…………………………...………………………………………...3

2. ANTECEDENTES…………………………………………………………….………………………..……3

2.1. ¿Quién fue Turing? ………………………….…………………………………………………………..3


2.1.1. Juventud y primeros trabajos…………………………………………….……...……………………..3
2.1.2. Temprana fama y desarrollo de la máquina……………………………………….…...………………3
2.1.3. Segunda guerra mundial………………………………...……………………………………….…….3
2.1.4. Posguerra y muerte……………………………...…………………………………………….……….4
2.2. ¿Qué es una inteligencia artificial? …………………………………….………………………………..4
2.2.1. ¿Qué es un chat bot? ……………………………………………………….………………………….4
2.3. ¿Qué es el test de Turing? ………………….……………………………………………………………5
2.4. Evolución del test de Turing………………………….………………………………………………….5
2.4.1. Congreso de Dartmouth……………………….…………………...…………………………………..5
2.4.2. ELIZA……………………..…………………..……………….………………………………………5
2.4.3 PARRY……………………………...………..………………………………..………………………..5
2.4.4. Habitación china………………………………………………………………………….……………6
2.4.5. Jabberwacky………………………………...………….………………………...…………………….6
2.4.6. Premio Loebner.……………………………...…….………..…………………………………………6
2.4.7. ALICE…………………………………...…….……………..……………………...…………………6
2.4.8.Eugene……………………………………………………….………………………………………….7
2.4.9. Test de Turing en la actualidad…………………………………...……………………………………7

OBJETIVOS………………………………………….………………………………………………………7

3. MATERIALES Y MÉTODOS…………………………………………………………………….…………7

4. RESULTADOS……………………………………………………………….………………………………9

5.1. Conversaciones con inteligencia artificial…………………………….…………………………………9


5.2. Conversaciones con persona…………………………………………………………………………...10
5.3. Apuntes realizados por personas o por chat GPT………………….…………………………………...12

5. CONCLUSIONES……………………………………………….………………………………………….13

6.1. Conclusiones conversaciones con inteligencia artificial………………………………….……………13


6.2. Conclusiones conversaciones con persona…………………….……………………………………….14
6.3. Conclusiones conjuntas sobre ambas encuestas……………………………………………….……….14
6.4. Conclusiones apuntes realizados por personas o chat gpt………………………………….…………..14

6. AGRADECIMIENTOS………………..……………………………………………………………………14

7. REFERENCIAS…………………….………………………………………………………………………15

1
RESUMEN
Una cuestión que ha cobrado mucha fuerza durante los últimos años y que mucha gente teme que se haga
realidad es si la inteligencia artificial está realmente tan cerca como se piensa de poder llegar a ser confundida con
una persona o llegar a imitarla. Inspirado en el conocido test que Alan Turing desarrolló en 1950, en este trabajo se
ha decidido investigar hasta qué punto una persona puede distinguir una IA de un ser humano.

Para llevar a cabo este estudio se ha dividido el trabajo en dos partes. La primera, basándose en el test
original, se ha pedido a grupos de experimentación que interactúen digitalmente tanto con inteligencias humanas
como artificiales en orden de juzgar en un cuestionario posterior si se trataba de una obra humana o de una
máquina. En la segunda parte, a fin de evaluar el grado de desarrollo de la expresión escrita de esta tecnología, un
grupo de profesores ha debido determinar qué fragmentos escritos procedían de alumnos reales o de inteligencias
artificiales.

ABSTRACT

One question that has gained a lot of momentum in recent years and that many people are afraid of
becoming a reality is whether artificial intelligence is really as close as it is thought to being able to be mistaken for
or mimic a person. Inspired by the well-known test that Alan Turing developed in 1950, this work has decided to
investigate to what extent a person can distinguish an AI from a human being.

To carry out this study, the work has been divided into two parts. The first, based on the original test,
experimental groups were asked to interact digitally with both human and artificial intelligences in order to judge in
a subsequent questionnaire whether it was a human or a machine. In the second part, in order to evaluate the degree
of development of the written expression of this technology, a group of teachers had to determine which written
fragments came from real students or from artificial intelligences.

2
1. INTRODUCCIÓN. ¿CÓMO SE HIZO?
El matemático Alan Turing desarrolló en el año 1950 el test de Turing, con la intención de descubrir la
inteligencia que podían presentar las máquinas del momento. Se ha investigado sobre su origen y evolución a lo
largo del tiempo.

Este trabajo surge de la adaptación del test de Turing a las inteligencias artificiales, comprobar si las
personas comunes pueden distinguir una inteligencia artificial de un ser humano. Para realizar el proyecto se ha
dividido en dos partes. En la primera, se ha escogido a varios alumnos del centro IES Saavedra Fajardo para que
tuvieran una conversación aleatoria con una AI o con una persona. En la segunda parte, se ha hecho un formulario
con parejas de textos de apuntes de la asignatura de Historia de España en 2º de Bachillerato que trataban del
mismo tema.
Uno de los textos estaba redactado por los alumnos integrantes del trabajo, y el otro por una AI. Un grupo de
profesores del centro debían decidir mediante un cuestionario qué texto había sido redactado por humanos o por
máquinas.

Los resultados han sido obtenidos gracias a encuestas respondidas por los alumnos que han participado en
el experimento.
Los resultados de las encuestas muestran las opiniones de los alumnos sobre la conversación y lo más importante,
con qué o quién pensaban que había tenido lugar la conversación.

2. ANTECEDENTES

2.1. ¿Quién fue Turing?

2.1.1. Juventud y primeros trabajos


Alan Mathison Turing fue un matemático inglés nacido el 23 de junio de 1912 dentro de una familia de
clase media en Paddington (Londres). Aunque desde temprana edad manifestó un interés y comprensión fuera de lo
normal por la ciencia, no llegó a sobresalir, debido a sus pobres habilidades interpersonales y a una formación
dirigida hacia el estudio de los clásicos. Conoció a Cristopher Morcom, su mejor amigo y de quien se enamoró en
secreto. Su muerte afectó gravemente a Alan, que con muchos dilemas metafísicos se volvió ateo y se volcó en la
ciencia. Asistió al “King's College”de Cambridge, donde desarrolló exitosamente muchas de sus teorías y conoció
otras nuevas. Su reconocimiento en la institución creció, terminando por graduarse en 1934 .Obtuvo el premio
Smith en 1936 por su contribución en la teoría de la probabilidad (Botta, 2016).

2.1.2. Temprana fama y desarrollo de la máquina


Alan Turing, inspirado por una conferencia de Max Newman en Cambridge, le llevó a introducirse en la
lógica matemática. El interés en ese campo pudo proseguir en el King's College tras conseguir una beca de
investigación por su trabajo en probabilidad. De esta forma Turing abordó el llamado Entscheidungsproblem o
problema de decisión propuesto por David Hilbert y que resolvió en su artículo “On computable numbers with an
application to the Entscheidungsproblem” publicado a finales de 1936, lo que le trajo fama y reconocimiento en el
campo de la lógica. Este trabajo allanó el camino hacia lo hoy conocido como ciencias de la computación y
ciencias cognitivas. Durante esta época Alan Turing ideó sus llamadas máquinas. Cada una representa un algoritmo
capaz de leer instrucciones producidas por cualquier otra máquina (esto es el origen de los problemas modernos de
lectura de memoria) lo que supone un gran avance para la época (Hodges, 2002).

2.1.3. Segunda Guerra Mundial


Según Botta (2016), tras el comienzo de la Segunda Guerra Mundial, Alan Turing se une al Departamento
Británico de Criptología de manera secreta. Hasta el momento de su unión no se había hecho ningún avance en la
desencriptación de los mensajes procedentes de la versión mejorada de la máquina Enigma alemana ,que poseía
alrededor de 150 trillones de formas de configurarla. La labor de Alan Turing fue la de mejorar “La Bomba”, una
máquina creada por un grupo de matemáticos polacos que hasta 1939 habían sido capaces de desencriptar algunos
mensajes captados por radio, la transmisión del tiempo y la expresión “Heil Hitler”, aunque la mejora de los
alemanes de Enigma detuvo el progreso. La nueva Bomba mejorada podía determinar la configuración de la
máquina Enigma y por lo tanto las posibilidades de encriptación de cada palabra.

3
El trabajo de Alan Turing posibilitó el entendimiento del funcionamiento de la máquina Enigma ante las
mejoras a esta por los alemanes en el frente continental con máquinas de cinco rotores, que se ampliaron a ocho en
1941 en el frente Atlántico. El sistema de desencriptación diseñado fue denominado “Ultra” por los británicos.
Se estima que llegó a acortar la guerra dos años y salvó alrededor de 14 millones de vidas. Su uso fue crucial en el
Atlántico, poniendo fin a casi en su totalidad con el bloqueo submarino de Gran Bretaña, lo que permitió la llegada
de suministros estadounidenses. Y su papel fue determinante en el éxito del desembarco de Normandía en 1944, el
principio del final de la guerra para los aliados. A pesar de su relevancia el trabajo de Alan Turing y su equipo no se
hizo público por razones de seguridad nacional.

2.1.4. Posguerra y muerte


La construcción de la "máquina universal" de Turing, es decir, de un ordenador electrónico, tropezó con
diferentes obstáculos, a pesar de que los elementos para hacerlo posible existían ya durante la SGM. Aunque en
1946 comenzó la construcción de la llamada “máquina universal”en el Laboratorio Nacional de Física (NPL), el
proyecto se estancó debido a la poca idea de el NPL sobre cómo construirla.

En 1947 es convencido por el matemático Max Newman de dejar el NPL y aceptar un puesto en
Manchester. Consiguió financiación de la Royal Society para proseguir con la construcción, lo que llevó a una
pequeña versión de su “máquina universal” en 1948. Poco después aceptó el cargo de director adjunto del
Laboratorio de Informática de la Universidad. Sin embargo, en 1948 con la popularización de la Ingeniería en la
universidad sus proyectos dejaron de recibir apoyo.

Sus teorías sobre la inteligencia artificial o “maquinaria inteligente” como él la llamó fueron desarrolladas
en varios artículos publicados entre 1947 y 1950. En este último año, donde pública el artículo “Computing
Machinery and Intelligence” en la revista Mind, plantea el llamado “Test de Turing” aunque si bien no continuó
mucho con estas ideas. En 1951 entró como miembro en la Royal Society y ese mismo año después de presentar un
artículo sobre la biología matemática fue arrestado por ser homosexual por una aventura amorosa y condenado a ser
castrado químicamente en 1952. Por su condición, no pudo seguir con su trabajo secreto y tuvo otro altercado con
la policía. En 1954 se suicidó envenenándose con cianuro en una manzana dentro de su casa de Wilmslow,
Cheshire.(Hodges, 2002).

2.2. ¿Qué es una inteligencia artificial?


La inteligencia artificial es un campo de la informática cuyas bases matemáticas ya empezaron a
desarrollarse en la década del 1940 cuando los matemáticos Norbert Wiener y John von Neumann empezaron a
crear los primeros algoritmos informáticos que la harían funcionar. Sin embargo, esto no se definiría como
inteligencia artificial hasta 1956 cuando John McCarthy usó este término para hacer referencia a trabajos de
ingeniería que involucran máquinas dirigidas por programas de computación inteligentes.
Por tanto, la inteligencia artificial es denominada así pues consta de algoritmos y modelos matemáticos que
procesan grandes cantidades de datos que, basándose en patrones o reglas aprendidas gracias a su capacidad para
aprender de forma autónoma sin haber sido programada específicamente para hacerlo, las hace capaces de tomar
decisiones. De esta manera la inteligencia artificial puede mejorar su precisión y eficiencia con el tiempo,
acumulando todos estos datos y experiencias se perfecciona cada vez más su comportamiento.

En la actualidad podemos encontrar esta inteligencia artificial en softwares como podría ser un asistente de
voz de un móvil o incluso un motor de búsqueda como Google. También la encontramos integrada como parte
propia de las máquinas, como podría ser en un robot o en un vehículo autónomo.

2.2.1. ¿Qué es un chatbot?


Un chatbot es un software basado en la inteligencia artificial que es capaz de mantener conversaciones
fluidas tanto por voz como por texto. Gracias a que usa algoritmos similares a los de la inteligencia artificial es
capaz de recordar conversaciones o mensajes anteriores pudiendo así seguir una conversación con coherencia.
Sumado a que tienen acceso a servicios de navegación y todo el conocimiento de la red, son capaces de obtener
información y dar respuesta a la mayoría de las preguntas que les hagamos.

4
2.3. ¿Qué es el test de Turing?
Parafraseando al propio Alan Turing, él propone la siguiente pregunta “¿Pueden pensar las máquinas?”
considera que la respuesta a esta pregunta si se comienza por la definición habitual de “máquina” y “pensar”
debería de encontrarse en un simple estudio estadístico parecido a una encuesta Gallup; sin embargo, esto es
considerado absurdo. Se sustituirá la pregunta por otra parecida que nos llevará a una conclusión que expresará la
solución de manera inequívoca.

El nuevo problema se propone como un juego llamado “juego de imitación” en el que participan tres
personas, un hombre (al que se le asigna la letra A), una mujer (con la letra asignada B) y un interrogador (letra C)
que puede ser de ambos sexos. Durante la prueba el interrogador permanece en una sala separada enfrente de los
otros dos, la meta del juego es pues es determinar cuál de los dos es hombre y cuál es mujer. El interrogador
identifica a los interlocutores bajo las letras X e Y y una vez finalice el juego dirá que “X corresponde a A e Y
corresponde a B” o dirá que “X corresponde a B e Y corresponde a A”. El interrogador puede realizar preguntas a
A y B tales como

C:¿Podría decirme X la longitud de su pelo?

Y asumiendo que X es A responderia:

A: Tengo el pelo rizado y los mechones más largos miden unos veinte centímetros

La meta dentro del juego de A es intentar que C falle y el objetivo de B es ayudar al interrogador. Para que
la voz no interfiera en el juego la comunicación debe hacerse por escrito aunque de no disponer de esta posibilidad
se puede tener un intermediario que transmite las preguntas y respuestas entre los dos. La verdadera pregunta en el
juego viene si hacemos que una máquina tome el papel de A, las preguntas que surgen en este dilema son ¿decidirá
peor el interrogador si hay una máquina involucrada que cuando hay un humano?(Turing, 1950)

2.4. Evolución del test

2.4.1. Congreso de Dartmouth


En el verano de 1956 es celebrada la conferencia de Dartmouth en la universidad del mismo nombre en
New Hampshire (EE.UU.), organizada por el profesor Jonh McCarthy y que durará ocho semanas. En él un grupo
de once investigadores en total se reunirán con el objetivo de realizar un estudio sobre las posibilidades de la
recién descubierta para ese momento inteligencia artificial. En la conferencia se acuñó por primera vez el término
inteligencia artificial y llegaron a estimar que en menos de 15 años se podría desarrollar una inteligencia artificial
capaz de pasar el test de Turing, aunque se equivocaron (Wikipedia, 2024).

2.4.2. ELIZA
Eliza, desarrollado por el aleman Joseph Weizenbeaum entre 1964 y 1966 en el laboratorio de inteligencia
artificial del MIT. Es considerado el primer chatterbot de la historia capaz de potencialmente pasar el test de
Turing. Era capaz de simular una conversación aunque sin capacidad de entender verdaderamente el significado de
lo que escribía, pese a esto llegó a convencer a varias personas de que era un ser humano real y que conversaba con
verdadero entendimiento. Funcionaba por un sistema de reconocimiento de patrones en las frases y sustitución de
estos mediante unas directivas dadas por guiones escritos en MAD-Slip. Estos guiones indican cómo interactuar
siguiendo el guión, pero sin entender el contexto verdaderamente. El más famoso de estos guiones fue el llamado
“doctor”, simulaba ser un psicoterapeuta rogeriano que respondía a las preguntas indirectamente. (Sharma, Goyal y
Malik, 2017).

2.4.3. PARRY
Definido por Jiménez y Sánchez:
También en los orígenes, en la década de los setenta, apareció Parry, un conocido chatterbot que permite
mantener una conversación con una relativa coherencia y escrito por el psiquiatra Kenneth Colby en 1972. El
programa implementa un modelo del comportamiento de un esquizofrénico paranoico sobre la base de conceptos,
concepciones y creencias. Incorpora una estrategia conversacional y por lo tanto era más avanzado que Eliza; para

5
algunos era como Eliza pero con actitud. Parry se probó a principios de 1970 utilizando una variación de la prueba
de Turing, en la que un grupo de psiquiatras experimentados analizó una combinación de pacientes reales y equipos
informáticos que ejecutaban Parry a través de teletipos y a otro grupo de 33 psiquiatras les fueron mostradas las
transcripciones de las conversaciones anteriores. A los dos grupos se les pidió que identificaran cuáles de los
pacientes eran humanos y cuáles eran los programas de ordenador y fueron capaces de hacer la identificación
correcta sólo del 48% (Jiménez,Sánchez, 2015, pp 11-12).

2.4.4. Habitación china


Una de las primeras objeciones al test de Turing fue escrita por Jonh Searle en 1983, el argumento parte de
reducir el pensamiento de las máquinas a una simple acción de repetir patrones relacionados con unas instrucciones
dadas por un supervisor en el cual no se comprende realmente el significado de esos símbolos ni contexto. Este
argumento plantea una situación hipotética en la que un filósofo se encuentra encerrado en una habitación. En la
habitación se le entrega un manuscrito escrito en chino, idioma que no comprende, y otros dos manuscritos escritos
en chino pero con unas instrucciones en inglés que le permiten relacionar las expresiones en chino de los
manuscritos entre sí a base de los símbolos pero sin entender su significado. Así el filósofo relacionando símbolos
mediante las indicaciones es capaz de responder preguntas en chino de manera que parezca que tiene conocimiento
del idioma y de los temas de los que se le habla. Las instrucciones vienen a representar una programación que se la
da a una inteligencia artificial (el filósofo) y que le permite formular lo que a primera vista son respuestas lógicas,
pero sin que el entrevistador sepa que realmente no tiene idea de lo que está escribiendo. Es decir, a diferencia de
los humanos las máquinas no realizan algo sin una verdadera intencionalidad detrás (Barón, 2008).

2.4.5. Jabberwacky
Jabberwacky es un proyecto con la intención de desarrollar una inteligencia artificial con la capacidad de
pasar el test de Turing imitando la conversación e interacción humana. Creado originalmente por el programador
británico Rollo Carpenter y siendo creada su primera versión en 1981 en el Sinclair ZX81. En 1988 se funda
formalmente el proyecto con el nombre de “thoughts”. En 1997 aparece formalmente en internet con el nombre de
Jabberwacky. El programa ha ganado el premio Loebner en dos ocasiones, en 2005 y 2006 (Academic Accelerator,
2024).

El sistema funciona de manera diferente a otros software que se habían desarrollado, ya que aprende el
idioma y contexto de las frases a través de la interacción con seres humanos para luego almacenar la información y
utilizarla en un futuro. En otras conversaciones sin seguir ninguna regla fija o principio programado, se puede
decir que es capaz de aprender si se le da suficiente información (Jimenez, Sanchez, 2015).

2.4.6. Premio Loebner


En 1990 se crea la primera competición de inteligencias artificiales basada en el test de Turing, el premio
Loebner celebrado anualmente. Creado por el Centro de Estudios del Comportamiento de Cambridge en
Massachusetts, patrocinado por Hugh Loebner y que a lo largo de los años se ha ido asociando con otras
universidades. En la competición que sigue el modelo establecido por el test, un juez humano se sitúa frente a dos
pantallas planteando preguntas a las dos y recibe respuestas de ambas, debe decidir cuál de las dos es un humano y
cuál es una inteligencia artificial. Al final de la competencia se otorga un premio al programa considerado por los
jueces como el más inteligente. El premio no está libre de controversia y es considerado por algunos expertos,
como Marvin Minsky, más como un truco publicitario que como una ayuda real al desarrollo de la inteligencia
artificial (Jimenez y Sanchez, 2015).

2.4.7. ALICE
ALICE, por sus siglas en inglés Artificial Linguistic Internet Computer Entity, es una inteligencia artificial
de código abierto inspirado en ELIZA que ha llegado a ganar el premio Loebner en tres ocasiones. Alice genera
respuestas a las preguntas de los usuarios mediante un sistema de reconocimiento de patrones mediante una
estructura que consta de dos partes el “modelo de lenguaje” y el “motor del chatbot”. El modelo de lenguaje está
almacenado en archivos AIML (Artificial Linguistic Internet Computer Entity) un modelo de lenguaje sencillo.
Esta estructura permite implementar fácilmente un chatbot en un nuevo modelo de conocimiento. Sin embargo, el
programa no ha sido capaz de pasar el test de Turing hasta el momento (Sharma, Goyal y Malik, 2017).

6
2.4.8 Eugene
Eugene Goostman es un programa de inteligencia artificial desarrollado por Vladimir Veselov, Eugene
Demchenko y Sergey Ulasen. Este programa ganó una competición celebrada en la Real Society en Londres por el
sesenta aniversario del fallecimiento de Alan Turing en 2014. Convenció al 33% de los jueces que era una persona
real convirtiéndose así en el programa con más éxito en un test de Turing y considerado por muchos como el primer
Programa informático en superarlo. El programa se hace pasar por un niño ucraniano de 13 años, cuya segunda
lengua era el inglés, pudiendo así justificar las faltas de ortografía que cometiera además de esperar que no pudiera
responder a todas las preguntas planteadas (Schofield, 2014).

2.4.9 Test de Turing en la actualidad


Una de las aplicaciones más comunes de el test de Turing en la actualidad es el CAPTCHA (Completely
Automated Public Turing Test to Tell Computers and Humans Apart por sus siglas en inglés) es un sistema usado
par evitar el ataque de bots a una web principalmente de tipo Spam. Las primeras ideas sobre un método para
separar humanos de máquinas las menciona Moni Naor en 1996 y un año más tarde, en 1997, se ejecuta el primer
CAPTCHA en el motor del servidor web Alta Vista. En el año 2000 Nicholas J. Hopper, Manuel Blum y John, Luis
von Ahn Langford acuñaron formalmente el término CAPTCHA. En la actualidad existen varios tipos de
CAPTCHA siendo los principales los basados en texto , en imágenes, en video, en sonido y puzzles CAPTCHA
(Kaur y Behal, 2014).

3. OBJETIVOS
El trabajo se propone estudiar la vida y obra de Alan Turing, matemático inglés que hizo numerosas
contribuciones al avance tecnológico durante el siglo pasado.

En cuanto a la parte práctica, el propósito de este trabajo es, basado en los estudios realizados por Alan
Turing durante el siglo pasado, comprobar si las personas son capaces de identificar qué están hablando con una
persona o con una inteligencia artificial. Nuestro objetivo es saber si las personas son capaces de distinguir entre
humano y tecnología y saber si la inteligencia artificial está tan avanzada que puede pasar desapercibida en una
conversación vía online.

Otra meta que se propone este trabajo es descubrir si los profesores son capaces de distinguir entre textos
escritos por los alumnos o generados, en el caso de este trabajo, por la inteligencia artificial “Chat GPT”. Este
objetivo viene dado ante la gran fama que ha cogido este programa en los últimos años debido a que hay un gran
número de alumnos que han hecho uso de esta herramienta. La finalidad que se quiere obtener en este proyecto es
llegar a saber si los docentes son capaces de detectar que un texto no ha sido realizado por un alumno.

Además, si las personas son capaces de distinguirlo, nuestro objetivo es sacar conclusiones de qué rasgos
hacen que las nuevas tecnologías puedan, o no, hacerse pasar con éxito por una persona.

4. MATERIALES Y MÉTODOS
Para poder aplicar el test de Turing en esta investigación, se tomó gran inspiración de la idea original de
Turing y se utilizó una metodología documental, en la parte histórica del trabajo, y para la práctica se hizo uso de
metodología de encuestas, comparativa y de análisis estadístico. Para empezar la experimentación se buscó con una
búsqueda de una web o aplicación que nos permitiera usar inteligencias artificiales que fueran capaces de tener
conversaciones de tipo informal y que pudieran asemejarse lo más posible a un ser humano. Tras considerar y
probar algunas de ellas, se decidió utilizar la página web character.ai, una página en la que sus usuarios pueden
crear inteligencias artificiales a su gusto y crear una personalidad en ellas. En esta web se pueden encontrar
personajes famosos como Super Mario o Elon Musk, hasta inteligencias artificiales como la que se ha usado para
realizar este proyecto que se trata de una persona normal y corriente.

Una vez encontrada la página web, se pidió la colaboración de alumnos del instituto, en concreto de
primero y segundo de bachillerato para realizar las conversaciones. Las conversaciones eran supervisadas por los
integrantes del grupo y tenían una duración de cinco minutos. Para ellas, se les pidió una serie de condiciones a los
voluntarios en hacer la prueba que eran las siguientes: escribir de la forma más gramaticalmente correcta posible,
iniciar la conversación y sacar un tema del que tratar durante la duración del experimento. Con el fin de obtener
mejores resultados, tras haber llevado a cabo algunas conversaciones utilizando solo la inteligencia artificial, se
7
decidió intercalar conversaciones con una persona, la cuál respetaría los signos de puntuación y no cometería faltas
en su ortografía. Para hacer posible que los alumnos hablasen con la inteligencia artificial, lo que se hizo fue copiar
los mensajes que se recibían en el programa y luego copiar y pegar las respuestas generadas por el programa en el
chat de texto dónde estaba teniendo lugar las conversación.

Como medio para llevar a cabo la conversación se ha utilizado la aplicación discord, un programa de
comunicación gratuito que permite establecer chat de texto, voz o vídeo desde cualquier dispositivo tecnológico. Se
realizaron un total de veinte conversaciones. En diez de ellas los alumnos del centro hablaron con una inteligencia
artificial y en las otras diez se mantuvieron diálogos con uno de los integrantes del grupo, que intentaría respetar
todas las normas del lenguaje durante la conversación. Los alumnos eran el usuario llamado “Entrevistado 1” y la
persona con la que conversaba ya fuese inteligencia artificial o un integrante del grupo recibía el nombre de
“Conversante 1”. Además, al almacenar todas las conversaciones en un mismo grupo ha facilitado la tarea para
agrupar las pruebas realizadas a distintos alumnos del centro.

Una vez realizadas las conversaciones, se ha utilizado una de las herramientas que Google nos proporciona,
un formulario de respuestas cerradas con opción múltiple en el cual se les planteaba las siguientes preguntas:

En la primera tanda de cuestiones (las que a continuación están listadas) tenían tres posibles respuestas en las que
debían de marcar una de las siguientes: sí, más o menos y no. Las preguntas a responder eran las siguientes:

- ¿Consideras que este individuo sabe desenvolverse correctamente en una conversación?


- ¿Habéis conseguido hablar fluidamente sobre todos los temas de conversación?
- ¿Consideras que el individuo usa un lenguaje adecuado al tipo de conversación que habéis tenido?
- ¿Consideras que sabe expresar correctamente su punto de vista, opiniones, etc?

Luego se les proponía un par de preguntas de respuesta abierta en la que debían de responder a:

- ¿Cuál crees que es el perfil de la persona con la que estás hablando? (Descríbelo)
- ¿Qué sensaciones te ha transmitido?

Para finalizar con la encuesta se les hacía la siguiente cuestión, poniendo como opciones persona o IA:

- ¿Consideras que el individuo con el que has hablado durante la conversación es una persona o una
inteligencia artificial?

El uso de los formularios de Google ha permitido crear gráficas para agrupar las respuestas y los números
de personas que han seleccionado cada una de ellas, haciendo más fácil la visualización de los resultados obtenidos.

Para llevar a cabo la segunda parte del trabajo se ha hecho una encuesta en la que aparecen textos sacados
de nuestros apuntes de historia y textos redactados por la inteligencia artificial de chat GPT sobre los mismos
contenidos. Estos textos se han agrupado por parejas que hablan del mismo tema, pero siendo el primero de cada
pareja hecho por la inteligencia artificial y el segundo por una persona, en total, con 3 parejas. Una vez
seleccionados los textos, se ha enviado la encuesta a los docentes del centro quienes han elegido entre inteligencia
artificial o humano sumando un total de 11 respuestas. Siendo los errores cuando no saben diferenciar entre
humano e inteligencia artificial.

Además de Google Forms, nos hemos servido de otras de las aplicaciones de Google para poder tener una
organización eficaz.

8
5.RESULTADOS
Durante la experimentación se han obtenido los siguientes resultados.

5.1. Conversaciones con inteligencia artificial


● La encuesta dió lugar a los siguientes resultados:
1) Para la primera tanda de preguntas.

Sí No Más o menos Moda


¿Consideras que este
individuo sabe
desenvolverse…. 70% 0% 30% Si
¿Habéis conseguido
hablar fluidamente…. 70% 10% 20% Si
¿Consideras que el
individuo usa un
lenguaje adecuado…. 90% 0% 10% Si
¿Consideras que sabe
expresar
correctamente... 50% 0% 50% Si

En la siguiente gráfica se muestran los resultados de la encuesta 1, donde el eje X son las preguntas
realizadas a los estudiantes y el eje Y representa el número de personas que han votado esa opción:

Imagen 1. Gráfica de datos obtenidos en el formulario 1

Respecto a la primera tanda de preguntas se aprecia que un total de 10 encuestados, siete personas
reconocen que el programa se sabe desenvolver con éxito en la conversación. Hay tres personas que dudan de las
capacidades de este pero aún así admiten que llega a saber expresarse medianamente bien. En cuanto a la fluidez de
la conversación han sido de nuevo siete personas la que están satisfechas con la interacción que han tenido, sin
embargo aquí ya se encuentra una de ellas que afirma que el programa no es capaz de mantener un diálogo de
forma correcta y hay dos personas que se encuentran en un punto medio entre ambos puntos de vista. Refiriéndose
al lenguaje utilizado por esta tecnología, hay casi un pleno de respuestas favorables antes esta cuestión, sólo hay
una persona que no encuentra el lenguaje de la inteligencia artificial del todo adecuado. Cuando se pregunta por la
capacidad de este para desarrollar y explicar su punto de vista hay una igualdad en las opiniones entre los que
afirman que sí puede y los que se mantienen dubitativos. La respuesta más común en todos los casos ha sido el si.

Anexo: Imagen 2. Captura de pantalla conversación 8 IA y alumno


Anexo: Imagen 3. Captura de pantalla conversación 18 IA y alumno

9
2) Para la segunda tanda de preguntas:

Cuando se les ha preguntado sobre cuál creen que es el perfil de la persona con la que están hablando, un
60% de la gente le atribuye los adjetivos de culto e interesante. Un 30% suelen describirlo físicamente como alto y
de pelo moreno ya que estos atributos han sido mencionados en el diálogo. Un 20% de las personas ya muestran sus
sospechas de que sea una IA.

Sobre las sensaciones transmitidas hay una división más clara de pareceres. El 50% de los encuestados
expresan que bajo su punto de vista es alguien atrevido, da buenas sensaciones, interesado. Sin embargo,un 30%
expresa que se ha llegado a sentir interrogado o ha expresado incomodidad. El 20% de los participantes han
expresado en este punto de la encuesta haberse dado cuenta de que habían estado tratando con una inteligencia
artificial y un 10% ha reconocido que, deduciendo que habían tratado con una inteligencia artificial, esta se expresa
coherentemente.

Anexo: Imagen 4. Respuestas obtenidas en “¿Cuál crees que es el perfil de la persona con la que has hablado?” 1
Anexo: Imagen 5. Respuestas obtenidas en“Qué sensaciones te ha transmitido?”

3) Última pregunta:

Imagen 6. Gráfica “Persona e Inteligencia artificial” 1

Los resultados obtenidos a la hora de preguntar con quién se creía que estaban hablando han reflejado una
superioridad de un 80% de las respuestas afirmando que era una inteligencia artificial ante un 20% de los votos que
afirmaban haber hablado con un ser humano. Esta vasta diferencia se estaba empezando a hacer notable en las dos
preguntas anteriores que ya mostraban un grado de sospecha bastante alto.

5.2. Conversaciones con persona


● La encuesta dio lugar a los siguientes resultados:

1) Primeras cuestiones planteadas.

Sí No Más o menos Moda


¿Consideras que este
individuo sabe
desenvolverse…. 80% 0% 20% Si

¿Habéis conseguido
hablar fluidamente …. 70% 10% 20% Si

¿Consideras que el
individuo usa un lenguaje
adecuado…. 80% 0% 20% Si
¿Consideras que sabe
expresar
correctamente…. 80% 10% 10% Si

10
En la siguiente gráfica se muestran los resultados de la encuesta 2, donde el eje X son las preguntas
realizadas a los estudiantes y el eje Y representa el número de personas que han votado esa opción:

Imagen 7. Gráfica de datos obtenidos en formulario 2

Cuando los 10 participantes han sido preguntados sobre cómo se desenvuelve el individuo, ocho afirman
que de forma correcta y tan sólo dos de ellos expresan que no del todo. Hablando sobre la fluidez nos encontramos
opiniones más divididas, es cierto que hay una gran mayoría de 7 individuos consideran que ha existido una fluidez
al hablar, pero, encontramos a dos personas han marcado la respuesta más o menos y una persona que niega que
haya habido fluidez. En cuanto al lenguaje, hay un 80% de personas que afirma que ha sido el adecuado frente a un
20% que dicen que no lo ha sido del todo. Lo mismo pasa con la expresión de los argumentos, ocho personas están
de acuerdo con la pregunta mientras que una no del todo y otra se opone a ella.La respuesta mayoritaria a todas las
preguntas sigue siendo el si.

Imagen 8. Captura de pantalla conversación 21 Imagen 9. Captura de pantalla conversación 14


persona y alumno persona y alumno

2) Segundas cuestiones planteadas.

Sobre qué características le dan al individuo con el que han hablado, se suele describir como alguien
interesante y agradable. Aunque resalta una mayoría de respuestas en las que lo relacionan con una persona de
mediana edad, seria y educada. Al ser preguntadas por las sensaciones que se les han transmitido durante el tiempo
que duraba la prueba, destacan de nuevo los comentarios que expresan haber conversado con una persona serena,
educada y de una edad mayor que la de los participantes. Hay un par que dicen que por la forma de expresarse, el
uso de signos de interrogación y la buena acentuación, parece un ordenador.

Anexo: Imagen 10. Respuestas obtenidas en “¿Cuál crees que es el perfil de la persona con la que has hablado?” 2
Anexo: Imagen 11. Respuestas obtenidas en “Qué sensaciones te ha transmitido?” 2

11
3) Última pregunta.

Imagen 12. Gráfica “Persona e Inteligencia artificial” 2

Al plantear la pregunta que da fin a la encuesta nos encontramos estos resultados. No hay tanta diferencia
como en la de la otra encuesta, a pesar de eso, encontramos que los encuestados han pensado en cantidades iguales
que el individuo podía ser una persona o una inteligencia artificial. La razón por la que los encuestados justifican el
por qué de votar inteligencia artificial se basa en la buena ortografía que ha presentado la otra persona a la hora de
mandar los mensajes.

5.3. Apuntes realizados por personas o chat GPT

Imagen 13. Captura de pantalla formulario textos. Imagen 14. Captura de pantalla petición a Chat GPT

12
Tras enviar la encuesta se han obtenido los siguientes resultados con 11 personas que han contestado:

Imagen 15. Captura de pantalla de gráfico de respuestas


de la encuesta de textos.

Tras el recuento de resultados, se ha hecho otra gráfica para medir la cantidad de errores y aciertos
obtenidos en cada texto.

Imagen 16. Captura de pantalla de gráfico de errores


y aciertos en cada texto.

Tras analizar los resultados se encontró que la mayoría falló en adivinar el origen del texto, a excepción del
texto de los Austrias hecho por la inteligencia artificial. En este caso los profesores han acertado en 6 ocasiones,
contra 5 errores. Los casos con más fallos se han producido en el texto del Califato redactado por inteligencia
artificial y en ambos textos de los Borbones, donde la cantidad de errores ha llegado a ser de 8 sobre 11. Por otro
lado, el texto del Califato hecho por un humano ha sido el siguiente con más errores, teniendo 7 con tan solo 4
aciertos. Por último el texto de los Austrias hecho por personas, aunque también hay más errores que aciertos, el
porcentaje está más equilibrado, habiendo 6 errores y 5 aciertos. Al sumar todos los resultados nos encontramos con
un total de 24 aciertos y 42 fallos lo que da un porcentaje de aciertos del 36% y un 64% de fallos.

6. CONCLUSIONES

6.1. Conclusiones sobre las conversaciones con inteligencia artificial


Tras analizar los resultados de la encuesta se puede concluir con que las inteligencias artificiales diseñadas
para entablar conversaciones informales no están lo suficientemente perfeccionadas como para pasar por
desapercibido en una conversación, esto lo demuestra el 80% de respuestas que afirman haber dialogado con una
inteligencia artificial frente a un 20% a las que ha engañado. Aún así, las encuestas nos dejan resultados que
muestran que, aunque se puede detectar fácilmente que se está hablando con un programa, la inteligencia artificial
sabe expresarse adecuadamente en una conversación, responde con coherencia al tema de conversación que hay
establecido y las respuestas que genera no suelen ser extrañas. Esto se ve reflejado en las respuestas de la encuesta
que no bajan del 70% en las respuestas de carácter positivo. Además genera una serie de respuestas que lo
caracterizan como alguien amable, interesado o agradable. Haciendo que se vea visible el avance que en los últimos
años han tenido este tipos de programas de generación de respuestas.

13
6.2. Conclusiones conversaciones con persona
Al finalizar con la recogida de datos de la encuesta se ha obtenido un 50% de aciertos frente a un 50% de
errores. Una vez finalizada esta parte del trabajo, nos deja unos resultados donde sólo la mitad de los participantes
han acertado con quién estaban hablando. En estos resultados la única justificación por la que el otro 50% han
votado inteligencia artificial es que el otro usuario ha escrito acorde con las reglas de acentuación, puntuación y de
ortografía, a pesar de haber avisado antes de realizar la prueba de que se iban a respetar. Puede concluirse que las
nuevas generaciones se están acostumbrando cada vez más a no seguir estas normas cuando se escribe vía online,
haciendo que se dude de si están hablando con otra persona simplemente por el hecho de que ésta respeta la forma
correcta de escribir nuestro lenguaje. Muchos alumnos han destacado que la razón de su voto a inteligencia
artificial, ha sido también, que la otra persona ha iniciado y terminado las frases interrogativas con ambos signos,
no sólo únicamente con el del final. Dejando a un lado lo obtenido a raíz de esta última cuestión, las demás
preguntas nos aportan que, salvo en la minoría de casos, la conversación se realizó a la perfección en todos los
ámbitos. Los adjetivos que más destacaban eran de alguien interesante y culto.

6.3. Conclusiones conjuntas sobre ambas encuestas


Combinando los resultados en la última pregunta de ambas encuestas, se obtiene un 65% de aciertos
frente a un 35% de errores, esto puede afirmar que todavía la IA está lejos de poder pasar desapercibida como
humano ya que más del 50% de los encuestados han sabido identificarla. Cuando se comparan ambas encuestas,
llegamos a la conclusión de que hablando en un chat, tanto una persona como un programa se desenvuelven con
éxito. La fluidez es fácil de conseguir en la conversación, se hace uso de un lenguaje adecuado y hay una
expresión correcta. La descripción de los perfiles nos muestran tipos de personas parecidas según los adjetivos
otorgados por los estudiantes. Cuando se habla de las sensaciones que han transmitido encontramos en ambas un
porcentaje de personas que reconocen que todo ha ido bien y ha sido agradable. Aquí es donde se encuentran
algunas diferencias. En el caso de la inteligencia artificial hay alumnos que se han sentido interrogados o han
sentido ser los únicos que responden a las preguntas. En cambio, en el caso de las personas, debido al uso correcto
de nuestro lenguaje ha hecho que sea descrito como alguien mayor. El trabajo lleva a la conclusión de que aún
cuando los estudiantes identifican correctamente la IA, algunas preguntas como “¿Consideras que este individuo
sabe desenvolverse correctamente en una conversación?” o “¿Consideras que el individuo usa un lenguaje
adecuado al tipo de conversación que habéis tenido?” , muestran que cada vez estos programas van mejorando
para mantener una conversación. En ambos casos, el motivo por el cual los entrevistados han pensado que
hablaban con una inteligencia artificial ha sido el correcto uso de los signos de puntuación.

6.4. Conclusiones sobre apuntes realizados por personas o Chat GPT


Al ver los resultados y analizar los datos se aprecia que con el porcentaje del 64% de errores frente al 36%
de aciertos, lo que apunta a que los participantes han tenido grandes dificultades a la hora de diferenciar qué texto
había sido redactado por un humano o por una inteligencia artificial. Esto nos muestra que las inteligencias
artificiales han avanzado lo suficiente como para que ni los propios profesores con años de experiencia sepan
identificarlas, siendo incapaces de reconocer cuál había sido redactado por quien en la mayoría de casos.

7. AGRADECIMIENTOS
Los agradecimientos van dirigidos en primer lugar a los tutores del trabajo. A Virginia Verdú Tortosa,
profesora de Investigación, por ayudarnos a la hora de elaborar, estructurar, corregir el trabajo y facilitarnos el
contacto con estudiantes y docentes a los que poder realizarles las encuestas. A Francisco Rodríguez Gonzálvez,
profesor de Historia del centro por ayudar en la elaboración de ideas, por guiar la dirección del trabajo y por prestar
horas de sus clases para que este trabajo pudiera llevarse a cabo con éxito.

Se agradece a todos los profesores que han participado en la recaudación de datos contestando la encuesta
enviada. También tanto a nuestros compañeros como al resto de estudiantes del centro que han participado en las
conversaciones y han completado el formulario.

14
8. REFERENCIAS

Academic Accelerator. (28 de enero de 2024).


Jabberwacky.https://academic-accelerator.com/encyclopedia/jabberwacky. Consultada [22/2/24].

Blog media. (s.f.). Chatbot: ¿Qué es, para qué sirve y cómo funcionan?
https://bloo.media/blog/por-que-implementar-chatbot-en-tu-estrategia-de-marketing/ . Consultada [3/12/2023].

Botta, M. y Mora, Y. E. (2016). Alan Turing: un genio desconocido.[Acta de una conferencia] 6° Congreso
Uruguayo de Educación Matemática. 263-274. Montevideo: Sociedad de Educación Matemática
Uruguaya.http://funes.uniandes.edu.co/18053/1/Botta2016Alan.pdf

Conferencia de Dartmouth. (15 de enero de 2024). Wikipedia, La enciclopedia libre. Fecha de consulta: 23:31,
enero 15, 2024 https://es.wikipedia.org/w/index.php?title=Conferencia_de_Dartmouth&oldid=157223047.

Gobierno de España. (19 de abril de 2023). Qué es la Inteligencia Artificial.


https://planderecuperacion.gob.es/noticias/que-es-inteligencia-artificial-ia-prtr#:~:text=La%20inteligencia%20artifi
cial%20(IA)%20es,el%20razonamiento%20y%20la%20percepci%C3%B3n. Consultada [3/12/2023].

Hodges, A. (2012). Alan Turing: uma biografia introdutória. [Archivo PDF]. Boletin SPM. 1-8.
https://revistas.rcaap.pt/boletimspm/article/view/3867/5066

Iberdrola. (s.f.). Qué es un chatbot.


https://www.iberdrola.com/innovacion/que-es-un-chatbot#:~:text=Un%20chatbot%20es%20un%20software,%2C
%20viajes%2C%20restauraci%C3%B3n%2C%20etc. Consultada [3/12/2023].

Jiménez, P. y Sanchéz, J. (2015) .”De ELIZA a SIRI: La evolución”. Tecnologí@ y desarrollo, 13, (pp.11-12).
[Archivo PDF]. https://revistas.uax.es/index.php/tec_des/article/view/616

Kaur, K. y Bahal, S. (2014). “Captcha and Its Techniques: A Review”. International Journal Computer Science and
Information Technologies, Vol 5(5), pp. 6341-6344.
https://www.researchgate.net/profile/Sunny-Behal/publication/285110169_Captcha_and_Its_Techniques_A_Revie
w/links/565bede108ae4988a7bb0d0c/Captcha-and-Its-Techniques-A-Review.pdf

Schofield, J. (8 de junio de 2014). Computer chatbot 'Eugene Goostman' passes the Turing test. ZD NET.
https://www.zdnet.com/computer-chatbot-eugene-goostman-passes-the-turing-test-7000030312/.Consultada
[23/27/24]

Sharma,V., Goyal, M., y Drishti, M. (2017). An Intelligent Behaviour Shown by Chatbot System. International
Journal of New Technology and Research, 3(4), 52-53.
https://www.neliti.com/publications/263312/an-intelligent-behaviour-shown-by-chatbot-system

Turing, A. M. (1950). “Computing Machinery and Intelligence”. Mind and Quarterly Review of Psychology and
Philosophy. 59(236) 433-460. https://academic.oup.com/mind/article-pdf/LIX/236/433/9866119/433.pdf

15
Anexo:

Tablas de cálculo: Tabla de cálculo de inteligencia artificial,Tabla de cálculo de persona,tabla de cálculo


textos

Encuestas: Encuesta inteligencia artificial, Encuesta de persona ,Encuesta de textos.

Imagen 2. Captura de pantalla conversación 8 IA y alumno Imagen 3. Captura de pantalla conversación 18 IA y alumno

Imagen 4. Respuestas obtenidas en “¿Cuál crees que Imagen 5. Respuestas obtenidas en


es el perfil de la persona con la que has hablado?” 1 “Qué sensaciones te ha transmitido?” 1

16
Imagen 10. Respuestas obtenidas en “¿Cuál crees que Imagen 11. Respuestas obtenidas en
es el perfil de la persona con la que has hablado?” 2 “Qué sensaciones te ha transmitido?” 2

17

También podría gustarte