A colación de la siguiente noticia de Microsiervos GPT-4 y el Test de Turing: la IA supera el 41% de las pruebas, mientras que los humanos nos mantenemos en un 63%, gracias me parece interesante explicar y matizar qué es el test de Turing, su importancia relativa y mi opinión al respecto.
¿Qué es el Test de Turing?
El Test de Turing es un experimento, propuesto por Alan Turing (uno de los padres de la informática), en el cual un humano interactúa con un agente no revelado, que podría ser otro humano o una máquina. Ambos están separados de tal forma que no pueden verse ni escucharse, comunicándose únicamente a través de texto. Si después de la interacción el humano (5 minutos) no puede distinguir si estaba conversando con una máquina o con otro humano, se dice que la máquina ha pasado el Test de Turing.
Importancia del Test de Turing
Este test ha sido de suma importancia para medir el avance y las capacidades de los sistemas de IA. Aunque es cierto que el test tiene limitaciones y ha sido objeto de críticas, sigue siendo una referencia en la discusión sobre la «inteligencia» de las máquinas.
Es como el índice Big Mac, una forma relativamente sencilla y general para intentar medir y comparar avances o características comunes. En el caso del Test de Turing sirve como punto de inflexión para medir la capacidad de imitar a un humano y mantener una conversación humana coherente que no sea distinguible de la de un humano real.
Limitaciones y Críticas
Muchos expertos argumentan que pasar el Test de Turing no significa necesariamente que una máquina tenga conciencia o emoción. Además, algunas IA que son altamente especializadas en tareas específicas podrían fallar el test pero seguir siendo consideradas «inteligentes» en su dominio particular. Es decir, es una medida muy parcial y sesgada para medir la «inteligencia» de una máquina.

El Test de Turing y GPT-4
En el caso del artículo, que realmente hace referencia al estudio Does GPT-4 Pass the Turing Test? de los investigadores Cameron Jones y Benjamin Bergen, se determina que no ha pasado el Test de Turing ya que sólo consigue «engañar» al 41% de las personas.
El problema es que GPT está especialmente diseñado para ser un asistente y confesar continuamente que es una inteligencia artificial. Habla en primera persona refiriéndose a «ser entrenado en x fechas máximo», no esconde su condición y es, a veces en exceso, muy servicial.
Conclusión
Estoy seguro que si se entrenarse a un modelo de lenguaje LLM en la tarea de hacerse pasar por un humano conversando, se pasaría este test sin problema. Al igual que se han hecho máquinas que han ganado al ajedrez a Kasparov o a jugar al Go o que son capaces de realizar conducción autónoma. El objetivo no es crear una IA que lo haga todo, sino que lo que haga lo haga lo mejor posible. Y, admitamoslo, hay humanos que les cuesta hacerse pasar por humanos. ¿Cómo no lo van a hacer unas maquinas?
Por último, una pregunta. ¿Sabes cuántas de las interacciones en Chat o Email que has realizado con empresas en los últimos meses, son realmente personas? La respuesta no la sabemos, pero da igual mientras que el propósito se cumpla.

¡Que has estado chateando con la tostadora!


Un comentario sobre “El Test de Turing”