martes, 10 de junio de 2014

EL ORDENADOR QUE SUPERÓ EL TEST DE TURING: ¿ENGAÑO O HITO HISTÓRICO?

Por Manuel Ángel Méndez
Gizmodo en español


El pasado fin de semana, la Universidad de Reading (Reino Unido) nos sorprendió con una noticia "histórica", aseguraban. Un programa informático había pasado por primera vez el test de Turing. Como suele ocurrir con hechos "históricos", llegó la controversia. Investigadores y científicos señalan ahora que la noticia de la Universidad de Reading es absurda, puro engaño. Otros defienden su validez. ¿Quién tiene razón?

Jose María Peña, subdirector del Centro de Supercomputación y Visualización de la Universidad Politécnica de Madrid (UPM), es uno de los no convencidos. "Esto es una campaña de marketing más que un hito histórico. Es un pequeño avance, pero nada revolucionario. Las universidades, como otras organizaciones, compiten por titulares", explica en conversación telefónica con Gizmodo en Español.

Como él, muchos investigadores y científicos creen que lo único que ha hecho la Universidad de Reading es exagerar. O no contar toda la verdad. ¿Por qué? Ahí van algunas razones.

Un test de Turing, cientos de interpretaciones

Empecemos por el problema clave. El test de Turing fue un sistema propuesto en 1951 por el matemático y criptógrafo británico Alan Turing. Su idea inicial era bastante diferente de las pruebas que se realizan en la actualidad.

Turing propuso una prueba en la que un juez trataba de distinguir entre un humano y una máquina a través de un terminal con el que les hacía preguntas. Según Turing, si el juez era "menos de un 50% correcto en su distinción", es decir, si podía confundir con igual probabilidad un humano y una máquina, entonces el programa informático era una buena simulación de la inteligencia humana.

Sin embargo, hoy en día hay decenas de organizaciones y compañías hacen los test de Turing con su propia interpretación de la idea inicial del matemático británico. Desde el Premio Loebner, establecido en 1991, hasta este último de la Universidad de Reading, que realizó conversaciones de 5 minutos entre el juez y el humano/máquina. En total, 30 jueces y 300 conversaciones. ¿Por qué 5 minutos y no 10, o un día entero? ¿Por qué esos 30 jueces y no otros? ¿Quién establece las reglas y con qué autoridad? Nadie lo sabe ni lo controla. En palabras de Jose María Peña:

El test inicial de Turing es un postulado teórico. Dependiendo de cómo lo interpretes e implementes, lo puedes utilizar o no para obtener resultados en tu propio beneficio.

Traducido: visibilidad para una Universidad y programadores que pueden aprovechar en negocio o reconocimiento su "hito histórico".

No hay verificación independiente

Al no existir una entidad única que estandarice y verifique los test de Turing, básicamente cualquiera puede organizar uno y asegurar que se ha batido por primera el test de Turing.

¿Quién asegura que los evaluadores seleccionados tienen las cualificaciones necesarias para realizar el test? ¿Qué comunidad científica (y proceso) asegura que los resultados del test de la Universidad de Reading son, efectivamente, correctos? En todo avance científico, hay siempre una organización que verifica que ese logro es repetible y acorde con unas ciertas "reglas de juego". Eso no ocurre con los test de Turing.

13 años y ucraniano, o cómo influenciar el resultado

Es otro de los puntos más discutidos de este test: el programa que lo superó, Eugene, partía de la premisa de ser un niño ucraniano de 13 años hablando en inglés, idioma en el que no era nativo. Si los evaluadores saben que al otro lado hay un niño (o una máquina) que se comunica en un idioma que no es el suyo propio, se introduce un sesgo a la hora de analizar la validez y complejidad de sus respuestas.

"Para ser correcto, habría que evaluar sus respuestas con las de un niño de verdad de 13 años y ucraniano hablando en inglés. Entonces tal vez ese 30% de acierto no era válido o insuficiente. Son condiciones muy relativas", dice Peña.

Lo peor: no, no es el primero en "superar" el test

La Universidad de Reading aseguró que el programa Eugene había sido el primero en superar el test de Turing. Falso. Primero porque, como hemos explicado, no existe *el* test de Turing, hay muchas interpretaciones del mismo. Pero segundo, y más grave, porque ya en 1964 hubo programas como Eliza, diseñado por el MIT, que hicieron algo muy parecido.

"En 1964 hubo un comercial de una compañía que se pasó un buen rato conversando con el programa Eliza pensando que era una persona. Ahora el software es mucho más complejo, pero pasar una conversación de 5 minutos no implica absolutamente nada sobre la inteligencia real del software", explica Jose Mª Peña.

Stevan Harnad, profesor de ciencias cognitivas de la Universidad de Quebec, en Canadá, coincide. "Es una tontería, una completa tontería. No hemos pasado el test de Turing. No estamos ni siquiera cerca", ha dicho a The Guardian.

En definitiva ¿engaño o hito histórico? Tal vez hay una palabra mejor: marketing.

No hay comentarios: