¿Por qué algunas personas se oponen a la prueba de Turing?

El ingenio de la prueba de Turing es que evita tener que definir la inteligencia en términos de principios establecidos desde cero. Evita tener que crear el algoritmo para establecer el objetivo de crear el algoritmo. Esta es una fortaleza. Dos debilidades vienen a la mente.

El pionero de la IA John McCarthy dijo una vez: “Tan pronto como funciona, ya nadie lo llama IA”. La prueba de Turing sufre de esto. Tan pronto como alguien afirme que una máquina ha pasado, otros practicantes de IA analizarán la estrategia de engaño y el engaño se convierte en el logro en lugar de la inteligencia.

La prueba de Turing requiere una máquina inteligente para convencer a los humanos de que es humana. Como alguien más ha señalado, es una tarea difícil y a veces imposible para los humanos convencer a otros humanos de que son algo diferente de lo que son. Necesitan ser superiores a los jueces para lograr la tarea. En este sentido, la prueba de Turing es una prueba de inteligencia súper humana. Requiere que se logre la inteligencia a nivel humano primero y, por lo tanto, cae en la trampa para la que fue diseñado.

También existe esta famosa objeción: el argumento de la sala china. No me suscribo a él como una objeción a la Prueba de Turing. Es una objeción a los programas conscientes, o consciente de cualquier cosa que no sea usted, y tal vez eso también.

Puedo darle una oportunidad a este. Comencemos primero por la forma en que considero que la prueba de Turing es elegante como una forma de demostrar que una entidad tiene una capacidad que nos cuesta definirnos.

De hecho, la inteligencia es algo que nos cuesta definir como humanos: ¿qué se requiere para la inteligencia? necesitas conciencia? necesitas sentimientos? ¿O son estos efectos secundarios de la forma en que los humanos llegamos a lo que consideramos que nos hace inteligentes? La lista puede seguir y seguir.

En cambio, y estas son mis palabras, turing considere una prueba de inteligencia como la “prueba del pato”: si parece un pato, suena como un pato y actúa como un pato, entonces probablemente sea un pato.

El concepto detrás de esto a menudo se asocia con el concepto de conductismo. Que otorgan mucha más importancia al comportamiento visible de la entidad inteligente que los mecanismos cognitivos internos. En resumen, no le importa cómo el robot logra mantener la conversación con usted (o cualquier otro comportamiento observable para el caso, lo que importa es que la conversación / comportamiento parece ser buena para un humano.

En el papel, esto se ve bien, especialmente cuando intentas una conversación con un chatbot básico, incluso hoy en día, eventualmente encontrarás algún comportamiento que es extraño para un humano. Falta de memoria de información del intercambio anterior, respuestas extrañas que no se relacionan con la conversación, interpretación errónea sobre frases complejas, …
El problema surge cuando tiene un sistema mejor desarrollado que, si bien es bastante estático, tiene un conjunto de reglas programadas tan exhaustivas y refinadas que puede mantener una conversación durante más tiempo en múltiples contextos. ¿Qué tan lejos debes llegar hasta que te rindas y digas “OK, creo que este es un humano” probaste el tiempo suficiente?

Una primera demostración de esta limitación fue, de hecho, el programa ELIZA, que si bien era un programa muy simple basado en reglas, era bastante bueno para mantener alguna forma de conversación. La muy popular instancia de Eliza fue nombrada Terapeuta o Doctor, creo, y solo estaba parodiando la forma en que un terapeuta de psicología interactúa con su cliente cambiando lo que el humano escribió en cuestión, como “¿Cómo te sientes acerca de X?”. Si bien no creo que haya aprobado la prueba de Turing “hablando formalmente”, la simplicidad del programa en comparación con el comportamiento aparente resultante mostró cómo “aprobar” la prueba básica de Turing no era tan descabellada como se podría pensar inicialmente. Podrías cambiar incluso eso burlonamente diciendo si Eliza no puede pasar la prueba de Turing, ¿qué dice eso sobre mi terapeuta?

Y aquí se encuentra una gran crítica de la prueba de Turing y las cosas que se transmiten sobre el comportamiento observable al abstraer / ignorar los elementos internos de la cognición. Para ser lo suficientemente completo, requeriría una prueba muy exhaustiva, ya que después de una o varias conversaciones es solo una muestra de todos los comportamientos posibles. Esto podría ser suficiente cuando algún comportamiento apunta rápidamente a fallas obvias, pero no protege contra falsos positivos o incluso falsos negativos (suponga que tiene una conversación con alguien que habla muy mal inglés, por ejemplo … ¿pasará la prueba de Turing por usted? ) Luego viene el argumento de que el comportamiento por sí solo no refleja la inteligencia: puede ser necesario verlo a un nivel meta para ver conceptos como la capacidad de aprender (es decir, alterar su comportamiento), inferir …

De hecho, mirar todo esto puede necesitar conocer el estado interno y el mecanismo del sistema para identificar realmente si es inteligente o no y, de ser así, el truco de prueba de Turing para evitar definir la inteligencia puede ser su mayor defecto.

Por mi parte, también considero que debemos detenernos para molestarnos con conceptos como la “inteligencia a nivel humano” como el objetivo de oro. Si bien es cierto que es el mejor ejemplo que conocemos, también considero que lo que subyace en esto es defectuoso. En mi opinión, la inteligencia no es un concepto unidimensional y, por lo tanto, no está representada por un orden completo. Tan pronto como pones niveles, tiendes a considerar alguna jerarquía u orden, mientras que, por otro lado, creo que puedes tener otra entidad que es inteligente de una manera muy diferente a la humana. Podría reflejar capacidades similares como la memoria, la cognición, el aprendizaje … pero expresadas en diferentes formas. O de manera similar, uno podría imaginar algo que es mucho mejor que nosotros para adaptarnos a una nueva situación y aprender de ellos rápidamente pero no muy bueno en la proyección a largo plazo.

Por supuesto, esta última parte es solo mi propia intuición y no tiene ningún tipo de apoyo.

Editar: pensé en un simple paralelo a la prueba de Turing que ilustra cómo esto puede no funcionar.

Imagine que en lugar de “inteligencia” probamos “ciudadano estadounidense nacido”, puede conversar con la persona todo el tiempo que quiera y necesita identificar al final si nació como ciudadano estadounidense o no.
Aunque pasé diez años en los EE. UU. Y ahora soy bastante consciente de muchos aspectos de la cultura estadounidense y otras cosas, no te engañaría mucho si empiezo a hablar, ya que todavía tengo un acento francés muy fuerte. Pero a la inversa, he conocido a personas extranjeras que ahora son bastante buenas para adoptar el acento de los EE. UU. También, por mi parte, siento que dos veces los franceses me dicen que mi “francés fue increíble”, ya que asumieron que era extranjero con el matiz del acento americano Llegué después de unos años aquí.

Entonces, aquí puede ver que la prueba de Turing para “ciudadanos estadounidenses nacidos” no es fácil, solo se basa en el comportamiento y no pide más detalles internos como un certificado de nacimiento o cosas similares más “internas” y puede conducir fácilmente a resultados erróneos de una forma u otra. Esto le da un paralelo al argumento anterior con la prueba de Turing de “inteligencia”.

La prueba de Turing no se puede lograr, por lo que no sería muy pragmática. Un ser humano puede llegar al borde de la experiencia de una computadora de manera muy fácil y rápida, incluso si hay billones de reglas. Ir a 10 de profundidad cada vez solo tomaría 12 preguntas para salir 1 trillón (10 al poder de 12) reglas. En ese momento, la máquina pierde la prueba de Turing ya que no sabrá qué hacer (sin mencionar el Teorema de incompletitud).