¿Cómo superó exactamente el programa de Inteligencia Artificial ‘Eugene Goostman’ la Prueba de Turing?

Por definición de la prueba de Turing, lo venció engañando a la gente de que era humano. No vi una transcripción de las conversaciones llevadas a cabo con el bot, pero leí en alguna parte que uno de los jueces del concurso de Loebner dijo que cuando le dijo al bot “tengo un auto rojo”, y luego le preguntó “¿Qué es ¿el color de mi auto? “, el bot pudo responder correctamente. Se dijo que otros bots durante el concurso Loebner no pudieron responder a esa pregunta correctamente, y algunos ni siquiera pudieron comprender la pregunta. Entonces, esto muestra que el robot intentó comprender realmente lo que le dices, aprende cosas nuevas durante la conversación y puede razonar sobre su conocimiento. Aquí hay una charla que da una visión general de la página de diseño del bot en alicebot.org. Hay algunos registros de chat en esa charla también.

Actualización: Después de haber encontrado un conocimiento adicional sobre Eugene Goostman y el concurso Loebner, podemos concluir que Eugene es solo otro ELIZA. Según su diseño, básicamente utiliza una plantilla de patrones y respuestas enlatados. El concurso Loebner también usa una forma restringida de la prueba de Turing. Por lo tanto, es seguro decir que todavía tenemos un largo camino por recorrer hasta que avancemos en esa área.

En la competencia de prueba de Turing de la Universidad de Reading de 2014 , los organizadores afirmaron que la prueba de Turing fue aprobada por primera vez por un chatbot llamado ‘Eugene’. Resulta que Eugene simula a un niño de 13 años y fue desarrollado por un ruso de nombre Vladimir Veselov. Los jueces fueron engañados por un chatbot que no habla muy bien inglés y tiene el conocimiento de un niño y, sin embargo, solo pudo convencer al 33% de los jueces en un tiempo bastante corto (siempre que sepa que Turing nunca limitó el tiempo de prueba). Con la Universidad de Reading lanzando una declaración ridícula titulada ” EL TURNO DE PRUEBA MARCA EL HITO EN LA HISTORIA DE LA COMPUTACIÓN ” respaldando el fiasco. Esto no debería haber sucedido.

Me hubiera encantado escuchar la noticia de que la prueba de Turing se había aprobado por los motivos correctos, si hubiera una razón genuina para creerlo. Desafortunadamente, este no es el caso para el reclamo y los audaces informes publicados a su paso, sin ningún comentario crítico, por los principales periódicos y revistas. Si bien es difícil comprender las motivaciones exactas que llevaron a Turing a idear lo que él llamó “el juego de imitación”, está claro que el chatbot que, según se afirma, pasó la prueba de Turing no es diferente de cualquier otro chatbot probado antes de juzgar por los tipos de conversaciones que ha emprendido, excepto por el intento deliberado de sus creadores de subrayar sus limitaciones al caracterizarlo como un hablante de inglés no nativo de 13 años. Si las reglas se pueden doblar de esta manera, podría, llevando las cosas al límite, escribir fácilmente un guión para pasar la prueba de Turing que simulaba un bebé de 2 meses, o de un extraterrestre escribiendo galimatías o un borracho para eso importa, uno que olvida incluso la última pregunta que se hizo.

Tomado en serio, la Prueba de Turing no debe ser una prueba para engañar a los jueces de esta manera; en la pantalla deberían mostrarse las habilidades lingüísticas de un interlocutor típico que trabaja en su idioma nativo y a plena capacidad (lo que descartaría, por ejemplo, una simulación de un borracho o de una persona con discapacidad intelectual). Un hito en la IA en el contexto de la prueba de Turing será un chatbot que sea realmente capaz de simular toda la gama de habilidades lingüísticas de una persona normal que trabaje a plena capacidad, un chatbot que no responde con preguntas u olvida lo que se dijo en el comienzo de una conversación (o una pregunta anterior para ese caso), un chatbot que no necesita una tabla de búsqueda del mismo tamaño que la cantidad de preguntas que puede responder, y que, sin embargo, puede responder aproximadamente al mismo tiempo que un ser humano.

La afirmación de que se aprobó la prueba de Turing no hace más que dañar el campo de la inteligencia artificial, porque cualquiera que esté investigando más allá de lo que los periódicos y revistas han recogido del comunicado de prensa original y repite palabra por palabra (vergüenza para todos, no solo por esto, pero por tantos otros errores atroces difundidos por ellos, como tomar un guión para una supercomputadora), lo juzgará un fiasco en detrimento de los verdaderos éxitos en el campo, pasado y futuro. Este supuesto éxito ha perjudicado al campo y a los creadores posiblemente honestos del chatbot, cuya admisión abierta de que le habían dado el carácter de un niño extranjero de 13 años podría haber tenido como objetivo disminuir las expectativas de lo que podría lograr.

El error de afirmar que su ganador pasó la verdadera prueba de Turing como lo llamaron, e incluso llamarlo un hito, es difícil de disculpar, especialmente en vista del daño que podría causar al campo, y de hecho a los propios organizadores y a otros Eventos de prueba de Turing que ya habían tenido dificultades para distanciarlos de una actividad simplemente entretenida. En resumen, si se consideró que una prueba de Turing se aprobó hace 2 días, lo hizo por todas las razones equivocadas.

El profesor Warwick ha escrito en The Independent sobre las críticas en su defensa:

“… A los jueces no se les dijo que era un adolescente y Turing nunca sugirió que la inteligencia artificial tendría que hacerse pasar por un adulto, solo que engañó a la gente a pensar que era humana. Los jueces eran libres de hacer a los sujetos cualquier pregunta que les gustara en conversaciones sin restricciones, y Eugene era claramente capaz de defenderse ”.

Respaldo mi propuesta para poder pasar una prueba de Turing verdaderamente ilimitada con este espíritu y escribir un chatbot que emule a un bebé de 2 meses. Qué poco sentido común para una prueba que debería haberse realizado impecable y que se afirma que tenía estándares muy altos. También aprendí que a los jueces se les permitía ser niños, entre otros, así que, una vez más, por qué no ponemos a los bebés como jueces, Turing nunca dijo nada en contra, el único requisito que Turing dijo explícitamente era tener expertos no informáticos.

Prefiero hacer una pregunta que requiera conectar ideas a través del tiempo de conversación, como “¿Qué dije sobre X en el momento Y de nuestra conversación?”, Donde X sería reformulado adicionalmente de alguna manera que solo una IA capaz de razonamiento temporal e interpretación semántica se desenredaría (asegurándose de que los humanos lo hagan). La mayoría de los chatbots fallan en los puntos de conexión en el tiempo de conversación y aún más al reformular algo que se dijo. Estoy sorprendido de que la mayoría de los jueces en las pruebas de Turing no hagan este tipo de preguntas mirando sus transcripciones y más bien hagan preguntas muy simples como tratar de ayudar a la IA a pasar la prueba porque estamos muy entusiasmados (pero haciendo que la prueba sea deshonesta y poco científica) ) Turing no limitó la complejidad de las preguntas a formular y no deberían estar en un verdadero experimento científico.

‘Eugene’, por lo tanto, no era en absoluto diferente a un famoso chatbot de los años 60, pero Eliza era quizás aún más sofisticada ya que intentaba simular un psicólogo en lugar de un niño que no habla inglés con capacidades limitadas de conversación.

Los propietarios del chatbot Eugene Goostman (que por cierto no es una supercomputadora y nada similar), retiraron el chatbot de su sitio web solo unos días después del evento de dicho hito que había “ pasado la prueba de Turing ” y aún está inactivo hoy (25 de octubre de 2016) porque el chatbot es vergonzosamente básico y arcaico que no se puede tener sino una conversación tonta con él. Obviamente, esto solo fortalece el hecho de que fue un asunto enorme y falso para llamar la atención a los organizadores dirigidos por Kevin Warwick y la Universidad de Reading, y al evento en lo que, lamentablemente, es una pena.

Algunos de los organizadores (y los propietarios del chatbot) afirman que Eugene Goostman se está actualizando (sin embargo, deberían haber conservado la versión que afirman que pasó la prueba de Turing para la posteridad). Sin embargo, su verdadera esperanza es que algún día en el futuro lanzarán una versión menos vergonzosa para los propietarios, los jueces y los organizadores de dicha competencia. Pero incluso si lo hacen, el daño a la prueba, los organizadores, los posibles escritores de código de buena fe de este simple chatbot, está hecho.

No, una ‘supercomputadora’ NO pasó la prueba de Turing por primera vez y todos deberían saberlo mejor | Techdirt

No lo hizo

More Interesting

Cómo cambiar mis intereses y me gusta en Quora

¿Prefieres usar un iPhone o un Android?

¿Spore funciona igual que No Man's Sky en la forma en que genera planetas aleatorios?

Dado que el uso compartido de vehículos hacia / desde el trabajo en los Estados Unidos ha disminuido en un 50% en las últimas cuatro décadas, ¿cómo podrán Lyft Line y UberPool contrarrestar esta tendencia (agosto de 2014)?

¿Cuáles son los mejores eventos relacionados con la tecnología financiera?

¿Cuál es actualmente la pieza más avanzada de tecnología humana?

¿El incidente de piratería de Sony es un reflejo de la poca seguridad en Sony o de las capacidades avanzadas de piratería de Corea del Norte?

Es enero de 2016. ¿Qué se sabe sobre Datto? ¿Cómo llegaron al club Unicornio?

¿Cuál es tu opinión sobre el iPhone 8?

¿Puedes tomar un organismo como un perro, un gato, una persona o cualquier otra cosa que ya haya nacido y cambiar su genética a través de la ingeniería genética?

¿Google es miope o sabio al tratar de vender Boston Dynamics?

¿Por qué en el mundo me pareció interesante comer mis propios mocos cuando era niño?

A principios de 2014, ¿cuáles son las mejores aplicaciones de iOS para ver noticias tecnológicas?

¿Qué piensa sobre la demanda de Marissa Mayer sobre supuestamente 'depurar empleados masculinos' de Yahoo?

¿Es correcto un artículo reciente de TechCrunch de que BuzzFeed ha "cambiado por completo la forma en que las personas leen el contenido y la forma en que los medios de comunicación lo producen" (agosto de 2014)?