¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?

De la misma manera que tú. A través del contexto.

El procesamiento del lenguaje natural (PNL) trata de vincular palabras y frases individuales a través del contexto. Cuanto más abstracto o distante sea el contexto, más difícil será establecer la conexión correcta. La proximidad del contexto es inversamente proporcional a la dificultad de procesamiento.

Esta es la naturaleza del sarcasmo, por lo que mucha gente no * consigue * el sarcasmo. No pueden llegar lo suficientemente lejos en el contexto necesario para captar el significado deseado.

Aquí hay algunos ejemplos para ilustrar cómo usted y la IA manejan el sarcasmo:

“No puedo esperar para ser reprendido por mi jefe el lunes por llegar 1 minuto tarde al trabajo”.

Esto es un claro sarcasmo, y algunos sistemas de PNL probablemente podrían detectar esto en este momento, si no dentro de un año o dos. Todo el contexto necesario está disponible en una oración, por lo que la necesidad de asociar cualquier información de declaraciones anteriores o el conocimiento previo del estilo de comunicación de la persona, su actitud o comportamiento es innecesario. La frase “No puedo esperar” usa el contexto del resto de la oración para indicar que es un idioma entusiasta en lugar de un problema literal de no poder esperar algo, y es seguido por un escenario que ilustra la frustración desde la perspectiva del sujeto, abundan en palabras que a menudo conllevan connotaciones negativas como “jefe”, “reprendido”, “tarde” e incluso “lunes” cuando se coloca cerca de las palabras “trabajo” y “reprendido”. Las ideas opuestas de entusiasmo y frustración implican un fuerte sarcasmo.

“No puedo esperar a ser reprendido por mi jefe el lunes”.

Si bien esta afirmación también parece un claro sarcasmo, falta el contexto para comprenderla. Para la PNL actual, esto sería bastante difícil, aunque dependiendo de su aplicación, podría procesar “No puedo esperar” y “reprendido por mi jefe” como declaraciones bastante contradictorias, lo que implicaría que podría haber sarcasmo. Un humano captaría esta idea más rápido, pero aún le faltaría el contexto necesario para seguir adelante con la conversación. Todavía terminarías preguntando, “¿por qué? ¿Qué pasó?”

“No puedo esperar para ir a trabajar el lunes”.

Si sabe que esta es una declaración sarcástica, es solo porque tiene un contexto que no está disponible para el resto de nosotros. De lo contrario, está llegando a la conclusión de que el sujeto odia los lunes como la mayoría de nosotros, cuando de hecho, el sujeto podría comenzar su primer día de trabajo después de meses de desempleo, o podría tener algo emocionante en el trabajo. A PNL no le iría mejor de lo que lo haría comprender esto como sarcasmo sin el beneficio de conocer mejor a la persona … aunque una gran distinción aquí es que los humanos están programados por naturaleza para llegar a conclusiones, mientras que PNL no lo es, aunque puede ser. Esa es una salida muy interesante, como puedes ver. Puede obtener el sarcasmo aquí mientras NLP no lo haría, o puede atribuir el sarcasmo mientras NLP procesará la información correctamente. Una gran pregunta en PNL eventualmente será, ¿cuánto debería sacar conclusiones precipitadas?

Ahora, si pudiera salir de la reserva y especular por un momento:

La PNL es una de las incursiones más antiguas en la inteligencia artificial, y dice mucho sobre lo difícil que es un lenguaje problemático que la PNL todavía no es * mejor * que un humano en el procesamiento de comunicaciones verbales o escritas. Dicho esto, los ingenieros han mejorado significativamente los sistemas a lo largo de las décadas, y la ignorancia de la persona promedio de ese progreso volverá a mordernos muy pronto. Estos sistemas de PNL se volverán muy buenos, muy rápidos … y la parte que la mayoría de las personas no consideran es que una vez que son mejores, eso es todo. Nunca nos pondremos al día, y de hecho, la brecha solo se hará más grande, más rápida, hasta el punto de que AI se comunicará con nosotros de la misma manera que nos comunicamos con bebés o perros … no tendremos idea de lo que está sucediendo a menos que ellos díganos usando palabras pequeñas que podamos entender. Recuerda que la próxima vez que Siri o Alexa no se den cuenta de tu sarcasmo.

Hay un artículo llamado ‘Detección contextualizada de sarcasmos en Twitter’ donde los autores buscan tweets con los hashtags #sarcasm o #sarcastic. Con eso, tienes tus datos de entrenamiento. Al agregar otras características del tweet, la precisión se acerca al 85%.

Los autores usan solo Twitter, pero los datos de Twitter podrían usarse como punto de partida para un detector de sarcasmo más genérico.