¿Cuáles son los campos más interesantes en los que se está utilizando ML hoy en día?

Creo que uno de los campos más interesantes en ML en este momento es el procesamiento del lenguaje natural, que es el estudio de cómo las máquinas pueden darle sentido a los idiomas humanos (a saber, el inglés) tanto en forma textual como vocal.

Me parece interesante porque la creación de idiomas modernos como el inglés se basa principalmente en años de evolución en un esfuerzo por hacer que la comunicación sea mucho más simple y efectiva entre las personas. Aunque ahora se lo considera la lengua franca en muchas regiones del mundo, el idioma inglés tiene sus ambigüedades que pueden generar algunos malentendidos. Más sobre esto más tarde.

NLP se está utilizando hoy principalmente en software de asistente personal como Siri de Apple, Microsoft Cortana, Asistente de Google y Amazon Alexa. De hecho, algunas otras aplicaciones de identificación de música como Shazam usan NLP para encontrar automáticamente el título de la canción y el artista justo después de unos segundos de activarla. ¿Cómo exactamente una máquina capaz de procesar la entrada de voz (que es una señal analógica, por cierto) está realmente fuera de mi alcance. Durante un largo año, las entradas a computadoras y máquinas siempre han sido principalmente digitales, ya sea a través del teclado, donde cada letra representa una matriz de 1s y 0s o clics del mouse.

Sin embargo, los programas / sistemas basados ​​en la voz todavía no son lo suficientemente precisos para ser realmente productivos, ya que hay muchos factores que dificultan su progreso:

  • ¿Qué pasa si una persona está usando Siri en un ruidoso tren subterráneo? ¿El ruido circundante afecta la claridad de la entrada / comandos vocales?
  • ¿Qué es el inglés no es su lengua materna y hablan con acento? ¿El programa comprende fácilmente los comandos vocales de estas personas, como los de China / India / Japón?
  • ¿Qué pasa si dos o más personas están hablando al mismo tiempo? ¿Es el programa lo suficientemente inteligente como para saber qué comandos vocales pertenecen al propietario del teléfono / sistema?

Las entradas de texto desde un teclado son mucho más fáciles de procesar para una computadora, ya que puede cruzar fácilmente léxicos de palabras de referencia en la web para comprender la idea aproximada de lo que el usuario está tratando de significar. Eso no quiere decir que sufra algunas ambigüedades semánticas principalmente debido a cómo está estructurado el idioma inglés:

  • “El viejo el bote”
    ¿Me estoy refiriendo a dos temas, el viejo y el bote o estoy diciendo que el viejo debería (verbo) el bote?
  • “Los aviones voladores pueden ser peligrosos”
    ¿Me refiero a “Aviones voladores” como una acción o un objeto?

Para resolver las ambigüedades lingüísticas, los humanos tenemos una forma de utilizar la información que nos rodea para aclarar la afirmación textual anterior. Por ejemplo: si estoy en una cabina y el piloto dice: “Volar aviones puede ser peligroso”. Supongo que está hablando del acto de volarlo. Si estuviera en el parque y un amigo me señalara y dijera “Los aviones voladores pueden ser peligrosos”, supondría que está hablando del objeto que está volando actualmente .

Pero la computadora o máquina no tiene “ojos” y no puede ver ni sentir el contexto de la información textual.

Sus casos límite como estos que son realmente interesantes para ver a los investigadores en estos campos encontrar una forma ideal de resolver estas ambigüedades.

Y esto es solo en un idioma: inglés. Puede multiplicar estos problemas con todos los demás idiomas del mundo porque estoy seguro de que existe alguna ambigüedad en alguna parte que una máquina no podría procesar.

A menos que, por supuesto, la IA esté hecha para entender sánscrito [1]

Lo que a su vez el resto de la población tendría que aprender ese idioma en particular para interactuar con los sistemas de inteligencia artificial en el futuro.

No es probable 😉

Notas al pie

[1] NASA en sánscrito e inteligencia artificial por Rick Briggs

Creo que esto debería ser biología. A medida que se utilizan modelos de aprendizaje automático para analizar el genoma humano y encontrar qué secuencias de ADN en particular se correlacionan con rasgos humanos específicos. Posiblemente podría significar el comienzo de la modificación genética si se mapeara y catalogara el genoma completo.