¿Cómo pueden los robots tomar mejor los comandos verbales humanos?

Para que un robot tome mejor el comando verbal humano. Necesita hacer dos pasos.

  1. Primero tiene que hacer reconocimiento de voz para descomponer el audio recogido por el micrófono en palabras / frases / oraciones de un idioma.
  2. Luego, el segundo paso involucra la comprensión del lenguaje natural (NLU) que permite al robot derivar el significado de la entrada del lenguaje humano o natural.

Cada uno de los pasos anteriores tiene su propia complejidad.

Los factores que hacen que el reconocimiento de voz sea complejo son las vocalizaciones que varían en términos de acento, pronunciación, articulación, aspereza, nasalidad, tono, volumen y velocidad. El habla está distorsionada por un ruido de fondo y ecos, características eléctricas.

La NLU se considera un problema difícil de la IA, lo que implica que la dificultad de estos problemas computacionales es equivalente a la de resolver el problema central de la inteligencia artificial: hacer que las computadoras sean tan inteligentes como las personas o la IA fuerte.

Ha habido múltiples enfoques para resolver cada uno de ellos, por lo tanto, es posible tener algún tipo de asistente personal inteligente como Siri.

Cualquier mejora / mejora requiere hacer mejoras a los enfoques existentes o nuevos enfoques para resolver el problema.