Para que un robot tome mejor el comando verbal humano. Necesita hacer dos pasos.
- Primero tiene que hacer reconocimiento de voz para descomponer el audio recogido por el micrófono en palabras / frases / oraciones de un idioma.
- Luego, el segundo paso involucra la comprensión del lenguaje natural (NLU) que permite al robot derivar el significado de la entrada del lenguaje humano o natural.
Cada uno de los pasos anteriores tiene su propia complejidad.
Los factores que hacen que el reconocimiento de voz sea complejo son las vocalizaciones que varían en términos de acento, pronunciación, articulación, aspereza, nasalidad, tono, volumen y velocidad. El habla está distorsionada por un ruido de fondo y ecos, características eléctricas.
- ¿Qué debería aprender primero si quiero aprender IA con Python? No sé nada de programación.
- ¿Cuáles son los cursos de requisitos previos para una maestría / doctorado en informática / inteligencia artificial?
- ¿Qué debo aprender para crear un bot con cualidades de diálogos naturales?
- ¿Cuándo se crearán los robots que ayudan con nuestras necesidades cotidianas?
- ¿Existe una solución analítica para la regresión logística, similar a la de la ecuación normal para la regresión lineal?
La NLU se considera un problema difícil de la IA, lo que implica que la dificultad de estos problemas computacionales es equivalente a la de resolver el problema central de la inteligencia artificial: hacer que las computadoras sean tan inteligentes como las personas o la IA fuerte.
Ha habido múltiples enfoques para resolver cada uno de ellos, por lo tanto, es posible tener algún tipo de asistente personal inteligente como Siri.
Cualquier mejora / mejora requiere hacer mejoras a los enfoques existentes o nuevos enfoques para resolver el problema.