“¿Cómo construir un robot que pueda hacer una pregunta a las personas y reconocer la respuesta de las personas como” sí “o” no “?”

Pan comido. Es solo una modulación de texto a voz para hacer la pregunta, y luego el reconocimiento de voz de solo 2 palabras. Ni siquiera necesita conocer ninguna técnica de procesamiento de voz para lograr esto, si tiene acceso a Internet.

  • Enfoque 1: guarde las preguntas en un archivo en un formato reconocido, con cada pregunta debidamente delimitada. Use la API de Google para lograr texto a voz y voz a texto 😛
  • Enfoque 2: guarde las preguntas en un archivo en un formato reconocido, con cada pregunta delimitada correctamente. Use una biblioteca de código abierto para convertir texto a voz y luego capacite a otra usando técnicas de Machine Learning para reconocer o más bien diferenciar entre y No. Hacerlo a través de una biblioteca existente (muchas de las cuales están en Python) le robaría varias horas de diversión al codificar y aprender sobre el proceso real. Ya existe un corpus de palabras si necesita muestras sobre las cuales capacitar su programa

No hace falta decir que necesita potencia computacional.

Obtenga un reconocimiento de voz. biblioteca, haga un algoritmo para verificar y verificar qué hacer si una persona dice sí / no, muestre el resultado / reproduzca el archivo de audio.

More Interesting

¿Crees que la IA reemplazará al médico y al dentista?

¿Qué distingue a las llamadas 'redes neuronales profundas' de las redes neuronales de antaño? ¿Por qué están mucho mejor ahora?

¿Alguien puede compartir su experiencia con la técnica de aprendizaje semi supervisada de Label Propagation? ¿Cómo funciona ese método en la naturaleza?

¿Cuáles podrían ser temas interesantes para una disertación en aprendizaje automático?

¿Realmente compraría un robot cantante en su casa o pagaría para verlo en concierto?

Cómo incorporar nuevas características en los modelos de aprendizaje automático existentes

Cómo construir un sistema de recomendación médica

¿Por qué las máquinas de vectores de soporte han caído en desgracia?

¿Crees que se puede construir un lenguaje de programación muy alto que elija para los desarrolladores las estructuras de datos más apropiadas para el código que han escrito?

¿Qué algoritmos de aprendizaje automático son prometedores además del aprendizaje profundo?

¿Cuáles son las diferencias entre la 'respuesta a preguntas' al estilo AI, el 'debate' automatizado al estilo AI y lo que hacen los humanos?

¿Cuáles son los mejores / adecuados temas de investigación en inteligencia artificial para estudiantes universitarios?

¿Qué piensas sobre la creación de máquinas superinteligentes (IA)? Por favor lea los detalles antes de responder.

¿Es esencial aprender C ++ como estudiante de visión por computadora?

¿Cuál es la diferencia entre un robot y un droide?