“¿Cómo construir un robot que pueda hacer una pregunta a las personas y reconocer la respuesta de las personas como” sí “o” no “?”

Pan comido. Es solo una modulación de texto a voz para hacer la pregunta, y luego el reconocimiento de voz de solo 2 palabras. Ni siquiera necesita conocer ninguna técnica de procesamiento de voz para lograr esto, si tiene acceso a Internet.

Enfoque 1: guarde las preguntas en un archivo en un formato reconocido, con cada pregunta debidamente delimitada. Use la API de Google para lograr texto a voz y voz a texto 😛
Enfoque 2: guarde las preguntas en un archivo en un formato reconocido, con cada pregunta delimitada correctamente. Use una biblioteca de código abierto para convertir texto a voz y luego capacite a otra usando técnicas de Machine Learning para reconocer o más bien diferenciar entre Sí y No. Hacerlo a través de una biblioteca existente (muchas de las cuales están en Python) le robaría varias horas de diversión al codificar y aprender sobre el proceso real. Ya existe un corpus de palabras si necesita muestras sobre las cuales capacitar su programa

No hace falta decir que necesita potencia computacional.

Mucha gente dice que el aprendizaje profundo y la inteligencia artificial son solo otro bombo. ¿Realmente habrá un futuro de IA?

¿Cuáles son los argumentos de Jitendra Malik contra las redes neuronales?

Aprendizaje de refuerzo: ¿por qué las recompensas están asociadas con acciones (independientemente del estado en el que termines)?

¿Continuarán los humanos desarrollando IA a pesar de los temores de Elon Musk porque hay dinero que ganar?

¿Existe un algoritmo informático que sea capaz de distinguir la música clásica compuesta por los mejores compositores (Bach, Mozart, Beethoven, etc.) de la música compuesta por sus contemporáneos menos considerados?

¿Qué sistemas existen para el descubrimiento automatizado de constantes matemáticas interesantes?

Obtenga un reconocimiento de voz. biblioteca, haga un algoritmo para verificar y verificar qué hacer si una persona dice sí / no, muestre el resultado / reproduzca el archivo de audio.

Kunal Tyagi

More Interesting

¿Crees que la IA reemplazará al médico y al dentista?

¿Qué distingue a las llamadas 'redes neuronales profundas' de las redes neuronales de antaño? ¿Por qué están mucho mejor ahora?

¿Alguien puede compartir su experiencia con la técnica de aprendizaje semi supervisada de Label Propagation? ¿Cómo funciona ese método en la naturaleza?

¿Cuáles podrían ser temas interesantes para una disertación en aprendizaje automático?

¿Realmente compraría un robot cantante en su casa o pagaría para verlo en concierto?

Cómo incorporar nuevas características en los modelos de aprendizaje automático existentes

Cómo construir un sistema de recomendación médica

¿Por qué las máquinas de vectores de soporte han caído en desgracia?

¿Crees que se puede construir un lenguaje de programación muy alto que elija para los desarrolladores las estructuras de datos más apropiadas para el código que han escrito?

¿Qué algoritmos de aprendizaje automático son prometedores además del aprendizaje profundo?