Pan comido. Es solo una modulación de texto a voz para hacer la pregunta, y luego el reconocimiento de voz de solo 2 palabras. Ni siquiera necesita conocer ninguna técnica de procesamiento de voz para lograr esto, si tiene acceso a Internet.
- Enfoque 1: guarde las preguntas en un archivo en un formato reconocido, con cada pregunta debidamente delimitada. Use la API de Google para lograr texto a voz y voz a texto 😛
- Enfoque 2: guarde las preguntas en un archivo en un formato reconocido, con cada pregunta delimitada correctamente. Use una biblioteca de código abierto para convertir texto a voz y luego capacite a otra usando técnicas de Machine Learning para reconocer o más bien diferenciar entre Sí y No. Hacerlo a través de una biblioteca existente (muchas de las cuales están en Python) le robaría varias horas de diversión al codificar y aprender sobre el proceso real. Ya existe un corpus de palabras si necesita muestras sobre las cuales capacitar su programa
No hace falta decir que necesita potencia computacional.
- ¿Cuándo se crearán los robots que ayudan con nuestras necesidades cotidianas?
- ¿Es posible construir un robot que desvíe los proyectiles entrantes con un palo?
- ¿Por qué algunas personas solo juegan contra la IA y no contra jugadores reales en los videojuegos?
- ¿Hay futuro para alguien con un doctorado en lógica aplicada para la inteligencia artificial?
- ¿Qué hacen mejor las redes neuronales artificiales alimentadas completamente conectadas que las redes neuronales de convolución y viceversa?