> ¿Cómo funciona el reconocimiento de voz?
Hay muchos buenos libros de texto que explican que uno de ellos es
http://www.amazon.com/Spoken-Lan…
- ¿Qué hacemos cuando prácticamente todo se puede hacer más barato usando IA, nanotecnología y contenedores con muy poca intervención humana (pocos trabajos)?
- ¿Cuáles son algunos problemas de aprendizaje automático que se resuelven mejor sin usar redes neuronales, dado que las redes neuronales tienden a ser más complicadas?
- ¿Cuán innovador es el reciente experimento que supuestamente muestra autoconciencia en los robots NAO?
- ¿Qué le falta a la comunidad de aprendizaje automático?
- ¿Podemos construir IA con todas las preguntas contenidas en Quora? ¿Si es así, cómo?
Si está interesado en el estado del arte, los métodos de aprendizaje profundo son muy activos en estos días y demuestran buenos resultados. Puede aprender sobre Deep Learning en reconocimiento de voz de otro libro muy bueno:
Reconocimiento automático del habla: un enfoque de aprendizaje profundo (tecnología de señales y comunicación): Dong Yu, Li Deng: 9781447157786: Amazon.com: Libros
> ¿Qué avances en software / hardware deben hacerse para mejorarlo, o es solo una cuestión de construir una base de datos más grande?
Como en todo aprendizaje automático, el tamaño de los datos no resuelve perfectamente el problema. La investigación reciente de Google aumentó la cantidad de datos utilizados para el entrenamiento a 100000 horas de datos de voz, pero su rendimiento no mejoró hasta cero. El aumento entre 1000 horas y 100 mil horas da una mejora del 1% del 10% al 9%. Por lo tanto, esto no va a converger a cero, incluso si recopila todo el discurso en la Tierra. Las estadísticas de la plataforma Nexiwave ASR también confirmaron eso.
El mayor problema es una falta de coincidencia entre el modelo matemático simple utilizado para la capacitación y los datos reales. Se espera la mayor mejora del cambio del modelo subyacente para que se ajuste mejor a los datos. Eso también requerirá el cambio de los algoritmos de entrenamiento porque el nuevo modelo podría requerir nuevos algoritmos para el entrenamiento.