El aprendizaje automático y el reconocimiento de patrones son términos bastante amplios con un significado no muy exacto. Si define el aprendizaje automático como el dominio de las matemáticas o CS que trata con grandes conjuntos de datos e intenta usar computadoras para encontrar algunas dependencias en ellos, el reconocimiento de voz parece ser una aplicación natural del aprendizaje automático. Por lo tanto, no hay nada de malo en usar el aprendizaje automático para hacer el reconocimiento de voz.
La pregunta es cómo se aplica el aprendizaje automático. En los enfoques convencionales, hay bastantes problemas y cuestiones sin resolver que requieren más investigación. Por ejemplo, no existe un conocimiento fundamental sobre cómo el oído humano trata con los sonidos reverberados. Se sabe que los humanos incluso prefieren el sonido ligeramente reverberado sobre el no reverberado, lo que le da un poco más de naturalidad al discurso. Sin embargo, la mayoría de los sistemas modernos degradan drásticamente su precisión en ese caso. Los modelos de habla que utilizamos en el aprendizaje automático son demasiado simplistas y no pueden manejar bien la reverberación. También hay otros problemas importantes, por ejemplo, aún no se comprende bien cómo los humanos manejan diferentes acentos con mucha mayor precisión que los reconocedores modernos.
En ese sentido, estoy totalmente de acuerdo con usted en que el número de características consideradas es algo pequeño y demasiado simplificado. Se requiere una investigación más profunda en muchas áreas de reconocimiento de voz, con suerte, pronto obtendrá una gran noticia al respecto. Para analizar más las cosas, necesitamos especializarnos en aspectos importantes del reconocimiento de voz y tratar de resolverlos con las mejores herramientas de aprendizaje automático que tenemos ahora.
- ¿Qué tipo de problemas funciona bien con la técnica de Deep Learning?
- ¿Por qué debería aprender técnicas de aprendizaje profundo?
- ¿Qué piensas sobre el auge del aprendizaje automático?
- ¿Qué distingue a las llamadas 'redes neuronales profundas' de las redes neuronales de antaño? ¿Por qué están mucho mejor ahora?
- ¿Cómo se forma el concepto de self en redes neuronales biológicas como el cerebro?