¿Cuál es la tecnología de conversión de audio a texto más avanzada?

El uso de redes neuronales artificiales se ha visto como una gran ayuda en el reconocimiento de voz (The New York Times). Las redes neuronales, como se las conoce, son un algoritmo de aprendizaje avanzado con muchas aplicaciones, incluidas biología, finanzas, etc. Cada vez más, se utilizan en la investigación de reconocimiento de voz (Universidad de Toronto, Microsoft).

Si bien esto es más un enfoque de investigación que la tecnología de conversión per se, su incorporación a herramientas y dispositivos futuros está casi garantizada.

Otras áreas de técnicas avanzadas de análisis de audio incluyen el modelo Hidden Markov, para aprendizaje automático.

En el futuro, es probable que tengamos la capacidad de traducir audio a texto al instante y casi al pie de la letra , aunque “la decodificación perfecta” es discutible.

Por ahora, parece que gran parte de lo que crea una comprensión de audio de alta calidad es la capacidad de la herramienta para estudiar los patrones de habla que encuentra y aprender de ellos. Así es principalmente como Siri y Cortana, entre otras herramientas, mejoran con el tiempo.

Related Content

¿Cuáles son los mejores recursos con respecto a la tecnología financiera?

Si los teléfonos y la tecnología realmente pudieran hablar con nosotros y entender lo que estamos diciendo, ¿qué dirían?

¿Qué es 'Atención requerida Cloudflare'?

¿Qué tecnología o herramienta tiene más alcance en la industria del software actual?

¿Cuál es el país más avanzado tecnológicamente en el mundo musulmán?

¿Importa la velocidad de un disco duro externo en comparación con la interfaz?

¿Cómo las herramientas de BI modernas como Good Data, RJMetrics, Chartio, Yellowfin, Tableau, etc. procesan una gran cantidad de datos sin usar un almacén de datos?

Este sitio hace un buen trabajo al revisar los servicios de transcripción automatizados: Servicios de transcripción automática comparados: ¿Qué debe usar?

Sonix clasificó más alto en precisión entre los servicios automatizados.

Martin (Chaim) Berlove

Se llama punto de dragón y habla, pero cuesta dinero.

Martin (Chaim) Berlove

More Interesting

¿IOS6 ha marcado el comienzo del fin del dominio de Apple en la industria informática?

¿Es ilegal quitar un rastreador GPS, plantado por la policía, y deshabilitarlo o ponerlo en otro vehículo?

¿Cuáles son algunos gadgets geniales o juguetes simples que no cuestan mucho?

¿Se puede lograr la inmortalidad en los próximos 20 años?

¿Podemos imaginar la vida sin teléfonos móviles?

¿Cuál es la segunda serie de carreras tecnológicamente más avanzada después de la F1?

¿Qué tecnología es mejor para el aprendizaje, Pega o Salesforce?

¿Cómo puede la industria tecnológica hacer más por el bien social?

¿Cuál es la relación entre ciencia y tecnología y sociedad?

¿Qué otras habilidades necesito para desarrollar aplicaciones de Android con gráficos y animaciones increíbles por mi cuenta?

¿Qué es la tecnología de perfusión?

¿Cuál es la pila tecnológica utilizada en voonik?

¿Qué tecnologías emergentes debería priorizar el gobierno del Reino Unido para la inversión?

Si obtengo mi botón de inicio en mi iPhone 5S reemplazado por un centro de servicio de terceros, ¿encontraré el error 53?

¿Dónde puedo aprender sobre UAV / Drones?

Web Analytics