La medición del rendimiento de los sistemas de reconocimiento de voz es tan diversa que actualmente es imposible establecer una compañía que lidere el campo. Ciertamente, Google, Microsoft, Apple, Dragon, Speechmatics son todos contendientes. Hay un discurso aislado y continuo, un solo hablante, múltiples oradores, ancho de banda entrenado o no entrenado, restringido o sin restricciones, reconocimiento en tiempo real, etc., etc. Muchos proveedores de sistemas de reconocimiento de voz usan motores iguales o similares pero han desarrollado sus propios sistemas de entrenamiento. – Algunos basados en redes neuronales. Nuestro servicio Threads utiliza el reconocimiento de voz para convertir las llamadas telefónicas en texto y hemos probado la mayoría de los sistemas y servicios de código abierto disponibles comercialmente. Estamos en una posición algo inusual de conocer la identidad de los hablantes y el contexto de sus discusiones, y esta información puede aumentar enormemente el rendimiento del reconocimiento de voz, siempre que pueda usarse, lo que no todos los sistemas permiten. Actualmente estamos desarrollando un marco para probar todos los sistemas disponibles comercialmente y la intención de publicar los resultados periódicamente.
¿Qué empresas / personas lideran actualmente en el campo del reconocimiento de voz?
Related Content
¿Quiénes son los mejores informáticos teóricos?
¿Cuál es la investigación actual sobre la teoría de la computabilidad?
¿La fotogrametría hará que la escultura digital sea obsoleta?
Cantab Research, con Tony Robinson a la cabeza, realmente está empujando los límites en términos de vocabulario amplio, rec. Su sistema comercial parece ser uno de los más precisos (Speechmatics) y también publican frecuentemente con algunas cosas impresionantes (Página en arxiv.org)
More Interesting
¿Por qué es una red neuronal, y en general una red profunda, no convexa?
¿Cuáles son algunas buenas áreas de investigación en informática en IIT Kanpur?
¿Cuáles son los trabajos académicos clásicos en finanzas computacionales / comercio algorítmico?
¿Cuáles son las últimas ideas de investigación en informática?
¿Qué ha sucedido en el aprendizaje automático teórico en los últimos 5 años (2009-2014)?
Cómo convertirse en un buen investigador en informática
¿Cuáles son los desarrollos recientes en tecnología informática?
¿Qué campos de investigación tendrán más impacto fuera de la academia en los próximos años?
¿A qué conferencias / talleres de informática vale la pena asistir y tomar conocimiento?
¿Cómo exactamente los procesadores cuánticos logran una velocidad exponencial?
¿Cuál es el mejor lenguaje de programación para hacer investigaciones y locuras?