¿Cuáles son las mejores herramientas para la conversión de voz a texto en una computadora?

Varios casos de uso, intentaré cubrir algunos de ellos:

Altavoz individual preenvasado:
He tenido buena suerte con Dragon Dictate, pero tengo una experiencia limitada. Mis amigos lo han usado para superar con éxito los problemas de lesiones por estrés repetitivo. Requiere entrenamiento, o al menos lo hizo hace varios años cuando lo usé.
http://www.nuance.com

Vista y posterior también viene con Microsoft Speech Recognition. Solo he jugado un poco, pero funcionó razonablemente bien.
http://www.microsoft.com/speech/…

Tenga en cuenta que hay una aplicación de iPhone para Dragon, es gratis por tiempo limitado. Transcribe su texto, luego puede enviarlo por SMS o correo electrónico. Funciona bastante bien para mí, vale la pena intentarlo.

APIs:
Microsoft Speech Recognition se entrega con Vista y posterior, puede obtener el SDK y los documentos desde aquí.
http://msdn.microsoft.com/en-us/…
http://msdn.microsoft.com/en-us/…

Dragon también tiene una API. Realmente tampoco lo he usado, excepto probar brevemente un shareware Wav2Text que envuelve la API de voz de MS en una conversación de múltiples hablantes … eso no funcionó.
http://www.nuance.com/naturallys…

Kits para construir tu propio:
Hay varias opciones, pero no conozco lo suficiente como para recomendar.

Subcontratación a humanos:
He usado la sinergia tecnológica y samasource para hacer la transcripción con humanos. Si desea lidiar con múltiples hablantes, o con entornos ruidosos, o con vocabulario arbitrario, hacer que los humanos lo hagan es su mejor opción. La tarifa actual es de $ 0.99 por minuto. Ver ejemplo de salida aquí
http://www.dmolnar.com/hey/

El tiempo de respuesta para ambos es de ~ 24 horas. Está bien para construir tu registro de vida, no tan bueno para escribir tu próxima publicación de blog.

Para conversión de voz a texto:

Herramientas de modelado de lenguaje para postprocesamiento y mejoras adicionales.

También puede usar las herramientas de análisis de voz Adobe SoundBooth / Premiere Pro.
Vincula las palabras a los datos originales si es necesario y proporciona el Modelo de análisis de voz en 7 idiomas: inglés / francés / alemán / italiano / japonés / coreano y español.
También puede usar su propio modelo para mejorar la eficiencia.