Varios casos de uso, intentaré cubrir algunos de ellos:
Altavoz individual preenvasado:
He tenido buena suerte con Dragon Dictate, pero tengo una experiencia limitada. Mis amigos lo han usado para superar con éxito los problemas de lesiones por estrés repetitivo. Requiere entrenamiento, o al menos lo hizo hace varios años cuando lo usé.
http://www.nuance.com
Vista y posterior también viene con Microsoft Speech Recognition. Solo he jugado un poco, pero funcionó razonablemente bien.
http://www.microsoft.com/speech/…
- Si tuviera que usar una unidad USB de instalación UEOS OS, ¿tendría que deshabilitar el arranque seguro en las placas base UEFI?
- ¿Cómo exactamente una PC escribe datos para almacenar? ¿Cómo se comunica con los controladores de almacenamiento? (USB, SSD, HDD, CD, etc.)
- ¿Las computadoras que ejecutan Ubuntu también son susceptibles a ataques drive-by de JavaScript e infecciones como las computadoras con Windows?
- ¿El formateo de mi computadora eliminará los controladores?
- A la larga, ¿qué computadora portátil es la mejor, Apple o Windows?
Tenga en cuenta que hay una aplicación de iPhone para Dragon, es gratis por tiempo limitado. Transcribe su texto, luego puede enviarlo por SMS o correo electrónico. Funciona bastante bien para mí, vale la pena intentarlo.
APIs:
Microsoft Speech Recognition se entrega con Vista y posterior, puede obtener el SDK y los documentos desde aquí.
http://msdn.microsoft.com/en-us/…
http://msdn.microsoft.com/en-us/…
Dragon también tiene una API. Realmente tampoco lo he usado, excepto probar brevemente un shareware Wav2Text que envuelve la API de voz de MS en una conversación de múltiples hablantes … eso no funcionó.
http://www.nuance.com/naturallys…
Kits para construir tu propio:
Hay varias opciones, pero no conozco lo suficiente como para recomendar.
Subcontratación a humanos:
He usado la sinergia tecnológica y samasource para hacer la transcripción con humanos. Si desea lidiar con múltiples hablantes, o con entornos ruidosos, o con vocabulario arbitrario, hacer que los humanos lo hagan es su mejor opción. La tarifa actual es de $ 0.99 por minuto. Ver ejemplo de salida aquí
http://www.dmolnar.com/hey/
El tiempo de respuesta para ambos es de ~ 24 horas. Está bien para construir tu registro de vida, no tan bueno para escribir tu próxima publicación de blog.