Si hay algunos:
- DragonDictate: Dragon estuvo presente incluso antes de que Google o IBM Watson ingresaran al negocio de reconocimiento de voz.
Dragon NaturallySpeaking: el software de reconocimiento de voz más vendido del mundo
2. Tazti: más información sobre el uso, como comandos de voz en juegos, robótica, instrumentos médicos, etc.
- ¿Qué áreas específicas de las matemáticas son útiles en neurociencia?
- ¿Cuál es un ejemplo de aplicación en el mundo real de los modelos de mezcla gaussiana?
- ¿Cuáles son los mejores clasificadores de código abierto para detectar spam, basura y blasfemias en el contenido generado por el usuario, como los tweets?
- Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?
- ¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?
https://www.tazti.com/index.php
3. CMU Sphinx
Si está buscando reconocimiento de voz en las instalaciones, puede usar CMU sphinx para implementar su propio código abierto y gratuito. En realidad, casi todos (incluido Google) utilizan algún tipo de software CMU / Edinburgh para el reconocimiento de voz y la síntesis de voz.
Han existido desde hace siglos. Lo que cambió el juego es: las compañías de tecnología reunieron muchas muestras de voz de personas de todo el mundo para desarrollar modelos de capacitación. Una vez entrenados utilizando una red avanzada como LSTM-CNN o LSTM apilada, comenzaron a proporcionar servicios a través de la nube.
Afortunadamente, para ti, CMU Sphinx ya tiene una lista de modelos de entrenamiento disponibles. Puede implementar desde algo ya disponible y es probable que funcione el 99% del tiempo.
Explorar / Modelos acústicos y de lenguaje en SourceForge.net
Esto sería suficiente para reconocer varios tipos de modelos de voz que podrían no ser el caso con los softwares de PC disponibles en el mercado.
En el futuro:
Si es para uso interno, puede comenzar a recopilar muestras de voz de la organización. Hay un tutorial para ello y no es tan sencillo.
Modelo acústico de entrenamiento
Pero, esto es solo reconocimiento de voz. La síntesis de voz es un juego de pelota diferente. Puede emular el discurso de una persona desarrollando un modelo de voz usando FestVox.
PD: He generado dos modelos de voz india usando FestVox como proyecto universitario. Las cosas han cambiado para mejor y es más fácil generar tu propia voz para voicebot.