¿Cuál puede ser un buen proyecto de curso de 3 meses relacionado con el procesamiento del habla y el aprendizaje automático?

CMU Sphinx – Speech Recognition Toolkit es un buen punto de partida para aprender más sobre el procesamiento del habla y el aprendizaje automático, puede comenzar rápidamente con demostraciones existentes e implementar cosas interesantes para aprender más sobre el reconocimiento del habla y áreas relacionadas. Existe bastante documentación disponible para los desarrolladores y puede ayudarlo a comenzar rápidamente.

CMUSphinx ha sido la base de muchos cursos de reconocimiento de voz en diferentes universidades. Hay pocos proyectos que incluso personas sin experiencia podrían emprender en 3 meses:

1) Crea modelos para tu idioma local
2) Cree voz TTS para su idioma desde el audiolibro
2) Agregue soporte para modelos de lenguaje compactos basados en trie
3) Implementar chatbot de voz
4) Escribir software para recopilar automáticamente diccionarios de pronunciación de wikipedia

También hay proyectos de investigación más serios:

1) Implemente la estimación de confianza para la decodificación gramatical
2) Implementar capacitación a gran escala basada en la red
3) Mejorar el marco de posprocesamiento para la asignación de puntuación y la capitalización.

Si necesita ayuda en cualquiera de los proyectos, no dude en consultar Únase a nuestra comunidad

Aprendizaje automáticoinformáticaReconocimiento de voz

Related Content

¿Cuáles son las opiniones de Yoshua Bengio sobre Kaggle y el aprendizaje automático competitivo en general?

¿Cuál es el mejor método para presentar la idea de una red neuronal de convolución a un profano?

¿Cómo entrenamos redes neuronales en imágenes en lugar de datos numéricos?

¿Qué es exactamente el sobreajuste? ¿Por que sucede? ¿Cómo afecta a mi modelo?

¿Qué tan popular y extendido es el aprendizaje automático en África?

¿Hay otros fabricantes de CPU además de AMD e Intel?

¿Hay alguna forma de recuperar datos de un disco duro dañado?

Puede hacer un proyecto sobre reconocimiento de emociones en el que su sistema reconocerá la emoción de la persona analizando la voz de la persona.

Inicialmente necesitará mantener una base de datos de diferentes emociones de las personas. Al usar un algoritmo diferente, puede comparar la voz de la persona con su base de datos.
Luego puede aumentar gradualmente su base de datos.
Este proyecto utilizará tanto el procesamiento de la señal como el aprendizaje automático.

Espero que este ans. Su consulta.
Silbido

Arpit Gupta

More Interesting

Karpathy mencionó durante una conferencia que es posible reemplazar la capa FC al final de una CNN con una capa de agrupación promedio. ¿Alguien lo ha intentado?

¿Para qué tipo de problemas de aprendizaje automático no sería adecuado el aprendizaje profundo?

¿Cuáles son algunos marcos de tiempo realistas para dominar diversas habilidades de programación, como el dominio de Python para la ciencia de datos, git, etc.?

¿Qué sistemas IDS, IPS en Network Security hoy en día son los más adaptables para aprender nuevas amenazas? ¿Hay algún tipo de punto de referencia estándar para medir esto?

¿Cuáles son las aplicaciones del tensor en estadística y aprendizaje automático?

¿Se utiliza R en la minería de datos a gran escala en grandes compañías de software como Facebook y LinkedIn?

¿Cuáles son los campos de negocios donde se puede usar la red neuronal?

Para un problema de clasificación (dos clases), ¿es mejor usar dos salidas con softmax o una salida con entropía cruzada binaria?

¿Qué es una explicación intuitiva del impulso en el entrenamiento de redes neuronales?

¿Qué métrica de rendimiento debo elegir para evaluar un modelo de clasificación?

¿Qué es un gran blog para el aprendizaje automático?

¿Qué tan difícil es el aprendizaje automático?

¿Cuál es la mejor manera de encontrar el conjunto de patrones similares en datos de series de tiempo?

¿Cómo se debe contactar a los autores de los libros blancos (y cómo hacer que respondan)?

No tengo dinero para comprar una computadora poderosa, ¿cómo puedo aprender en la GPU?

Web Analytics