¿Cuál es la tasa de error de trama (FER) en las tareas de reconocimiento de voz?

Cada teléfono puede durar unos pocos fotogramas. Por ejemplo, supongamos que su grabación contiene la secuencia del teléfono “/ it /” (“comer”), y el cuadro inicial y el cuadro final para esos teléfonos son (1,5) y (6,10), respectivamente. Entonces los marcos se etiquetarían así:

marco 1: i
marco 2: i
marco 3: i
marco 4: i
marco 5: i
marco 6: t
marco 7: t
marco 8: t
marco 9: t
marco 10: t

Supongamos que entrena una red neuronal para mirar un cuadro y predecir qué era el teléfono durante ese cuadro. Podría darte este resultado:

marco 1: i
marco 2: i
marco 3: i
marco 4: i
marco 5: i
marco 6: p (incorrecto)
marco 7: t
marco 8: t
marco 9: t
marco 10: t

En este caso, la tasa de error de cuadro sería del 10%, ya que uno de cada diez cuadros estaba mal etiquetado. La siguiente parte del sistema podría analizar estas salidas y decidir que la secuencia de teléfono más probable era / it /, en cuyo caso la tasa de error del teléfono sería del 0%, ya que tiene 0/2 teléfonos equivocados.

More Interesting

¿Me pueden ayudar a encontrar e identificar mi idea de doctorado? (¿Aprendizaje profundo y análisis de Big Data Twitter Sentiment?)

¿Cómo podría el posmodernismo cambiar el aprendizaje automático?

¿Es la precisión proporcional al número de capas ocultas y las unidades de cada capa en la red neuronal?

Cómo probar la idoneidad de diferentes funciones del núcleo en un proceso gaussiano (GP) en el modelado de una función

Cómo hacer clustering para datos categóricos

¿Cuál es la diferencia entre adaboost y el clasificador de perceptrones de una capa?

¿Cómo validaría un modelo que creó para generar un modelo predictivo de una variable de resultado cuantitativa mediante regresión múltiple?

Estoy interesado en el aprendizaje automático y la inteligencia artificial y recién comencé a aprender Python. ¿Qué otras habilidades debo tener en mi haber para tener éxito en este campo?

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

Algunas cosas "fueron modeladas como procesos de Poisson". ¿Qué quieren decir con eso?

¿Cuál es la forma correcta y deseable de hacer un asistente personal / bot de chat usando AI, ML y NLP?

¿Qué métodos de conjunto / aprendizaje automático pueden incorporar covariables que varían con el tiempo?

¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?

¿Por qué la biblioteca de estadísticas de Python es tan limitada en métodos bioestadísticos avanzados en comparación con R, mientras que la biblioteca de Python de Machine Learning es mucho mejor?

¿Cuál es la relación entre la teoría de la Gestalt y el aprendizaje profundo?