¿Cuál es la tasa de error de trama (FER) en las tareas de reconocimiento de voz?

Cada teléfono puede durar unos pocos fotogramas. Por ejemplo, supongamos que su grabación contiene la secuencia del teléfono “/ it /” (“comer”), y el cuadro inicial y el cuadro final para esos teléfonos son (1,5) y (6,10), respectivamente. Entonces los marcos se etiquetarían así:

marco 1: i
marco 2: i
marco 3: i
marco 4: i
marco 5: i
marco 6: t
marco 7: t
marco 8: t
marco 9: t
marco 10: t

Supongamos que entrena una red neuronal para mirar un cuadro y predecir qué era el teléfono durante ese cuadro. Podría darte este resultado:

marco 1: i
marco 2: i
marco 3: i
marco 4: i
marco 5: i
marco 6: p (incorrecto)
marco 7: t
marco 8: t
marco 9: t
marco 10: t

En este caso, la tasa de error de cuadro sería del 10%, ya que uno de cada diez cuadros estaba mal etiquetado. La siguiente parte del sistema podría analizar estas salidas y decidir que la secuencia de teléfono más probable era / it /, en cuyo caso la tasa de error del teléfono sería del 0%, ya que tiene 0/2 teléfonos equivocados.

More Interesting

¿Qué sería más beneficioso para un estudiante de tercer año de ECE, hacer aprendizaje automático u otros cursos?

Cómo obtener la etiqueta del tema que modela la salida LDA

Cómo crear la línea de regresión de mínimos cuadrados (error cuadrático medio mínimo) en R

¿Cuál sería un buen enfoque de aprendizaje automático para un bot de comercio de criptomonedas con aproximadamente media docena de parámetros de entrada de estrategia de comercio numérico y una salida numérica (porcentaje de ganancia diaria)? Todos los días el modelo probaría nuevos parámetros.

Los datos financieros fluyen como 'gatos que cambian sus caras porque las computadoras los reconocen en YouTube'. ¿Hay una solución a este problema?

¿Cuáles son los principales puntos de regresión?

¿Dónde entran en juego las funciones de activación en una red neuronal de convolución?

Quiero escribir un trabajo de investigación sobre análisis de sentimientos, pero no sé nada sobre el análisis de sentimientos. ¿Cómo debo proceder?

¿Cuáles son algunos de los mejores trabajos de investigación o libros para el aprendizaje automático?

¿Cuáles son las herramientas / software más utilizados para el aprendizaje automático / big data?

¿Por qué no se prueba bien Theano en otros sistemas que no sean Linux?

¿Qué áreas del aprendizaje automático son más importantes para los fondos de cobertura y los bancos de inversión (en equipos cuantitativos)?

¿Cómo agrupamos el comportamiento de navegación de usuarios similares y seleccionamos características separables?

Cómo realizar análisis de opinión sobre noticias del mercado de valores

¿Cuáles son las ventajas de la regresión logística?