¿Cuál es una buena fuente o explicación sobre la tasa de error de fonema (PER) y la tasa de error independiente de la posición, o la tasa de error de letras?

Cuando tiene dos secuencias de elementos, puede calcular la distancia de edición entre ellos. Esto es básicamente un número mínimo de inserciones, eliminaciones y sustituciones necesarias para convertir una cadena en otra.

Por ejemplo para convertir la secuencia

ABCABD

a

ABCBBDC

Necesita una sustitución A->B y una inserción de C al final. Entonces, la distancia de edición sería 2. La distancia de edición se puede calcular efectivamente con el algoritmo de Levenshtein.

Ahora, si tiene una distancia de edición entre la secuencia de referencia y la hipótesis, puede calcular la tasa de error como

Error_rate_in_percent = 100 * Number_of_edits / Number_of_elements_reference

Esta es una propiedad que caracteriza qué tan bien pronosticó la secuencia objetivo. Para la mejor predicción, la tasa de error sería 0%. La tasa de error podría ser superior al 100% si tiene demasiadas inserciones en la hipótesis.

Si tiene muchas secuencias, puede sumar ediciones en cada una de ellas y sumar el recuento total en cada una de ellas y calcular la tasa de error general.

Ahora, dependiendo de los elementos de la secuencia, puede asignar nombres a la tasa de error. Si los elementos de la secuencia son palabras, tiene una tasa de error de palabras o WER. Si los elementos son teléfonos, tiene una tasa de error de teléfono o PER. Si los elementos son letras, tiene una tasa de error de letras.

More Interesting

¿Existe una relación entre la detección comprimida y las redes de yacimientos?

¿Cuáles son las deficiencias del aprendizaje profundo? ¿Cuál es el mayor defecto o limitación del aprendizaje profundo?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?

¿Cuáles son algunas reglas de clasificación de pulgares?

Cómo decidir el tema de mi interés de investigación para obtener un doctorado en visión artificial y aprendizaje automático

¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

¿Hay alguna manera de determinar o reducir las opciones con las que uno debería experimentar para mejorar (por ejemplo) una red neuronal clasificadora de imágenes binarias?

¿Una máquina de máquina virtual de big data ayuda a analizar archivos grandes?

¿Por qué los modelos de aprendizaje automático no funcionan bien cuando se usan en la predicción del mercado de valores en vivo, pero, por otro lado, funcionan muy bien sin conexión?

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

¿Cuántas imágenes se requieren para las redes adversas generativas (GAN)?

¿Qué temas del conjunto de datos son buenos para interactuar?

¿Cuál es la mejor estrategia para un oponente de IA para predecir la ubicación y golpear la pelota en un juego de Pong?

¿Qué es la regresión no lineal vs regresión lineal?

¿Cuál es mejor, el aprendizaje automático de Stanford en Coursera o un nanogrado Udacity?