¿Cuál es una buena fuente o explicación sobre la tasa de error de fonema (PER) y la tasa de error independiente de la posición, o la tasa de error de letras?

Cuando tiene dos secuencias de elementos, puede calcular la distancia de edición entre ellos. Esto es básicamente un número mínimo de inserciones, eliminaciones y sustituciones necesarias para convertir una cadena en otra.

Por ejemplo para convertir la secuencia

ABCABD

Si quiero comenzar con el aprendizaje profundo, ¿debería comprar una GPU de gama baja o aprovechar una solución en la nube? ¿Cuál es más barato / mejor?
¿Cuál es una buena manera de aprender aprendizaje profundo para que un estudiante graduado se una a un grupo de aprendizaje profundo de buena reputación?
¿Por qué la regresión logística se considera robusta a los valores atípicos en comparación con un método de mínimos cuadrados?
¿A qué áreas de investigación y aplicaciones se aplica con éxito el aprendizaje automático bayesiano?
¿Cómo entiendes las ecuaciones de MLE para los clasificadores Naive Bayes en el libro de aprendizaje automático de Kevin Murphy?

a

ABCBBDC

Necesita una sustitución A->B y una inserción de C al final. Entonces, la distancia de edición sería 2. La distancia de edición se puede calcular efectivamente con el algoritmo de Levenshtein.

Ahora, si tiene una distancia de edición entre la secuencia de referencia y la hipótesis, puede calcular la tasa de error como

Error_rate_in_percent = 100 * Number_of_edits / Number_of_elements_reference

Esta es una propiedad que caracteriza qué tan bien pronosticó la secuencia objetivo. Para la mejor predicción, la tasa de error sería 0%. La tasa de error podría ser superior al 100% si tiene demasiadas inserciones en la hipótesis.

Si tiene muchas secuencias, puede sumar ediciones en cada una de ellas y sumar el recuento total en cada una de ellas y calcular la tasa de error general.

Ahora, dependiendo de los elementos de la secuencia, puede asignar nombres a la tasa de error. Si los elementos de la secuencia son palabras, tiene una tasa de error de palabras o WER. Si los elementos son teléfonos, tiene una tasa de error de teléfono o PER. Si los elementos son letras, tiene una tasa de error de letras.

Aprendizaje automáticoMensajes de error

Related Content

¿Hay alguna diferencia entre los codificadores automáticos y el codificador-decodificador en el aprendizaje profundo?

¿Por qué Apple no equipa sus máquinas con mejores opciones de tarjeta de video?

¿Qué áreas específicas de las matemáticas son útiles en neurociencia?

¿Cuál es el estado de la investigación sobre chatbots y la PNL en 2017?

Con el desarrollo de marcos informáticos escalables como TensorFlow y Spark, ¿seguirán siendo relevantes los marcos de una sola máquina? NumPy podría ser solo API.

¿Por qué la regresión logística es generalmente resistente al sobreajuste en el aprendizaje automático?

¿El aprendizaje automático va a derrocar al sistema dinámico?

More Interesting

¿Existe una relación entre la detección comprimida y las redes de yacimientos?

¿Cuáles son las deficiencias del aprendizaje profundo? ¿Cuál es el mayor defecto o limitación del aprendizaje profundo?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?

¿Cuáles son algunas reglas de clasificación de pulgares?

Cómo decidir el tema de mi interés de investigación para obtener un doctorado en visión artificial y aprendizaje automático

¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?

¿Hay alguna manera de determinar o reducir las opciones con las que uno debería experimentar para mejorar (por ejemplo) una red neuronal clasificadora de imágenes binarias?

¿Una máquina de máquina virtual de big data ayuda a analizar archivos grandes?

¿Por qué los modelos de aprendizaje automático no funcionan bien cuando se usan en la predicción del mercado de valores en vivo, pero, por otro lado, funcionan muy bien sin conexión?

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

¿Cuántas imágenes se requieren para las redes adversas generativas (GAN)?

¿Qué temas del conjunto de datos son buenos para interactuar?

¿Cuál es la mejor estrategia para un oponente de IA para predecir la ubicación y golpear la pelota en un juego de Pong?

¿Qué es la regresión no lineal vs regresión lineal?

¿Cuál es mejor, el aprendizaje automático de Stanford en Coursera o un nanogrado Udacity?

Web Analytics