¿Cuál es su proceso para diseñar funciones de pérdida para problemas de Machine Learning?

Antes de considerar una función de pérdida, es importante conocer algunos conceptos y comprender cómo afectan el rendimiento / corrección del modelo.

  • Matriz de confusión: una cuadrícula (matriz) de verdaderos positivos (tp), verdaderos negativos (tn), falsos positivos (fp) y falsos negativos (fn)
  • Precisión y recuperación:
    • Precisión: relación entre el recuento de predicciones positivas verdaderas y las predicciones totales: [matemática] tp / (tp + fp) [/ matemática]
    • Recordar: relación del recuento de positivos verdaderos predichos al recuento de verdaderos positivos reales – [matemática] tp / (tp + fn) [/ matemática]
  • Elegir / diseñar una función de pérdida se basaría en qué tipo de errores puede permitirse un modelo. ¿Puede el modelo permitirse falsos positivos / falsos negativos? Por ejemplo, si un modelo predice la posibilidad de una enfermedad mortal según algunos parámetros de salud. Si el modelo predice falso negativo y si está impulsando la decisión de un médico / médico. Sería muy costoso. Como el paciente no recibiría un tratamiento, debería hacerlo.
  • Casi todo el tiempo, hay una función de pérdida disponible en algunas de las bibliotecas de aprendizaje automático y sería muy raro que necesitemos escribir nuestra propia función de pérdida.
  • Los algoritmos de Machine Learning se pueden proporcionar con una función de pérdida personalizada para entrenar. A menudo, esta es una cadena que representa el nombre de una función de pérdida o, a veces, una función que debe implementarse según una definición de función específica. Escribir una función de pérdida que sería invocada por el modelo durante el entrenamiento a veces puede ser complicado. Consulte la documentación oficial si está disponible para los detalles de la función de pérdida personalizada.

More Interesting

¿Cuáles son los grandes problemas de investigación en el reconocimiento de voz hoy?

¿Son el aprendizaje automático / aprendizaje profundo / ciencia de datos, realmente ciencia espacial para que un tipo promedio entienda e implemente?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización de caja negra?

¿Hay proveedores de reconocimiento de voz que aún brinden soluciones de servidor en las instalaciones (no en la nube) en 2017?

Aprendizaje profundo: ¿Una versión suave de unidades lineales rectificadas funciona mejor o peor que una no lineal?

¿Es posible entrenar modelos de aprendizaje automático de procesamiento de datos en dispositivos locales y enviar solo el modelo entrenado al servidor?

¿Qué tipo de matemática se usa en el aprendizaje automático? ¿Puedo aprender ML sin él?

¿Qué problemas o conjuntos de datos existen cuando usar el impulso da mejores resultados que usar un SGD simple?

¿Qué tan popular y extendido es el aprendizaje automático en África?

¿Qué tipos de imágenes se usan generalmente para la clasificación del uso del suelo?

¿Qué parámetros en los datos de entrenamiento / prueba deben considerarse para decidir la elección de un método de clasificación de aprendizaje automático (fuera de SVM, red neuronal, regresión logística, etc.)?

¿Qué tan buena es la Universidad de Edimburgo, en comparación con la CMU para estudios de posgrado e investigación en aprendizaje automático y neurociencia computacional?

¿Por qué la resolución de las imágenes de entrada en la red convolucional debe tener la misma dimensión (ancho y alto)?

¿Qué es apilar en el aprendizaje automático?

¿Qué significa Wabbit?