¿Cuál es el método para encontrar la parte no reconocida de los resultados del aprendizaje automático y complementarla para alcanzar el 100%?

La pregunta supone que existe un clasificador que alcanza el 100%. Este no es el caso para muchas tareas.

  • A veces, los datos son ruidosos: tomados de instrumentos con precisión limitada, tomados de fuentes que no son puramente objetivas (por ejemplo, expertos humanos), o incluso corrompidos en el dispositivo de almacenamiento debido al mal funcionamiento del hardware o los rayos cósmicos.
  • A veces, la función objetivo es ruidosa: predecir el clima con una semana de anticipación a partir de una entrada limitada nunca conducirá a un clasificador 100% preciso.
  • Incluso teniendo en cuenta lo anterior, hay un problema más crucial con cualquier enfoque de aprendizaje automático: cualquier algoritmo solo podrá aprender modelos de una clase específica. Hacer que los modelos sean más complejos es más probable que conduzca a un ajuste excesivo de los datos de entrenamiento, lo que implica que probablemente deberíamos usar alguna técnica de detención temprana, lo que significa que ni siquiera podríamos alcanzar el 100% en el conjunto de entrenamiento en sí.
  • Incluso cuando conocemos la clase correcta de clasificadores, puede haber datos cercanos al límite de decisión que nunca hemos visto antes (por ejemplo, en el margen de un SVM). Para tales puntos, el modelo no puede saber con certeza cuál es la clase correcta.

More Interesting

Cómo usar Azure Machine Learning para la clasificación de documentos

¿Cuál es la diferencia entre IA, aprendizaje automático y aprendizaje profundo?

¿Cuál es el alcance del aprendizaje automático en la verificación?

Cómo leer esta arquitectura de red neuronal convolucional

¿Cómo puede una red neuronal ser capaz de razonamiento simbólico? ¿Cómo puede unir variables?

¿Es GitHub o GitLab más adecuado para una empresa de ciencia de datos / ML?

¿Puedo comenzar a aprender el aprendizaje automático y el aprendizaje profundo sin repasar primero mis conocimientos de matemáticas?

¿Puedo incluir el aprendizaje automático en mi currículum después de aprender scikit-learn?

¿Qué es un "conjunto típico" en la estimación de densidad de probabilidad para la inferencia bayesiana?

Cómo explicar el desempeño de un modelo predictivo a la gerencia que no conoce el aprendizaje automático

¿Por qué es importante la clasificación en papel de ImageNet con redes neuronales convolucionales profundas?

¿Cuáles son los mejores clasificadores de código abierto para detectar spam, basura y blasfemias en el contenido generado por el usuario, como los tweets?

¿Existe algún audiolibro 'técnico' realmente bueno para la investigación de operaciones o el aprendizaje automático, aparte del algoritmo maestro?

¿Por qué el libro de Murphy dice en el clasificador generativo que no tenemos que volver a entrenar el modelo cuando agregamos más clases?

¿Por qué no se prueba bien Theano en otros sistemas que no sean Linux?