Esta es una respuesta derivada del popular libro Deep Learning de Ian Goodfellow, Yoshua Bengio y Aaron Courville (varios nombres respetados en el campo).
Por “100% de precisión”, supongo que está hablando de la precisión de la prueba – el rendimiento de su modelo en datos que fueron excluidos de la capacitación. Lograr una precisión de entrenamiento del 100% es trivial: ¡solo crea un modelo que memorice cada ejemplo de entrenamiento! Sin embargo, dicho modelo no sería útil, ya que sería incapaz de generalizar a ejemplos no vistos (por ejemplo, los datos de la prueba).
–
- ¿Cuáles son los pros y los contras de las redes neuronales desde una perspectiva práctica? Comentarios personales de grandes usuarios bienvenidos.
- ¿Cuáles son los temas candentes en el aprendizaje automático en 2016?
- ¿Cómo es útil el aprendizaje automático en el mundo real?
- ¿Cómo mantiene Facebook una lista de amigos para cada usuario? ¿Mantiene una tabla separada para cada usuario?
- Cómo comenzar con el aprendizaje automático
La respuesta principal
La mayoría de los procesos en este mundo pueden modelarse razonablemente como estocásticos. Por ejemplo, podemos modelar el tiempo que lleva cepillarse los dientes todas las mañanas como una variable aleatoria que sigue alguna distribución de probabilidad. Existe incertidumbre sobre el tiempo que lleva cepillarse los dientes: algunos días pueden demorar 3 minutos y otros días pueden demorar 15 minutos (porque tropezó con su gato y también tuvo que amamantar un moretón nuevo).
Los datos solo describen el mundo que nos rodea. En consecuencia, podemos pensar en la mayoría de los datos como aleatorios, generados por una distribución de probabilidad ruidosa. Un modelo de aprendizaje automático intenta aprender esta distribución subyacente generadora de datos. El modelo ideal sería uno que comprenda perfectamente esta distribución. Sin embargo, debido a que hay (probablemente) algo de ruido en la distribución, incluso un modelo tan ideal a veces cometería errores. Esto se llama Bayes Error .
Por supuesto, con un conjunto de prueba lo suficientemente pequeño, es posible una precisión del 100%. Sin embargo, a medida que continúe agregando más y más muestras de prueba, es probable que su modelo comience a cometer algunos errores debido a las razones explicadas anteriormente.