Tomemos algo de sabiduría del viejo Homer Simpson.
😀
Los modelos de aprendizaje automático pueden ser sesgados si no se entrenan correctamente.
- ¿Por qué los jóvenes estudiantes dedican más tiempo a la programación competitiva en lugar de otras áreas como aprendizaje automático, seguridad, big data y sistemas operativos?
- ¿Qué debo tomar Machine Learning o realidad aumentada?
- ¿Cuáles son los últimos algoritmos de aprendizaje de los vecinos más cercanos? Me refiero a todo lo que se basa en datos, como métodos basados en instancias, kNN, algoritmos de aprendizaje vecinos y métricos, todo en un solo lugar.
- ¿Por qué utilizamos el agrupamiento en el análisis estadístico? ¿Puedes dar una explicación intuitiva o ejemplos intuitivos?
- Cómo construir una aplicación de predicción de flujo de efectivo personal con extractos bancarios utilizando el aprendizaje automático
Entrene estos modelos en un conjunto de datos sesgado o un conjunto de datos con regularidades inherentes, inventadas y no tan verdaderas, y los modelos los adaptarán en exceso y los tratarán como un hecho. Al igual que los humanos hacen con la información y las historias que se cuentan mientras crecen, por ejemplo (nuestra fase de entrenamiento).
En los temas que más importan, creo que debe confiar en un modelo de aprendizaje automático tanto como confía en la persona / organización detrás de él, especialmente en las fases de recolección de datos, limpieza y extracción de características. Si no confía en ellos o cree que tienen algunas agendas útiles, entonces no debe confiar en sus datos, y de eso se desprende que no debe confiar en el sesgo inherente a su modelado.
Corrija el sesgo en la naturaleza humana, y solo entonces podrá corregir el sesgo en los modelos de aprendizaje automático.