En una fase de diseño , primero dedicaría más esfuerzo a la pregunta , para informar el análisis de los datos.
Primero una categorización básica (descriptiva / exploratoria / inferencial / predictiva / causal o mecanicista), luego obtenga una comprensión profunda del problema a resolver. Lo que es difícil puede no ser la elección del algoritmo, sino analizar los flujos y los datos juntos.
Esa es la parte del “deporte de equipo” de ML, cuando el conocimiento del dominio y la comunicación son esenciales.
- ¿Es peligroso un robot inteligente?
- ¿Crees que los robots puedan convertirse en enemigos de la humanidad?
- ¿Qué es la intuición del filtro de partículas?
- ¿Qué gigantes tecnológicos están invirtiendo más en inteligencia artificial y cuáles son sus planes a largo plazo?
- ¿Cómo procesa el cerebro humano o cualquier cerebro animal la información en comparación con los procesadores informáticos actuales? ¿Cómo pueden los cerebros "codificarse" por sí mismos?
Ejemplo: un hospital realizó un estudio para averiguar qué pacientes con neumonía tienen riesgo de complicaciones. Problema complejo, muchas características, muchos datos. Se utilizan muchos enfoques, incluidas las redes neuronales de aprendizaje profundo. El rendimiento predictivo se evalúa con métricas. Las métricas de aprendizaje profundo son las mejores. Hasta que alguien note que la máquina está enviando pacientes a casa con asma. Estos pacientes corren un alto riesgo y siempre se envían a cuidados intensivos, por lo que no informaron complicaciones. Una situación manejable, excepto por las capas de redes neuronales que seguían aprendiendo una señal en estos pacientes “en algún lugar”. El algoritmo de mejor desempeño desde una perspectiva de métrica también fue defectuoso.
En la fase de implementación , más que métricas, ejecutaría una lista de verificación: por ejemplo, para la agrupación, ¿se sabe k? ¿Las formas de mis grupos parecen simples? ¿son del mismo tamaño ?, ¿tengo muchos valores atípicos ?, ¿mis datos son nítidos o confusos ?, etc.
Los algoritmos tienen suposiciones y un “punto óptimo”. Puede comenzar con las soluciones más simples, ver dónde está con los supuestos, y solo si tiene problemas, busque algo más exótico.