Gracias por A2A. No he investigado este tema extensamente, así que tome mi respuesta con un grano de sal.
NN es el algoritmo de aprendizaje automático de caja negra por excelencia. Lo que a menudo encuentra son soluciones para obtener un cierto grado de comprensión de lo que está haciendo la red. Esos generalmente implican tomar las predicciones del NN y modelar aquellas que usan un agoritmo más comprensible como una regresión o un árbol de decisión. El éxito de esas aproximaciones en la descripción de lo que realmente hace el NN está en debate.
Personalmente, nunca he encontrado que esto sea un gran problema por esta razón: el rendimiento del modelo frente a la interpretabilidad es una de esas cosas en las que pasas tiempo pensando cuando comienzas un proyecto. El equilibrio que decida alcanzar depende del problema particular que tenga entre manos. A veces, todo lo que importa es el rendimiento del modelo (piense en la detección de fraude, por ejemplo, donde el algoritmo estándar es esencialmente un NN). La interpretación de otros modelos de tiempo es de suma importancia (piense en la calificación crediticia, en la que tiene que poder explicar por qué se le niega un préstamo a alguien; aquí una regresión logística simple construida con una salida de tarjeta de puntaje en mente es un estándar de la industria). Otras veces, y esto es lo que me encuentro haciendo la mayoría de las veces, encontrará que un equilibrio es suficiente. En mi caso, un modelo que funcione bien, como un árbol de Gradient Boosting, y una comprensión simple de importancia variable será una solución satisfactoria.
- ¿El aprendizaje automático está sacando a los expertos en la materia (SME) de la ecuación de desarrollo técnico?
- ¿Cuáles son los idiomas más importantes para un ingeniero de aprendizaje automático?
- ¿Existe un algoritmo de ML capaz de resolver esto?
- Un gobierno global dirigido por una IA diseñada para alcanzar la prosperidad en todos los países del planeta eliminaría las armas mundiales de una vez, ¿correcto?
- ¿Cuáles son algunos de los datos interesantes sobre inteligencia artificial que todo estudiante de informática debería saber?
Dicho todo esto, tenga cuidado al usar los árboles de decisión para inferir “una historia” para salir y contar el negocio. Esa es una perspectiva muy intrigante, que estoy seguro de que el negocio podría saltar. Pero recuerde que los árboles de decisión son modelos muy inestables, lo que significa que una ligera variación en los datos (o incluso solo la semilla) podría dar como resultado un nuevo modelo que funcione tan bien como el anterior pero con una “historia” totalmente diferente. Uno podría sugerir que las hembras blancas jóvenes de Kansas son sus mejores clientes, el otro podría sugerir que las personas que aman los plátanos y tienen al menos dos mascotas son sus mejores clientes. Dos modelos igualmente buenos, pero dos estrategias muy diferentes desde una perspectiva empresarial.