¿Qué es la ganancia de información en el aprendizaje automático?

Sin ser demasiado técnico, en resumen:

La ganancia de información puede entenderse como una disminución en la “incertidumbre” del resultado.

En el aprendizaje automático, especialmente cuando se usan árboles de decisión a medida que avanzamos en cada paso para resolver un problema o predecir el resultado, el nivel de incertidumbre disminuye a medida que el algoritmo se vuelve más preciso en el nivel de cada hoja progresiva. Esto puede tratarse como el conocimiento adquirido por el algoritmo para resolver un problema de clasificación particular.

Un ejemplo de libro de texto de ganancia de información predice el género de un bebé nonato.

  1. En el primer paso, cuando la madre queda embarazada, el género del feto puede ser masculino o femenino y la incertidumbre es alta o, en el mejor de los casos, tiene un 50% de certeza o incertidumbre sobre la predicción.
  2. Sin embargo, en el momento de la primera prueba de ultrasonido en el primer trimestre, la certeza de la predicción mejora, digamos que llega al 75%. La caída de la incertidumbre es la pérdida de entropía y esa también es su Ganancia de Información o Conocimiento , porque la pérdida de entropía ha resultado en una ganancia igual de certeza.
  3. Ahora, después de la ecografía en el tercer trimestre del embarazo, no hay incertidumbre y la predicción puede estar cerca del 100% de certeza.

Para calcular matemáticamente, consideremos un ejemplo de un árbol de decisión para predecir si habrá un juego de golf hoy o no.

El resultado aquí depende del pronóstico o pronóstico del tiempo.

Entonces, la ganancia aquí al predecir PlayGolf en presencia de Outlook será la diferencia entre

“Entropía cuando se trata de predecir PlayGolf solo”

y

“Entropía al intentar predecir PlayGolf con conocimiento de Outlook” para el día.

Desde aquí puede profundizar en el algoritmo y las matemáticas sobre ganancia y entropía.

Espero que lo anterior haya ayudado.

¡Aclamaciones!

Cuando intentamos construir el Árbol de decisión , comenzamos con un nodo raíz y agregamos recursivamente nodos secundarios hasta que encajamos perfectamente con los datos de entrenamiento. El problema que enfrentamos es determinar qué atributo en un conjunto dado de vectores de características de entrenamiento es más útil para discriminar entre las clases a aprender. Para hacer esto, utilizamos entropía y ganancia de información. La entropía nos da la medida de impureza en nuestra clase. Cuanto menor es la entropía, mejor es la salida. La entropía generalmente cambia cuando usamos un nodo en un árbol de decisión para dividir las instancias de entrenamiento en subconjuntos más pequeños. La ganancia de información es una medida de este cambio en la entropía. La ganancia de información nos dice cuán importante es un atributo dado de los vectores de características. Lo usaremos para decidir el orden de los atributos en los nodos de un árbol de decisión.

Sugerencia: hay muy buenas matemáticas involucradas. Entonces, tómate tu tiempo y ve paso a paso. Trate de comprender qué es el árbol de decisión, qué hace y cómo. Mientras cubre estas preguntas, se enfrentará al tema de qué es la entropía y la ganancia de información y cómo calcularlas.

La mejor de las suertes. 🙂

Hagámoslo simple.

Su cerebro comprende los patrones de hacer cosas, qué decir cuándo, cómo y dónde actuar y todo lo que funciona. Se basa en un mecanismo de retroalimentación + mecanismo de retención de memoria.

Eso también lo mapeamos en Machine Learning

More Interesting

¿Cuál es la diferencia entre la red neuronal y la regresión logística?

¿Cómo puede beneficiarse el sector financiero con el uso de LD y AI?

¿Dónde están los temas interesantes que se cruzan con la neurociencia y el aprendizaje automático?

¿Podrían las entradas del algoritmo de entrenamiento Perceptron tener diferentes tipos?

Cómo obtener todos los problemas de investigación en el aprendizaje por refuerzo

¿Cuáles son algunos de los requisitos previos necesarios para aprender el aprendizaje automático o la inteligencia artificial?

¿Qué algoritmos (aprendizaje automático y aprendizaje profundo) funcionan con un pequeño conjunto de datos, sin sobreajustarlo?

¿Puede un desarrollador de aprendizaje profundo atrapar criminales que abusan de niños?

¿Qué especificaciones de computadora se recomiendan para entrenar redes neuronales?

¿Debería estudiar aprendizaje automático, aprendizaje profundo o aprendizaje de refuerzo?

Si quiero aprender mucho sobre IA, aprendizaje automático y ciencia de datos, y no tengo absolutamente ninguna experiencia sobre ellos, ¿por dónde empiezo?

Cómo identificar la ubicación de cualquier mensaje de texto usando ML o NLP

¿Qué biblioteca de Java utilizas para los algoritmos genéticos? ¿Por qué?

Cómo aprender el aprendizaje automático desde el nivel cero

¿Hay alguna empresa india que trabaje con IA y aprendizaje automático? En caso afirmativo, ¿en qué campo y en qué se diferencia de otros en ese campo?