¿Por qué necesitamos medir la entropía de la información en el aprendizaje automático?

¡Porque te ayuda a medir el desorden! La variedad no siempre te da lo que quieres. Permítanme dar un ejemplo de aplicación de Entropy en ML. Cuando diseñamos árboles de decisión, intentamos obtener nodos “más puros” cuando dividimos el nodo en el que nos encontramos mediante una prueba. Sin embargo, casi nunca está claro qué prueba debería ser. Por lo tanto, probamos todas las pruebas y observamos los nodos emergentes y su pureza. ¿Por qué? Porque, cuando son más puros, el árbol tiende a ser más corto en términos de profundidad. En este caso, Entropy lo ayuda a medir la “impureza” y en el siguiente paso puede calcular la “Ganancia de información”, que es simplemente la diferencia entre la entropía del nodo padre y el promedio ponderado de la entropía de los nodos hijos (la idea de IG era muy confusa para mí, ya que tomé un curso de termodinámica antes y tenía una fuerte comprensión de la entropía en un sentido físico). También hay un índice de Gini y un error de clasificación errónea para este propósito, pero AFAIK Entropy es el más común.

Aprendizaje automáticoinformáticaTeoría de la información

Related Content

¿Es bueno tener más y más parámetros capturados para los datos de calificación crediticia? ¿Los algoritmos comienzan a fallar / se vuelven inexactos si hay demasiados atributos en los datos? ¿Cómo se pueden erradicar los parámetros que no son muy útiles?

¿El tiempo que tarda un navegador en cargar una página depende de la cantidad de líneas de códigos? ¿Pueden más líneas cargarse más rápido en algunos casos que menos?

¿Cómo maneja Google los problemas de escalabilidad en su motor de búsqueda dado que todos los días, casi todos en el mundo educado buscan en Google?

Cómo aumentar el rendimiento de mi computadora manualmente

¿Cuáles son los temas y blogs específicos de Quora que debe seguir un dominio geek en informática / ingeniería de software?

¿Qué es la ley de Moore? ¿Está terminando?

Computación de alto rendimiento: ¿para qué se utiliza una supercomputadora?

More Interesting

¿Qué hace que Carnegie Mellon sea tan bueno en informática?

¿Cómo se aplica el aprendizaje automático al chat bot?

¿Por qué mi BIOS se retrasa?

¿Cuál es la mayor ironía de ser un estudiante de ingeniería?

¿Cómo afecta el bloqueo global del intérprete al rendimiento en aplicaciones Python de subprocesos múltiples?

¿Qué es un índice agrupado?

¿Cómo ayuda la inteligencia artificial? ¿Cuáles son algunas ventajas y desventajas?

¿Cuáles son algunas ideas de proyectos para estudiantes universitarios relacionadas con el aprendizaje automático y el IoT?

¿Cuál es la diferencia entre un error de día cero y una puerta trasera?

¿Hacia dónde se dirigirá la investigación de aprendizaje automático en los próximos 5 años? ¿Cuáles serán las áreas más emocionantes y prometedoras?

¿Cuál es el procedimiento para publicar un artículo de informática?

¿Alguien está tratando de demostrar que P! = NP?

Tengo un problema de algoritmo. ¿Como puedó resolver esté problema?

Cómo escribir una solución Bactrack de un problema

¿Cuál es el uso de la teoría del Grupo de Renormalización fuera de la física cuántica?

Web Analytics