¿Qué es un clasificador ‘codicioso’?

Un algoritmo “codicioso” es aquel que toma las mejores soluciones posibles en cada paso con el resultado de que a veces no se encuentra la mejor solución real. Por ejemplo, suponga que tiene un gráfico de red y está tratando de ir del punto A al punto B con los puntos X, Y y Z entre A y B. Digamos que ir del punto A al X cuesta 1, A a Y cuesta 2, A a Z cuesta 3, X a B cuesta 10, Y a B cuesta 1 y Z a B cuesta 5. Mirando la red general, la mejor ruta (de menor costo) es de A a Y a B (costo de 3). Un algoritmo codicioso tomaría el costo más bajo en cada paso y comenzaría eligiendo X y luego iría a B con un costo total de 11 (mucho más alto que el 3). Este es un algoritmo “codicioso”.

Un clasificador “codicioso” sería un algoritmo similar que da como resultado la clasificación de un objeto en particular. Por lo tanto, no creo que el clasificador en sí sea “codicioso”, sino que el algoritmo utilizado para crear / construir el clasificador se consideraría “codicioso”. Por ejemplo, si está construyendo un árbol de decisión, debe decidir qué variable dividir en cada nodo. Una forma de hacer esto es una métrica de “ganancia de información” y elegirá la variable que resulte en la mayor ganancia de información (esta es la parte codiciosa). Esto podría conducir a un clasificador menos que óptimo (cualquiera que sea el criterio que esté optimizando). Hay varias técnicas disponibles para ayudar a combatir este problema (a menudo basadas en algún tipo de aleatoriedad de elegir variables o fusionar múltiples modelos).

AlgoritmosCiencia de datos

Related Content

¿Cómo se usa Data Analytics en finanzas (específicamente Hedge Funds)?

¿La programación es una ciencia? Si es así, ¿por qué nadie usa el núcleo de la ciencia, el método científico, para ello?

¿Cuáles son algunos buenos problemas con los juguetes en la ingeniería de datos?

¿Cuáles son los proyectos de ciencia de datos más interesantes en Quora?

Soy un estudiante de 4º año de ingeniería química en India (IIT). Deseo obtener un título en ciencia de datos en los Estados Unidos. ¿Alguien puede sugerir buenas universidades adecuadas para mi perfil?

¿Un kit de línea eléctrica de 1000Mbps ofrece velocidades de Internet significativamente más rápidas que un kit de 500Mbps?

¿Hay algún enrutador dual SIM 4G que pueda combinar la velocidad o el equilibrio de carga?

More Interesting

¿Cómo influye Big Data en la gestión del talento?

¿Los estadísticos están siendo reemplazados gradualmente y actualmente por científicos de datos?

¿Alguna vez hay una buena razón para cambiar los datos sin procesar al realizar análisis estadísticos o modelos?

¿Cuáles son las diversas áreas de investigación en ciencia de datos?

¿Por qué amas la ciencia de datos?

¿Cuál es el mejor libro para aprender Python para la ciencia de datos?

¿Cuál es el significado del procesamiento de datos?

¿Qué instituto es mejor para un curso de ciencia de datos en Pune?

¿Cómo gestionan sus datos las grandes empresas?

Cómo cambiar de ingeniería de datos a modelos de construcción, aprendizaje automático, etc.

¿Cuál de estos cursos debo tomar en edureka.co para convertirme en un científico de datos?

¿Qué tipo de trabajos caen entre un desarrollador web y un científico de datos?

¿Cómo compararía el aprendizaje de la ciencia de datos de cursos pagos como Cloudera y cursos gratuitos como Udacity y Coursera?

¿Existe algún beneficio de saber que Java debe seguir el camino de ser un científico de datos o puede tomarse como un complemento? (Java-as Map reduce los requisitos previos: análisis de Big Data)

Si me uno a Microsoft como Científico de datos sénior y obtengo un rendimiento superior al promedio, ¿cuánto tiempo debo esperar para llegar al nivel principal?

Web Analytics