¿De dónde puedo aprender XGBoost? Quiero aprenderlo desde cero y no solo la implementación.

XGBoost es un algoritmo muy amplio utilizado para el modelado predictivo. Es uno de los algoritmos más utilizados por los científicos de datos en general, principalmente debido a su poder para manejar conjuntos de datos muy irregulares donde otros algoritmos fallan.

Como científico de datos / entusiasta de la ciencia de datos, usted va en la dirección perfecta no solo aprendiendo la implementación, sino entendiendo XGBoost en su núcleo y aprendiendo lo que está debajo del capó.

Este artículo de Tianqi Chen y Carlos Guestrin de la Universidad de Washington es un buen punto de partida para XGBoost.

El siguiente paso sería aprender del maestro, Tong He, ganador de la competencia organizada por Kaggle con su increíble solución basada en XGBoost. Aquí hay un video de su explicación.

Esta sería mi tercera parada en mi viaje a XGBoost. Este tutorial sobre HackerEarth de Manish Saraswat explica muy bien XGBoost.

El segundo último lugar leído estaría en la documentación misma.

El último artículo sería de un Gran Maestro de Kaggle: un maestro de Kaggle explica el aumento de gradiente

Próximo paso ?

Comience a implementar XGBoost en conjuntos de datos reales.

Aquí hay un par de conjuntos de datos para comenzar

Duración del viaje en taxi de la ciudad de Nueva York
Clasificación de delitos de San Francisco

Espero que esto responda bien a tu pregunta

Aprender cosas nuevasAprendizaje automáticoCiencia de datosProgramación informática

Related Content

¿Puedo usar el agrupamiento (técnicas de minería de datos) para la detección de cuentas falsas en las redes sociales?

Cómo hacer un trabajo orientado a la investigación en big data

¿Los Sistemas de aprendizaje natural, como Watson Analytics de IBM, alguna vez reemplazarán la necesidad de aprender código para un científico de datos?

Como licenciado en Ciencias de la Computación, ¿debería seguir un aprendizaje teórico de aprendizaje automático o un aprendizaje de aprendizaje automático aplicado?

¿Cuál es la mejor tecnología, ciencia de datos o big data?

¿Es necesario el conocimiento de AWS para la ciencia / análisis de datos?

Tengo 28 años y he estado trabajando como auditor financiero durante los últimos 5 años. Quiero saltar al área de ciencia de datos y blockchain y seguir mi carrera en estos campos. ¿Cómo puedo hacer eso?

More Interesting

¿Qué papel debería elegir / jugar, si quiero trabajar en Big Data Analytics / Machine Learning?

¿Es la información de sistemas informáticos (CIS) una buena especialidad para la ciencia de datos?

¿Cuáles son las buenas universidades / colegios para MS en análisis / análisis de negocios / análisis de datos / ciencia en los Estados Unidos?

¿Cuáles son algunos de los análisis de datos más interesantes que se hayan hecho?

¿Cuál es el lenguaje de programación más común / importante para la ciencia de datos?

¿Qué son las pruebas de Big Data y un ejemplo de ello?

¿Qué lenguaje de script puede funcionar con Big Data?

Cómo medir la calidad de un proyecto de ciencia de datos

¿Qué es mejor para un estudiante de análisis de datos para estudiar, aprendizaje automático o series de tiempo? Tenemos que elegir uno como módulo electivo

¿La ciencia de datos necesita estadísticas?

¿Cuál es el salario base de un científico de datos en Airbnb?

¿Quién gana más? Analista de datos o analista de negocios?

¿Cuál es un mejor tema para estudiar, SDN o big data?

¿Cuáles son las tecnologías de big data utilizadas en el almacenamiento de datos?

¿Cómo puede un aspirante a científico de datos con experiencia en estadísticas aprender más sobre bases de datos, ETL, almacenamiento de datos?

Web Analytics