Gracias por el A2A! Es una buena práctica incluir EDA en su flujo de trabajo cuando trabaja hacia el aprendizaje profundo, ya que le ayuda a construir mejores modelos porque comprende mejor sus datos y evalúa y / o mejora la calidad de los datos .
El análisis de datos exploratorios (EDA) se utiliza, por un lado, para responder preguntas, evaluar supuestos comerciales y generar hipótesis para un análisis posterior. Por otro lado, también puede usarlo para preparar los datos para el modelado.
Los pasos básicos en el proceso EDA (pueden) incluyen una descripción básica de sus datos, consultar / indexar sus datos, ingeniería de características, explorar / identificar / resolver los desafíos que los datos le plantean (valores perdidos, valores atípicos, …) y encontrar patrones en tu información. Puede encontrar un tutorial gratuito de Python sobre EDA con Pandas aquí: Tutorial de análisis de datos exploratorios de Python.
- ¿Qué es la limpieza de datos como en Machine Learning y cómo se hace?
- Soy estudiante de primer año del programa de maestría en análisis y recuperación de información en la Universidad de Michigan. Rutinariamente trabajo con cerdo y colmena y soy muy hábil con Python y R, pero ¿son suficientes o necesito ser doctorado antes de comenzar una carrera en ciencias de datos?
- ¿Cuáles son los buenos libros que proporcionan casos de estudio en ciencia de datos?
- ¿Cuál es el extremo superior absoluto que puede ganar un científico de datos?
- Quiero tener una carrera en análisis de datos, sin embargo, no tengo habilidades de codificación informática. ¿Puedo sobrevivir con Microsoft Excel, Tableau y conocimiento estadístico?
Además, puede profundizar en un aspecto específico de EDA, que es el perfil de datos . Usas esto para evaluar la calidad de los datos. El perfil de datos tiene que ver con resumiendo su conjunto de datos a través de estadísticas descriptivas. Puede encontrar un tutorial sobre el perfil de datos con Pandas aquí: Análisis de datos exploratorios de cervezas artesanales: perfil de datos
Vea un ejemplo de cómo EDA puede ayudarlo a comprender su análisis de datos y construir modelos de aprendizaje profundo: Tutorial de Keras: Aprendizaje profundo en Python.