¿El análisis exploratorio de datos no es necesario para el aprendizaje profundo?

Gracias por el A2A! Es una buena práctica incluir EDA en su flujo de trabajo cuando trabaja hacia el aprendizaje profundo, ya que le ayuda a construir mejores modelos porque comprende mejor sus datos y evalúa y / o mejora la calidad de los datos .

El análisis de datos exploratorios (EDA) se utiliza, por un lado, para responder preguntas, evaluar supuestos comerciales y generar hipótesis para un análisis posterior. Por otro lado, también puede usarlo para preparar los datos para el modelado.

Los pasos básicos en el proceso EDA (pueden) incluyen una descripción básica de sus datos, consultar / indexar sus datos, ingeniería de características, explorar / identificar / resolver los desafíos que los datos le plantean (valores perdidos, valores atípicos, …) y encontrar patrones en tu información. Puede encontrar un tutorial gratuito de Python sobre EDA con Pandas aquí: Tutorial de análisis de datos exploratorios de Python.

Además, puede profundizar en un aspecto específico de EDA, que es el perfil de datos . Usas esto para evaluar la calidad de los datos. El perfil de datos tiene que ver con resumiendo su conjunto de datos a través de estadísticas descriptivas. Puede encontrar un tutorial sobre el perfil de datos con Pandas aquí: Análisis de datos exploratorios de cervezas artesanales: perfil de datos

Vea un ejemplo de cómo EDA puede ayudarlo a comprender su análisis de datos y construir modelos de aprendizaje profundo: Tutorial de Keras: Aprendizaje profundo en Python.

Análisis de datosAprendizaje automáticoAprendizaje profundoCiencia de datosMinería de datos

Related Content

¿Dónde puedo encontrar conjuntos de datos abiertos gratuitos para ganar experiencia como Business Intelligence y Data analyst?

¿Qué significa "casi todas las herramientas de software estadístico disponibles para los científicos alientan el modelado paramétrico y, por lo tanto, el diseño de experimentos basados en suposiciones sobre la distribución de datos que están equivocados"?

Cómo manejar grandes cantidades de datos generados a partir de varias fuentes de datos

¿En qué cosas tienen que pasar el tiempo los científicos de datos que preferirían no hacerlo?

¿La 'arquitectura lambda' sigue siendo la mejor manera de construir canalizaciones de datos a gran escala (en 2017) o ha sido reemplazada por otras arquitecturas?

Cómo convertirse en un científico de datos en 4-5 meses si no tengo experiencia previa con ningún lenguaje de programación

¿De qué depende físicamente una conexión de red? Si la tierra explotara, ¿qué pasaría con Internet?

Para cualquier tipo de procesamiento de datos, se recomienda que el primer paso que se tome sea analizar los datos para eliminar valores atípicos, detectar datos incompletos, etc.

Supongo que por análisis exploratorio de datos quieres decir eso, haciendo un análisis previo y eventualmente filtrando y normalizando los datos.

El aprendizaje profundo es (hablar en la práctica) tratando de encontrar patrones en los datos que son difíciles de obtener “visualmente” porque hay muchos datos y / o la estructura de los datos es compleja, mediante el uso de procesadores potentes (GPU, al menos) y muchos tiempo de cálculo (horas, días, semanas …). Si arroja datos incorrectos a la “máquina”, terminará con resultados no deseados y también gastará recursos computacionales sin ningún beneficio …

Karlijn Willems

El análisis exploratorio de datos es para la comprensión humana de los datos por su valor nominal. El aprendizaje profundo o el aprendizaje automático se trata de abstraer el comportamiento de los datos en un modelo matemático. Para responder a su pregunta, no, no la necesita, ya que ambos están destinados a diferentes propósitos.

Karlijn Willems

El aprendizaje profundo es más como un paso en una línea de producción. El análisis de datos exploratorios es más parecido a un paso en la misma línea de producción. Es parte de la preparación de la entrada para el paso de aprendizaje profundo.

Ming Kim

Es esencial para cualquier proyecto de ciencia de datos, ya sea aprendizaje profundo, segmentación o un modelo típico de aprendizaje automático.

Karlijn Willems

More Interesting

¿Cómo se debe enfocar el aprendizaje de big data?

¿Qué tecnología de big data es mejor para el procesamiento de datos en tiempo real?

¿Cómo funciona DC ++?

¿Cómo se usa el SNA (Social Network Analysis) para combatir el fraude o las transacciones fraudulentas?

¿Vale la pena hacer ciencia de datos?

¿Cuál es la mejor página web / software para hacer infografías para informes de ciencia de datos?

¿Por qué están tan de moda los modelos de caja negra?

¿Cuáles son los grandes proyectos de datos en torno a craigslist?

¿Qué significa estar basado en datos?

¿Python es mejor que R para la ciencia de datos?

¿Por qué necesitamos Python cuando R es tan brillante para el aprendizaje automático y la ciencia de datos?

¿Cuál es la mejor manera de medir la acción para impactar en el análisis de datos?

Cómo encontrar un buen formato para big data

Cómo analizar adecuadamente los datos y obtener información útil

¿Puede la ciencia de datos ayudar en el dominio de la ley? ¿El sistema judicial indio adoptará / aceptará dicha herramienta, ya que este será un cambio importante?

Web Analytics