¿Cuál es la forma más rápida de realizar un EDA en un conjunto de datos con más de 100 variables?

Hacer EDA y construir un modelo predictivo son dos actividades interrelacionadas pero separadas. Mientras pensaba en ambos, miraría

El artículo de IBM ofrece una buena introducción al modelado predictivo en el entorno minorista {A la cita}

Modelo de segmentación de clientes

La segmentación de clientes implica la creación de perfiles de clientes a través de la segmentación demográfica, la segmentación del comportamiento en línea y la segmentación del comportamiento de compra.

Modelo de análisis de la cesta de la compra

El análisis de la canasta de mercado permite a los minoristas obtener información sobre los patrones de venta de productos mediante el análisis de registros históricos de ventas y el comportamiento de navegación en línea de los clientes.

Modelo de afinidad del cliente

Puede determinar la afinidad del cliente con las líneas de productos al comprender la información demográfica del cliente, la información de compra y la información de navegación.

Modelo de análisis de registro de respuestas

El análisis del registro de respuestas captura la respuesta de los clientes en comparación con las recomendaciones que provienen de las reglas comerciales de IBM® Analytical Decision Management.

Modelo de sensibilidad de precios

La sensibilidad al precio es la medida en que el precio de un producto afecta la decisión de compra de un cliente. El grado de sensibilidad al precio varía de un cliente a otro y de un producto a otro.

Modelo de sugerencia basado en inventario

El modelo de sugerencia basada en inventario identifica los productos que tienen exceso de inventario y luego hace recomendaciones en tiempo real a los clientes en función de la combinación de afinidad de categoría y exceso de inventario.

Voy a proporcionar un enlace a lo largo de las líneas que lo ayuden:

  1. El agrupamiento es una técnica de referencia para encontrar segmentos dentro de los datos. Scikit learn tiene una gran colección de algoritmos de agrupamiento. Esto también se puede usar para el modelado de afinidad del cliente
  2. La extracción frecuente de conjuntos de elementos está acostumbrada a realizar el Análisis de la cesta de la compra. El marco naranja parece tener implementación de este algoritmo. Esto también debería ayudar en la sugerencia basada en inventario. El filtrado colaborativo es una técnica alternativa que una vez podría usarse.
  3. Puede usar el seguimiento de píxeles para el análisis del registro de respuestas. Capture eventos y simplemente haga un análisis simple de la tabla dinámica para obtener buenas ideas. Posiblemente esto también se pueda usar para el modelo de sensibilidad al precio. La técnica alternativa sería la prueba AB

Para una lectura más técnica, miraría este artículo. Otros temas no cubiertos en la lista Análisis de rotación

En el siguiente video puede encontrar los detalles sobre EDA

More Interesting

¿Cuánto tiempo puede sobrevivir Informatica en el mundo de los grandes datos?

¿Qué es Big Data y cómo puede ser útil?

Tengo 29 años, estoy desempleado y espero un hijo a fin de año. Estoy tomando un curso en ciencia de datos. ¿Qué más puedo hacer para estar a la vanguardia del juego cuando empiezo a buscar trabajo nuevamente en 2016?

¿Cuál es la configuración recomendada para una aplicación de Big Data?

¿Cuáles son las mejores bibliotecas y paquetes de Python para la ciencia de datos?

Visualización de datos: ¿Existe una versión de "Cliffs Notes" de Grammar of Graphics?

¿Qué es una aplicación de aprendizaje automático y cómo se usa, que no es una de las siguientes: redes sociales, motores de búsqueda, bioinformática, neurociencia, investigación en el CERN, ciencia actuarial y sistemas de recomendación?

¿Qué tecnologías admiten el análisis de Hadoop y Big Data?

¿Vale la pena hacer ciencia de datos en una certificación R de DataCamp?

¿Cuál es su definición personal para big data?

¿Qué me preparará mejor para convertirme en científico de datos: un título universitario relevante o autodidacta a través de Coursera, Kaggle y proyectos paralelos?

Cómo ingresar al mundo de los grandes datos con una licenciatura en física

¿Cuáles son las mejores herramientas gratuitas de recuperación de datos para Windows?

Como científico de datos, ¿cuáles son sus debilidades?

¿Cuál es la diferencia exacta entre Big Data, Data Science y Data Analytics?