¿Prediciendo compras (en comercio electrónico) a través de modelos estadísticos o de aprendizaje automático?

Para construir un modelo predictivo, primero necesita un conjunto de datos (que supongo que ya tiene). El siguiente objetivo es decidir qué necesita predecir el modelo, es decir, si tiene un conjunto de datos de clientes, ¿estaría prediciendo un posible comprador de un determinado producto o tiene datos de ventas anuales con los que intenta pronosticar las ventas futuras? solo desea extraer los factores más importantes que afectan el resultado final (ya sea que prediga un posible comprador, que prediga ventas, etc.). El primer caso es una instancia de un problema de clasificación, el segundo es un problema de regresión y la selección de características es el tercero. Lea un poco sobre estos conceptos (entienda particularmente el concepto de clasificación; use cualquier libro de minería de datos).
Ahora, considerando que tiene un conjunto de datos para clasificación o regresión, reserve un porcentaje de estos datos como conjunto de prueba y el resto se utiliza como datos de entrenamiento. A continuación, use un programa como libSVM (disponible en línea) para ejecutar el conjunto de datos de entrenamiento lo que crearía un modelo SVM. Alimente el conjunto de prueba al modelo SVM, que le daría un conjunto de predicciones y precisión de clasificación del conjunto de prueba (para la precisión de clasificación es el porcentaje de etiquetas correctas predichas, para problemas de regresión puede ser un error cuadrado medio reportado).
Probablemente pueda comenzar trabajando en el manual de libSVM, que es bastante rápido para iniciar. Lo anterior es lo más básico que puede ser para la predicción. Si no está escribiendo sus propios algoritmos, puede usar paquetes como Weka (disponible en línea ) que pueden ayudarlo a hacer muchas cosas utilizando sus datos. Para fines de aprendizaje automático, lea un poco sobre Máquinas de vectores de soporte (SVM), Árboles de clasificación y regresión, Bosques aleatorios, que serán más que útiles para comenzar. mejorar un modelo implica limpiar, escalar, transformar datos, encontrar relaciones entre variables en sus datos y muchas otras cosas, pero lo anterior podría ser un comienzo.

Related Content

¿Qué problemas de visión y percepción tiene el aprendizaje profundo al borde del crack?

¿Vale la pena un doctorado en CS si no planea ingresar a la academia?

¿Cuándo harán las máquinas la física y volverán a aprender las características de los datos de observación y luego reemplazarán aquellas como masa, giro, color o carga?

¿Cuáles son las diferencias entre GRU y RNN estándar?

¿Cómo afectará el aprendizaje automático al mundo para 2030?

¿Cuál es una buena secuencia de autoaprendizaje para el aprendizaje automático?

¿Cuál es la forma más efectiva de leer páginas web y sus enlaces?

Puedes seguir el siguiente camino

Comience con estadística
– EMA
– Doble suavizado
– Triple suavizado
– ARIMA
–

Más tarde puede pensar en usar modelos de aprendizaje automático. (que Shameek enumeró anteriormente).
Ajustar los métodos de ML puede ser demasiado para empezar.

Más tarde, puede comenzar a pensar en un modelo con múltiples dimensiones (ventas, cambio de precio / descuento, falta de inventario / ventas perdidas, etc.)

Saludos!

Shameek Ghosh

More Interesting

¿Cómo funcionan los vectores de párrafo frente a codificadores automáticos variacionales?

¿Pueden Kmeans y el algoritmo DBSCAN dar el mismo resultado para un conjunto de datos en particular?

¿Cuáles son los proyectos de aprendizaje automático que puedo hacer para practicar y aprender como principiante?

¿Cuáles son los conjuntos de datos canónicos de aprendizaje automático utilizados como punto de referencia para demostrar un nuevo método?

Cómo implementar un algoritmo de fijación de precios dinámico en Hadoop

En el aprendizaje por refuerzo, ¿cuál es la diferencia entre una función de valor de estado V (s) y una función de valor de acción de estado Q (s, a)?

¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?

¿Cuál es una buena manera de clasificar los documentos de texto contra un modelo de tema arbitrario?

Cómo configurar las dimensiones de la capa y la conectividad en Caffe para reproducir una CNN a partir de un trabajo de investigación

¿Qué tan bueno es el programa de maestría en visión por computadora de la Universidad Autónoma de Barcelona en términos de contenido, costo y futura carrera (directamente trabajo o doctorado)?

¿Qué significa 'Bagging reduce la varianza mientras se conserva el sesgo'?

¿Por qué la precisión del entrenamiento de la red CNN aumenta rápidamente cuando elijo un tamaño de lote relativamente más pequeño?

¿Cómo se puede reducir el tamaño del modelo TFIDF sin reducir significativamente la precisión?

¿Cómo puede ser posible la IA si las máquinas se limitan a la lógica y el lenguaje?

¿Qué proyectos principales puedo hacer en R después de aprender minería de datos, análisis de sentimientos de limpieza, regresión y técnicas de agrupamiento?

Web Analytics