Todo tipo de sistemas de predicción, clasificación y recomendación son algoritmos ampliamente utilizados en análisis minorista.
Kaggle es de hecho el mejor lugar para comenzar a aprender. Descargue un conjunto de datos de un desafío relevante (p. Ej., Reclutamiento de Walmart – Pronóstico de ventas en la tienda) y, mientras practica, comience a mejorar sus habilidades de codificación con R y Python.
Con Python, los mejores paquetes que debes saber:
- ¿Qué temas puedo estudiar después de aprender Java y C (aplicaciones de estructuras de datos, etc.)?
- ¿Cuáles son las aplicaciones de la vida real del algoritmo de Prim?
- ¿Qué es el nodo en la estructura de datos?
- Cómo comparar dos cadenas C para igualdad, usando una matriz de caracteres
- ¿Cuáles son algunas de las preguntas de cadena que se hacen comúnmente en una entrevista técnica?
Sklearn, numpy, scipy, GraphLab, colecciones, itertools, matplotlib, nltk, IPython, mlpy, NetworkX, Orange, pybrain, prettytable, pyMc.
Recomiendo trabajar con el repositorio de Anaconda .
Con R, los mejores paquetes de Machine Learning y Data Science:
- e1071 Funciones para análisis de clase latente, transformada de Fourier a corto plazo, agrupación difusa, máquinas de vectores de soporte, cálculo de ruta más corta, agrupación en bolsas, clasificador Bayes ingenuo, etc. (142479 descargas)
- rpart Particionamiento recursivo y árboles de regresión. (135390)
- igraph Una colección de herramientas de análisis de red. (122930)
- Redes neuronales de alimentación directa de nnet y modelos logarítmicos multinomiales. (108298)
- randomForest Breiman y Cutler bosques aleatorios para clasificación y regresión. (105375)
- El paquete caret (abreviatura de Entrenamiento de Clasificación y REgresión) es un conjunto de funciones que intentan racionalizar el proceso para crear modelos predictivos. (87151)
- kernlab Laboratorio de aprendizaje automático basado en kernel. (62064)
- glmnet Lasso y modelos lineales generalizados regularizados de red elástica. (56948)
- ROCR Visualización del rendimiento de clasificadores de puntuación. (51323)
- gbm Modelos de regresión potenciada generalizada. (44760)
- party Un laboratorio para particiones recursivas. (43290)
- Reglas de la Asociación Minera de Arules y conjuntos de artículos frecuentes. (39654)
- Clasificación de árboles y árboles de regresión. (27882)
- Clasificación y visualización de klaR . (27828)
- Interfaz RWeka R / Weka. (26973)
- Predictores mejorados de ipred . (22358)
- lars Regresión de ángulo mínimo, lazo y avance por etapas. (19691)
- Modelos de spline de regresión adaptativa multivariante. (15901)
- Clasificación de CORElearn , regresión, evaluación de características y evaluación ordinal. (13856)
- Impulso basado en el modelo mboost . (13078)