Cómo comenzar con el modelado predictivo

Hay diferentes puntos de partida posibles, ¡pero aquí hay una hoja de ruta que debería funcionar desde mi punto de vista!

  • Tome un aprendizaje automático introductorio: si no está familiarizado con la clasificación del aprendizaje automático y la técnica de agrupación, debería considerar aprender sobre esto tomando un curso, ya sea en la escuela o en línea. Yo recomendaría la clase de aprendizaje automático Andrew NG coursera (Machine Learning – Stanford University | Coursera) como punto de partida.
  • Familiarícese con los idiomas y las bibliotecas de software: aprenda idiomas como R (The R Project for Statistical Computing) / Python y bibliotecas de software como (scikit-learn (scikit-learn: machine learning en Python) y Pandas (Python Data Analysis Library )) para aprendizaje automático y análisis de datos en python.
  • Lea libros sobre modelado predicativo: leer libros debería darle una comprensión más sólida de lo que aprendió y proporcionarle más ejemplos sobre el uso de los lenguajes de programación y las bibliotecas de software para resolverlos. Aquí hay dos ejemplos de buenos libros para leer:
    • Libro de Python Machine Learning (rasbt / python-machine-learning-book) (por Sebastian Raschka)
    • Modelado predictivo aplicado
  • Únete a Kaggle: ¡ ahora es el momento de resolver problemas reales! Kaggle es un gran lugar para mostrar sus habilidades de aprendizaje automático. Organiza diferentes concursos de aprendizaje automático con increíbles recompensas (conocimiento, dinero, trabajos, etc.). Sugiero leer esta respuesta de Quora sobre cómo comenzar en Kaggle: la respuesta de Moustafa Alzantot a ¿Cómo empiezo a participar en las competencias de Kaggle? ¿Qué análisis de datos básicos hacen las personas y cómo saben qué modelos aplicar? ¿Cómo hacen mejoras?
  • Obtenga más información sobre dominios específicos: estudie cursos que le brinden más experiencia en dominios específicos como (CS231n: Redes neuronales convolucionales para el reconocimiento visual Redes convolucionales para el reconocimiento de imágenes), o (CS224d: Aprendizaje profundo para el procesamiento del lenguaje natural Aprendizaje profundo para el procesamiento del lenguaje natural )

¡Hola! El modelado predictivo es un componente del análisis predictivo, y el proceso de modelado se vuelve mucho más fácil cuando utiliza una solución de análisis predictivo que extrae, visualiza y analiza datos sin procesar por usted. No necesitará depender por completo de la experiencia y el ancho de banda de un científico de datos para poner en marcha los proyectos.

Trabajo para G2 Crowd, una plataforma de revisión de software tecnológico que recopila datos de rendimiento y satisfacción de revisiones de fuentes múltiples. Es un sitio bastante ingenioso: piense en las reseñas de Amazon o Yelp, pero se aplica a software comprable como análisis digital o plataformas de comercio electrónico.

De todas formas. Recientemente escribí una guía introductoria sobre el software de análisis predictivo y desglosa el software para todos y cada uno de los usuarios, incluidas las características, los beneficios y los casos de uso del software. ¡Recomiendo comprobarlo antes de comenzar su aventura de modelado predictivo!

Avíseme si tiene alguna pregunta y estaré encantado de hablarle.

Revisiones de software y servicios empresariales | Multitud G2

Salta a kaggle.com, haz los concursos de tutoriales, lee y participa en los foros

Toma el MOOC de Andrew Ng

Toma algunos datos reales y juega / explora

More Interesting

¿Qué métrica de rendimiento debo elegir para evaluar un modelo de clasificación?

¿Cuál es la diferencia entre el entrenamiento por lotes, en línea y mini-lote en redes neuronales? ¿Cuál debo usar para un conjunto de datos de pequeño a mediano tamaño con fines de predicción?

Quiero comprar una PC de segunda mano decente para comenzar con el aprendizaje profundo comprando una GeForce GTX 1070, ¿qué características me deberían interesar?

¿Qué es la regresión de Ridge en términos simples?

¿Qué es un campo aleatorio?

Andrew Ng: ¿Cuáles son los requisitos previos para iniciar el aprendizaje automático?

Máquina de Boltzmann restringida (RBM): ¿Cómo se podría reformular (y / o explicar) las dos tareas en la siguiente diapositiva de una charla de Geoffrey Hinton?

¿Qué significa el espacio de hipótesis en Machine Learning?

¿Cuáles son las desventajas de usar un árbol de decisión para la clasificación?

¿Por qué la regresión logística se considera un modelo lineal?

¿Necesito normalizar mis vectores de características antes de usar Deep Learning?

¿Por qué no reescalamos el vector de coeficiente de una regresión de lazo?

Tengo un conjunto de datos con 14 características. Quiero aplicar SVM en él usando R. ¿Cómo puedo?

¿Cómo se debe contactar a los autores de los libros blancos (y cómo hacer que respondan)?

¿La red neuronal convolucional es básicamente un procesamiento previo de datos a través del núcleo más las redes neuronales? ¿Acaso Deep Learning no es solo redes neuronales con preprocesamiento para las selecciones de funciones automatizadas?