Me gustaría escribir / usar un algoritmo de aprendizaje automático para predecir valores de contaminación del aire basados ​​en datos meteorológicos. Tengo algunas habilidades de programación y sé qué datos me gustaría usar, pero no tengo experiencia con el aprendizaje automático. ¿Dónde empiezo?

Para aprender el aprendizaje automático, el curso de Aprendizaje automático de Andrew Ng sería bueno, como lo señaló el usuario de Quora.

Estos son algunos pasos generales necesarios para comenzar con los problemas de predicción (o la mayoría de los enfoques de aprendizaje automático):
1. Identifique las características que pueden ser útiles para predecir la variable de interés (nivel de contaminación del aire en este caso).
2. Realice la normalización adecuada (escalado de características). Por ejemplo, la estandarización puede ser apropiada para características como la velocidad del viento.
3. Divida sus puntos de datos en conjuntos de entrenamiento, validación y prueba (Conjunto de entrenamiento, Conjunto de prueba).
4. Luego aprenda un modelo usando el conjunto de entrenamiento y ajuste los parámetros del modelo usando el conjunto de validación. Para comenzar, puede probar una red neuronal artificial de retroalimentación simple para tareas de predicción si los datos no son una serie temporal. Si está disponible como una serie temporal, la red neuronal recurrente puede ser un buen punto de partida. Las implementaciones para el mismo se pueden encontrar en MultilayerPerceptron, RNNLIB respectivamente.

El curso extremadamente popular de Andrew Ng: Machine Learning

Definitivamente deberías comenzar con la clase de Machine Learning de Andrew Ng en Coursera. Las semanas 1, 2, 3 y 6 serían suficientes en su caso. Pero recomiendo todo para una idea general del tema. Las diez semanas serán solo una introducción a ML. Pero la mejor introducción en mi humilde opinión.

More Interesting

¿Qué es la agregación y desagregación de datos en Tableau?

¿Cómo se manejan los datos faltantes en un gran conjunto de datos con características ordinales?

¿Por qué "todo parece estar correlacionado en una escala de log-log"?

¿AI y Data Science cambiarán la cara de los negocios? Si es así, ¿cómo será su futuro?

Como uno de los primeros practicantes de inteligencia artificial y reconocimiento de voz, ¿qué piensa James Baker del rumor en torno al aprendizaje automático y la ciencia de datos en la década de 2010?

Soy un recién graduado en ingeniería industrial, ¿cómo comienzo mi camino en ciencia de datos para la cadena de suministro?

¿Cuáles son algunos buenos institutos de capacitación para aprender big data y análisis de datos en Bangalore?

¿Cómo comenzar a aprender Big Data Hadoop? ¿Hay alguna manera de que pueda aprender por mi cuenta o cualquier material o tutoriales, o necesito unirme a un instituto?

¿Cuál es la relación entre NumPy, SciPy, Pandas y Scikit-learn y cuándo debo usar cada uno de ellos?

¿Hay alguna similitud entre el desarrollo front-end y la ciencia de datos?

¿Qué tipo de preguntas de prueba A / B debo esperar en una entrevista con un científico de datos y cómo debo prepararme para esas preguntas?

Cómo obtener una lista de todos los bootcamps de ciencia de datos que se ejecutan en los EE. UU.

¿Puedes grabar ondas cerebrales en datos?

¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?

Cómo validar las reglas de decisión individuales por separado en un árbol de decisión, en lugar de validar el modelo del árbol de decisión en su conjunto