¿Qué conocimiento básico se debe tener antes de aprender el aprendizaje automático en India?

En general, el aprendizaje automático necesita algunos requisitos previos.

  1. Matemáticas
  • Fundación de Matemáticas
  • Álgebra
  • Estática y Probabilidad
  • Cálculo

2. Programación: Python es mejor.

Eso es .

Si quieres aprender Machine Learning, te sugiero

Mejor curso en línea de aprendizaje automático.

Machine Learning AZ ™: Python práctico y R en ciencia de datos

Está estructurado de la siguiente manera:

  • Parte 1: preprocesamiento de datos
  • Parte 2: Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinómica, SVR, Regresión de árbol de decisión, Regresión forestal aleatoria
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación del árbol de decisión, Clasificación aleatoria del bosque
  • Parte 4 – Agrupación: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento del lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de dimensionalidad: PCA, LDA, Kernel PCA
  • Parte 10 – Selección y refuerzo del modelo: validación cruzada k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está repleto de ejercicios prácticos basados ​​en ejemplos en vivo. Entonces, no solo aprenderá la teoría, sino que también obtendrá práctica práctica para construir sus propios modelos.

Todo lo mejor .

Yo diría que uno necesita tener una buena base en 2 materias para que él / ella pueda sobresalir en Machine Learning.

  1. Álgebra lineal: al final del día, los datos se representan como una matriz y usted tiene diferentes operaciones como multiplicaciones de matrices, productos de puntos, encontrar valores propios que aparecen en la imagen. Por lo tanto, una buena base en este tema le permitirá a uno visualizar datos y comprender algoritmos más fácilmente.
  2. Probabilidad: siempre hay una parte de probabilidad involucrada en cualquier proceso de LD. Aparte de eso, hay algoritmos como los clasificadores Naive Bayes que utilizan métodos bayessianos. Por lo tanto, comprender la probabilidad básica lo ayudará a diseñar, ajustar y comprender algoritmos de ML.

Eso es casi todo. Todo lo demás se basa en estos temas. Si tiene una buena base en las dos materias anteriores y algunas matemáticas básicas sobre derivados e integrales, facilitará el proceso de comprensión del Aprendizaje automático.

A CONTINUACIÓN SON LAS 5 COSAS BÁSICAS PARA APRENDER EL APRENDIZAJE DE MAQUINAS !!

¡ESPERO QUE SEA ÚTIL!

1. Fundamentos y programación de la informática

Los fundamentos informáticos importantes para los ingenieros de Machine Learning incluyen estructuras de datos (pilas, colas, matrices multidimensionales, árboles, gráficos, etc.), algoritmos (búsqueda, clasificación, optimización, programación dinámica, etc.), computabilidad y complejidad (P vs NP, problemas de NP completo, notación big-O, algoritmos aproximados, etc.) y arquitectura de la computadora (memoria, caché, ancho de banda, puntos muertos, procesamiento distribuido, etc.).

Debe poder aplicarlos, implementarlos, adaptarlos o abordarlos (según corresponda) al programar. Los problemas de práctica, las competencias de codificación y los hackatones son una excelente manera de perfeccionar tus habilidades.

2. Probabilidad y estadística

Una caracterización formal de la probabilidad (probabilidad condicional, regla de Bayes, probabilidad, independencia, etc.) y las técnicas derivadas de ella (redes de Bayes, procesos de decisión de Markov, modelos de Markov ocultos, etc.) están en el corazón de muchos algoritmos de Machine Learning; Estos son un medio para hacer frente a la incertidumbre en el mundo real. Estrechamente relacionado con esto está el campo de la estadística, que proporciona varias medidas (media, mediana, varianza, etc.), distribuciones (uniforme, normal, binomial, Poisson, etc.) y métodos de análisis (ANOVA, prueba de hipótesis, etc.) que son necesarios para construir y validar modelos a partir de datos observados. Muchos algoritmos de Machine Learning son esencialmente extensiones de procedimientos de modelado estadístico.

3. Modelado y evaluación de datos

El modelado de datos es el proceso de estimar la estructura subyacente de un conjunto de datos dado, con el objetivo de encontrar patrones útiles (correlaciones, grupos, vectores propios, etc.) y / o predecir propiedades de instancias nunca antes vistas (clasificación, regresión, detección de anomalías, etc. .). Una parte clave de este proceso de estimación es evaluar continuamente qué tan bueno es un modelo dado. Dependiendo de la tarea en cuestión, deberá elegir una medida de precisión / error adecuada (por ejemplo, pérdida de registro para la clasificación, suma de errores al cuadrado para regresión, etc.) y una estrategia de evaluación (división de prueba de entrenamiento, secuencial vs. validación cruzada aleatoria, etc.). Los algoritmos de aprendizaje iterativo a menudo utilizan directamente los errores resultantes para modificar el modelo (por ejemplo, la propagación hacia atrás para redes neuronales), por lo que comprender estas medidas es muy importante incluso para la aplicación de algoritmos estándar.

4. Aplicación de algoritmos y bibliotecas de aprendizaje automático

Las implementaciones estándar de los algoritmos de Machine Learning están ampliamente disponibles a través de bibliotecas / paquetes / API (por ejemplo, scikit-learn, Theano, Spark MLlib, H2O, TensorFlow, etc.), pero su aplicación efectiva implica elegir un modelo adecuado (árbol de decisión, vecino más cercano, neuronal net, máquina de vectores de soporte, conjunto de modelos múltiples, etc.), un procedimiento de aprendizaje para ajustar los datos (regresión lineal, descenso de gradiente, algoritmos genéticos, embolsado, refuerzo y otros métodos específicos del modelo), así como comprender cómo los hiperparámetros afectar el aprendizaje También debe tener en cuenta las ventajas y desventajas relativas de los diferentes enfoques, y las numerosas trampas que pueden hacer que se tropiece (sesgo y varianza, sobreajuste y falta de ajuste, datos faltantes, pérdida de datos, etc.). Los desafíos de la ciencia de datos y el aprendizaje automático, como los de Kaggle, son una excelente manera de exponerse a diferentes tipos de problemas y sus matices.

5. Ingeniería de software y diseño de sistemas

Al final del día, la salida o entrega típica de un ingeniero de Machine Learning es software. Y a menudo es un componente pequeño que encaja en un ecosistema más grande de productos y servicios. Debe comprender cómo funcionan estas diferentes piezas, comunicarse con ellas (mediante llamadas a la biblioteca, API REST, consultas de bases de datos, etc.) y crear interfaces apropiadas para su componente de las que dependerán otros. Puede ser necesario un diseño cuidadoso del sistema para evitar cuellos de botella y permitir que sus algoritmos se escalen bien con el aumento de los volúmenes de datos. Las mejores prácticas de ingeniería de software (incluidos el análisis de requisitos, el diseño del sistema, la modularidad, el control de versiones, las pruebas, la documentación, etc.) son invaluables para la productividad, la colaboración, la calidad y el mantenimiento.

Sugeriría seguir este enlace que tiene una lista de todos los conceptos básicos necesarios para aprender Machine Learning paso a paso. ¡¡Buena suerte!!