¿Puedo aprender el aprendizaje automático sin conocer álgebra lineal, estadísticas y probabilidad?

Lo siento hermano, no puedes.

¿Puedes conducir un automóvil sin aprender a conducir? Puede ser que pueda arrancar el automóvil, pero puede golpear en pocos segundos … no puede controlar en la carretera.

Aquí también la misma situación.

Mi sugerencia es primero aprender requisitos matemáticos para el aprendizaje automático

1. álgebra

2. probabilidad

3. estadísticas

4. cálculo

Eso es .

después de las matemáticas, generalmente necesita aprender programación [Python, programación R] y algoritmos.

El mejor curso en línea de aprendizaje automático

  • Machine Learning AZ ™: Python práctico y R en ciencia de datos
  • Bootcamp de ciencia de datos y aprendizaje automático con R
  • Aprendizaje automático para ciencia de datos

elige el primer plato …

de este curso puedes aprender sobre:

Este curso es divertido y emocionante, pero al mismo tiempo nos sumergimos profundamente en Machine Learning. Está estructurado de la siguiente manera:

  • Parte 1: preprocesamiento de datos
  • Parte 2: Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinómica, SVR, Regresión de árbol de decisión, Regresión forestal aleatoria
  • Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación del árbol de decisión, Clasificación aleatoria del bosque
  • Parte 4 – Agrupación: K-medias, agrupación jerárquica
  • Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
  • Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson
  • Parte 7 – Procesamiento del lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
  • Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
  • Parte 9 – Reducción de dimensionalidad: PCA, LDA, Kernel PCA
  • Parte 10 – Selección y refuerzo del modelo: validación cruzada k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está repleto de ejercicios prácticos basados ​​en ejemplos de la vida real. Entonces, no solo aprenderá la teoría, sino que también obtendrá práctica práctica para construir sus propios modelos.

además…

  • Master Machine Learning en Python & R
  • Tener una gran intuición de muchos modelos de Machine Learning
  • Hacer predicciones precisas
  • Haz un análisis poderoso
  • Hacer modelos robustos de aprendizaje automático
  • Crea un fuerte valor agregado para tu negocio
  • Usar Machine Learning para fines personales
  • Manejar temas específicos como el aprendizaje por refuerzo, PNL y aprendizaje profundo
  • Manejar técnicas avanzadas como la reducción de dimensionalidad
  • Sepa qué modelo de Machine Learning elegir para cada tipo de problema
  • Construya un ejército de poderosos modelos de Machine Learning y sepa cómo combinarlos para resolver cualquier problema.

libros de texto sugeridos (solo con fines de referencia)

  • Aprendizaje automático práctico con Scikit-Learn y TensorFlow: conceptos, herramientas y técnicas para construir sistemas inteligentes por Aurélien Géron
  • scikit-learn, un aprendizaje automático para principiantes absolutos: una introducción en inglés sencillo por Oliver Theobald
  • Python Machine Learning: Machine Learning y Deep Learning con Python, nd TensorFlow, 2da edición por Sebastian Raschka y Vahid Mirjalili

TODO LO MEJOR….

Sin este conocimiento, es posible hacer el aprendizaje automático de forma deficiente.

Sin al menos una comprensión básica de las estadísticas, no sabrá cómo interpretar sus resultados, se asegurará de que sus resultados sean estadísticamente significativos, compare el rendimiento de múltiples modelos con el mismo conjunto de datos o el mismo modelo con múltiples conjuntos de datos, etc. en magia negra y superstición. En el análisis predictivo, creará un modelo que funciona a la perfección en su escritorio y falla miserablemente en la naturaleza y se quedará rascándose la cabeza.

¿Cómo sabe qué medida de precisión es adecuada para su proyecto sin algún conocimiento estadístico? ¿Cómo determina un tamaño de muestra apropiado para su conjunto de datos?

Esto no es como el desarrollo de software normal, donde las métricas de rendimiento simples pueden decirle fácilmente si ha mejorado su aplicación.

Podría costarle mucho dinero a quien paga su tiempo (ya sea usted o alguien más) tomando malas decisiones. Hay muchas decisiones que deben tomarse al determinar cómo mejorar un modelo que puede ser costoso. ¿Cómo decides qué hacer cuando obtienes malos resultados? Aumentar el tamaño de su conjunto de datos? ¿Crear un nuevo conjunto de datos con diferentes características? Estas decisiones requieren conocimiento de lo que está sucediendo dentro de la caja negra para que pueda probar varias técnicas para mejorar los resultados y seleccionar características antes de saltar a soluciones de alto costo.

Hay muchas personas que creen que puede democratizar el aprendizaje automático a través de bibliotecas y herramientas, pero la verdad es que esas herramientas no automatizan todas las funciones de un analista de datos o ingeniero de aprendizaje automático.

Creo que puedes comenzar a aprender ML, y en paralelo a aprender ML también aprenderás matemáticas. Hay muy buenos libros publicados recientemente y realmente te aleja de las matemáticas y te enfocas en los algoritmos. O tienen una sección introductoria de matemáticas que enseña las necesidades básicas. Creo que recientemente más libros se están moviendo hacia esta dirección. Como ejemplo, puedo referirte a:

  • Aprendizaje profundo (serie de computación adaptativa y aprendizaje automático). por Goodfellow y Bengio
  • Aprendizaje automático práctico con Scikit-Learn y TensorFlow: conceptos, herramientas y técnicas para construir sistemas inteligentes. por Géron

y

  • El manual de diseño de ciencia de datos. por Skiena

El primero tiene una buena introducción matemática y el último está más orientado a las matemáticas, pero creo que puede encontrar su respuesta comenzando a leerlos todos + usar Internet para aprender matemáticas cuando encuentre un término que no entiende.

Conozco a una fantástica bioinformática que se mudó de otro campo con cero antecedentes en matemáticas a ML y pasó 6 meses día y noche para aprender ML. Ahora también tiene éxito en su nuevo campo.

Realmente no necesita saber mucho sobre el aprendizaje automático para abrir scikit-learn y entrenar un bosque aleatorio.

Sin embargo, es mejor que espere que funcione en el primer intento; porque si no lo hace: ahí es cuando necesitas entender las matemáticas.

Las razones por las que necesita saber las matemáticas son: para depurar ML y hacer que avance.

Como está escribiendo código, probablemente necesite depurarlo. Cuanto más comprenda los algoritmos, mejor podrá depurarlos.

A menudo necesita saber las matemáticas para incluso * reconocer * los errores. A veces no es obvio cuando ML está haciendo algo loco.

Entonces, hazlo, podría funcionar para ti. Pero si no obtiene los resultados que desea, podría ser el momento de llegar a los libros.

No competente El aprendizaje automático es una rama de la estadística y, como tal, está muy arraigado en las matemáticas. Muchos ingenieros de software omiten este paso y aplican al azar algoritmos como bosques aleatorios a todo.

Es posible que aprenda a usar herramientas de aprendizaje automático, pero esto no es aprender el tema. Incluso el uso crítico de los resultados no es posible sin aprender qué hay detrás de las herramientas usted mismo.

Vea ¿Cuánto del aprendizaje automático es informática versus estadísticas ?, ¿Cuáles son los requisitos previos para comenzar a aprender el aprendizaje automático? y varias preguntas relacionadas.

Casi imposible si no tiene los conceptos básicos de probabilidad y estadísticas. Por ejemplo, ¡la predicción es un tema importante en ML, que tenía mucho que ver con la teoría de la probabilidad!

Claro, puede usar recetas precocinadas y freeware prefabricado como cajas negras. Y propague la forma de trabajar de basura en la basura. (Perdón por el tono irónico).

More Interesting

En clasificación, ¿cómo manejas un conjunto de entrenamiento desequilibrado?

MLconf 2015 Seattle: ¿Cuándo uso la normalización de varianza media / unidad cero frente a la normalización de unidad L1 / L2?

¿Necesito almacenar los pesos en los pasos de tiempo anteriores además de las activaciones cuando uso la propagación hacia atrás a través del tiempo en redes neuronales recurrentes?

Cómo aplicar PCA para la reducción de dimensionalidad y SVM para agrupar y clasificar los patrones usando C ++ OpenCV

¿Puede ingresar al programa de doctorado CS de nivel superior / siguiente sin publicación, suponiendo que tenga una experiencia de investigación decente?

¿Podemos usar un algoritmo no supervisado para realizar análisis de sentimientos?

¿Cuál es la función de transferencia en redes neuronales artificiales?

¿Cuándo y por qué un clasificador Bayes ingenuo es una opción mejor / peor que un clasificador forestal aleatorio?

¿Cuáles son algunas de las ventajas de usar PyTorch sobre TensorFlow?

¿Cómo se implementa una red neuronal convolucional (CNN) con la estructura de un árbol binario en TensorFlow?

¿Hay algún programa en desarrollo que pueda escuchar un idioma y comenzar a aprenderlo, como en Star Trek?

¿Cómo evalúa el rendimiento de un algoritmo de aprendizaje no supervisado?

¿Cuál es la diferencia entre los métodos de gradiente de políticas y los métodos de actor crítico?

¿Cuáles son algunas aplicaciones actuales de las redes neuronales convolucionales además del análisis de imagen, video y discurso?

¿Qué métodos de conjunto / aprendizaje automático pueden incorporar covariables que varían con el tiempo?