¿Qué conocimiento previo es necesario para el aprendizaje automático?

El curso de aprendizaje automático no presume ni requiere ningún conocimiento previo en aprendizaje automático. Sin embargo, para comprender los conceptos presentados y completar los ejercicios, recomiendo que los estudiantes cumplan con los siguientes requisitos previos:

Dominio del álgebra de nivel de introducción. Debe sentirse cómodo con variables y coeficientes, ecuaciones lineales, gráficas de funciones e histogramas. (La familiaridad con conceptos matemáticos más avanzados como logaritmos y derivados es útil, pero no es obligatorio).
Conocimientos básicos de programación y algo de experiencia en codificación en Python. Los ejercicios de programación en Machine Learning Crash Course están codificados en Python usando TensorFlow. No se requiere experiencia previa con TensorFlow, pero debe sentirse cómodo leyendo y escribiendo código Python que contenga construcciones de programación básicas, como definiciones de funciones / invocaciones, listas y dictados, bucles y expresiones condicionales.

Visita para la capacitación en línea de Machine Learning
¿Cómo se relaciona la RNN con el aprendizaje profundo?
¿La máquina está aprendiendo la 'versión del hombre tonto' de intentar recrear la inteligencia?
¿Cuáles son los temas de investigación sobre aprendizaje profundo para la tesis de maestría?
¿Cuál es el significado conciso y la interpretación del sesgo y la varianza en el aprendizaje automático y las estadísticas?
¿Qué tan buenos antecedentes en ML ofrece el curso Coursera Machine Learning a alguien?

Leer más sobre Machine Learning:

¿Qué es el aprendizaje automático?
¿Cómo funciona el aprendizaje automático?
¿Cuáles son las ventajas y desventajas del aprendizaje automático?
¿Cómo se usa el aprendizaje automático en las finanzas?

Machine Learning

¿Qué es el aprendizaje automático basado en modelos?

¿Los programas de software de aprendizaje automático toman riesgos?

¿Cuáles son las diferencias entre big data, hadoop y colmena? ¿Son solo jergas con el mismo significado? ¿Puedes resumir en detalle?

¿Cuáles son los trabajos más interesantes de CVPR 2016 y por qué?

¿Cuál es el “rango de futuros posibles” para SpaceX?

¿Qué es la base del lenguaje?

La mayoría de las personas parecen un poco intimidadas o confundidas por el aprendizaje automático. Necesita aprender los conceptos básicos del aprendizaje automático. Necesita aprender cualquier lenguaje de programación como Python, programación R … Y también hay algunos requisitos de conceptos básicos matemáticos como

Cálculo

Álgebra

Probabilidad y estadística

Después de aprender todo esto, debe saber sobre algoritmos y bibliotecas de Python …

Entonces eres elegible para aprender el aprendizaje automático. Los mejores cursos en línea de aprendizaje automático

# 1 Machine Learning AZ ™: Python práctico y R en ciencia de datos

# 2 El curso completo de aprendizaje automático con Python

Elija el primer curso. De este curso puede aprender sobre:

Aprenda a crear algoritmos de aprendizaje automático en Python y R con dos expertos en ciencia de datos. Plantillas de código incluidas.

Está estructurado de la siguiente manera:

Parte 1: preprocesamiento de datos
Parte 2: Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinómica, SVR, Regresión de árbol de decisión, Regresión forestal aleatoria
Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación del árbol de decisión, Clasificación aleatoria del bosque
Parte 4 – Agrupación: K-medias, agrupación jerárquica
Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson
Parte 7 – Procesamiento del lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
Parte 9 – Reducción de dimensionalidad: PCA, LDA, Kernel PCA
Parte 10 – Selección y refuerzo del modelo: validación cruzada k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Cursos adicionales:

# 3 Ciencia de datos, aprendizaje profundo y aprendizaje automático con Python

Shishu Raj

Puede tomar el siguiente curso que necesita matemáticas básicas de la escuela secundaria como prerrequisito para aprender Machine Learning.

¿Interesado en el campo del aprendizaje automático? ¡Entonces este curso es para ti!

Los requisitos para tomar este curso son:

Solo un nivel de matemáticas de secundaria

Enlace al curso: Machine Learning AZ ™: Python práctico y R en ciencia de datos: aprenda a crear algoritmos de aprendizaje automático

Aprenda a crear algoritmos de aprendizaje automático en Python y R con dos expertos en ciencia de datos. Plantillas de código incluidas.

Este curso ha sido diseñado por dos científicos de datos profesionales para que podamos compartir sus conocimientos y ayudarlo a aprender teoría compleja, algoritmos y bibliotecas de codificación de una manera simple.

Te llevarán paso a paso al mundo del aprendizaje automático. Con cada tutorial, desarrollará nuevas habilidades y mejorará su comprensión de este desafiante pero lucrativo subcampo de la ciencia de datos.

Este curso es divertido y emocionante, pero al mismo tiempo se sumergen profundamente en Machine Learning. Está estructurado de la siguiente manera:

Parte 1: preprocesamiento de datos
Parte 2: Regresión: Regresión lineal simple, Regresión lineal múltiple, Regresión polinómica, SVR, Regresión de árbol de decisión, Regresión forestal aleatoria
Parte 3 – Clasificación: Regresión logística, K-NN, SVM, Kernel SVM, Naive Bayes, Clasificación del árbol de decisión, Clasificación aleatoria del bosque
Parte 4 – Agrupación: K-medias, agrupación jerárquica
Parte 5 – Aprendizaje de reglas de asociación: Apriori, Eclat
Parte 6 – Aprendizaje de refuerzo: límite de confianza superior, muestreo de Thompson
Parte 7 – Procesamiento del lenguaje natural: modelo de bolsa de palabras y algoritmos para PNL
Parte 8 – Aprendizaje profundo: redes neuronales artificiales, redes neuronales convolucionales
Parte 9 – Reducción de dimensionalidad: PCA, LDA, Kernel PCA
Parte 10 – Selección y refuerzo del modelo: validación cruzada k-fold, ajuste de parámetros, búsqueda de cuadrícula, XGBoost

Además, el curso está repleto de ejercicios prácticos basados en ejemplos en vivo. Entonces, no solo aprenderá la teoría, sino que también obtendrá práctica práctica para construir sus propios modelos.

Y como beneficio adicional, este curso incluye plantillas de código Python y R que puede descargar y usar en sus propios proyectos.

¿Quién es el público objetivo?

Cualquier persona interesada en Machine Learning
Estudiantes que tienen al menos conocimientos de secundaria en matemáticas y que desean comenzar a aprender Machine Learning
Cualquier persona de nivel intermedio que conozca los conceptos básicos del aprendizaje automático, incluidos los algoritmos clásicos como la regresión lineal o la regresión logística, pero que quieran obtener más información y explorar todos los diferentes campos del aprendizaje automático.
Cualquier persona que no se sienta cómoda con la codificación pero que esté interesada en el aprendizaje automático y quiera aplicarla fácilmente en los conjuntos de datos.
Cualquier estudiante en la universidad que quiera comenzar una carrera en Data Science.
Cualquier analista de datos que quiera subir de nivel en Machine Learning.
Cualquier persona que no esté satisfecha con su trabajo y que quiera convertirse en Data Scientist.
Cualquier persona que desee crear valor agregado a su negocio mediante el uso de potentes herramientas de Machine Learning

¿Qué voy a aprender?

Master Machine Learning en Python & R
Tener una gran intuición de muchos modelos de Machine Learning
Hacer predicciones precisas
Haz un análisis poderoso
Hacer modelos robustos de aprendizaje automático
Crea un fuerte valor agregado para tu negocio
Usar Machine Learning para fines personales
Manejar temas específicos como el aprendizaje por refuerzo, PNL y aprendizaje profundo
Manejar técnicas avanzadas como la reducción de dimensionalidad
Sepa qué modelo de Machine Learning elegir para cada tipo de problema
Construya un ejército de poderosos modelos de Machine Learning y sepa cómo combinarlos para resolver cualquier problema.

Enlace al curso: Machine Learning AZ ™: Python práctico y R en ciencia de datos: aprenda a crear algoritmos de aprendizaje automático

Colleen Farrelly

El requisito previo real para el aprendizaje automático no es la matemática, es el análisis de datos.

Cuando los principiantes comienzan con el aprendizaje automático, la pregunta inevitable es “¿cuáles son los requisitos previos? ¿Qué necesito saber para comenzar?

Y una vez que comienzan a investigar, los principiantes con frecuencia encuentran consejos bien intencionados pero desalentadores, como los siguientes:

Necesitas dominar las matemáticas. Necesita todo lo siguiente:
– Cálculo
– Ecuaciones diferenciales
– Estadística matemática
– Optimización
– Análisis de algoritmos
– y
– y
– y ……

También revisa París La Torre Eiffel crece 7 pulgadas más alto cada verano

Una lista como esta es suficiente para intimidar a cualquiera que no sea una persona con un título avanzado en matemáticas.

Es desafortunado, porque creo que muchos principiantes se desaniman y se asustan con este consejo.

Si te sientes intimidado por las matemáticas, tengo buenas noticias para ti: para comenzar a construir modelos de aprendizaje automático (a diferencia de la teoría del aprendizaje automático), necesitas menos experiencia matemática de lo que piensas (y casi seguramente menos matemática de lo que te han dicho que necesitas). Si está interesado en ser un profesional del aprendizaje automático, no necesita muchas matemáticas avanzadas para comenzar.

Pero no estás completamente fuera de peligro.

Todavía hay requisitos previos. De hecho, incluso si puede sobrevivir sin tener una comprensión magistral del cálculo y el álgebra lineal, hay otros requisitos previos que absolutamente necesita saber (afortunadamente, los requisitos previos reales son mucho más fáciles de dominar).

Las matemáticas no son el requisito previo principal para el aprendizaje automático

Si es un principiante y su objetivo es trabajar en la industria o los negocios, las matemáticas no son el requisito previo principal para el aprendizaje automático. Eso probablemente se opone a lo que has escuchado en el pasado, así que déjame explicarte.

La mayoría de los consejos sobre aprendizaje automático provienen de personas que aprendieron ciencia de datos en un entorno académico.

Antes de continuar, quiero enfatizar que esto no es un jab. El uso del término “académico” no pretende ser un insulto. Las personas que trabajan en la academia con frecuencia desarrollan las herramientas que usan las personas en la industria. Y a través de la investigación, también impulsan el campo hacia adelante. Admiro a estas personas.

Sin embargo, existen diferentes incentivos en un entorno académico. Esos incentivos configuran la mentalidad y el trabajo de las personas en la academia de manera diferente a los incentivos de las personas que trabajan en la industria. Además, los incentivos configuran la capacitación de las personas que ingresan a la academia: los estudiantes en un entorno académico están capacitados para ser productivos en gran medida como académicos e investigadores.

En un entorno académico, los individuos son recompensados (en gran medida) por producir investigaciones novedosas, y en el contexto de ML, eso realmente requiere una comprensión profunda de las matemáticas que subyacen en el aprendizaje automático y las estadísticas.

Sin embargo, en la industria, en la mayoría de los casos, las recompensas principales no son por la innovación y la novedad. En la industria, eres recompensado por crear valor comercial. En la mayoría de los casos, particularmente en los niveles de entrada, esto significa aplicar las herramientas existentes “disponibles”. El hecho crítico aquí, es que las herramientas existentes casi todas se encargan de las matemáticas por usted.

Las herramientas “listas para usar” se encargan de las matemáticas

Casi todas las bibliotecas y herramientas comunes de aprendizaje automático se encargan de las matemáticas difíciles para usted. Esto incluye el paquete de carets de R, así como el aprendizaje de scikit de Python. Esto significa que no es absolutamente necesario saber álgebra lineal y cálculo para que funcionen.

Hay una buena cita sobre esto de Andrew Gelman en su libro de regresión muy apreciado:

“La mayoría de los libros definen la regresión en términos de operaciones matriciales. Evitamos gran parte de este álgebra matricial por la sencilla razón de que ahora lo hacen automáticamente las computadoras … [los cálculos] son importantes pero pueden hacerse fuera de la vista del usuario “.

Tenga en cuenta que Gelman es un estadístico muy bien considerado. Es profesor de estadística en la Universidad de Columbia (una universidad de la Ivy League) y ha escrito varios de los mejores libros sobre temas como regresión y estadísticas bayesianas. Y si bien esta cita trata específicamente de la regresión, el mismo principio se aplica al aprendizaje automático, en términos generales.

Este punto debe enfatizarse: el software moderno de estadística y aprendizaje automático se ocupa de gran parte de las matemáticas por usted.

Esto significa que es posible construir un buen modelo predictivo sin casi ningún conocimiento de cálculo o álgebra lineal. Si aún no está convencido de esto, eche un vistazo cuidadoso a Introducción al aprendizaje estadístico o Modelado predictivo aplicado . Estos son dos excelentes libros sobre aprendizaje automático (AKA, aprendizaje estadístico; AKA, construcción de modelos). Casi no hay cálculo ni álgebra lineal en ninguno de ellos.

Esta es una gran noticia para un científico de datos principiante que quiere comenzar con el aprendizaje automático. Puede llamar a una función R desde caret o una función desde scikit-learn de Python y se encargará de todas las matemáticas por usted. Saber cómo funcionan todas esas matemáticas “bajo el capó” no es necesario ni suficiente para construir modelos predictivos como principiante.

Para ser claros, no estoy sugiriendo que estas herramientas hagan todo el trabajo por usted. Aún debe tener mucha práctica para aplicarlos . Debe tener una comprensión sólida de la heurística, las mejores prácticas y las reglas generales asociadas con hacer que funcionen bien. Sin embargo, una vez más, gran parte del conocimiento requerido para que estas herramientas funcionen bien no requiere álgebra matricial y cálculo.

La mayoría de los científicos de datos no hacen muchas matemáticas

Creo que muchos principiantes tienen una imagen inexacta en sus mentes de lo que los científicos de datos realmente hacen. Se imaginan que los científicos de datos pasan sus días pensativos parados en una pizarra, garabateando ecuaciones matemáticas entre sorbos de café.

Eso no es exacto.

Entonces, ¿cuántas matemáticas hace realmente un científico de datos?

Si hablamos de científicos de datos de nivel de entrada a científicos de datos de nivel intermedio, estimaría que pasan menos del 5% de su tiempo haciendo matemáticas. Y francamente, el 5% es probablemente un poco generoso.

Incluso si hablamos solo de aprendizaje automático, solo pasará menos del 5% de su tiempo haciendo matemáticas. (Y, francamente, la mayoría de los científicos de datos de nivel de entrada no pasarán gran parte de su tiempo en ML). Cuando construyes un modelo, pasarás muy, muy poco tiempo haciendo matemáticas.

La realidad es que en la industria, los científicos de datos simplemente no hacen matemáticas de nivel mucho más alto.

Pero la mayoría de los científicos de datos pasan una gran cantidad de tiempo obteniendo datos, limpiando datos y explorando datos. Esto se aplica tanto a la ciencia de datos en general, como al aprendizaje automático específicamente; y se aplica particularmente a los principiantes.

Si desea comenzar con el aprendizaje automático, la habilidad de requisito previo real que necesita aprender es el análisis de datos .

El requisito previo principal para el aprendizaje automático es el análisis de datos.

Para los profesionales principiantes (es decir, piratas informáticos, codificadores, ingenieros de software y personas que trabajan como científicos de datos en negocios e industria) no es necesario saber tanto cálculo, álgebra lineal u otras matemáticas de nivel universitario para hacer las cosas.

Pero absolutamente necesita saber el análisis de datos .

El análisis de datos es la primera habilidad que necesita para hacer las cosas.

Es el requisito previo real para comenzar con el aprendizaje automático como profesional.

(Tenga en cuenta que a medida que esta publicación continúe, usaré el término “análisis de datos” como una abreviatura para “obtener datos, limpiar datos, agregar datos, explorar datos y visualizar datos”).

Esto es particularmente cierto para los principiantes. Aunque a niveles altos hay algunos científicos de datos que necesitan una habilidad matemática profunda, en un nivel inicial, repito, no es necesario conocer el cálculo y el álgebra lineal para construir un modelo que haga predicciones precisas.

Pero será casi imposible construir un modelo si no tiene habilidades sólidas con el análisis de datos.

Incluso si usa herramientas “listas para usar” como el Rt caret y el aprendizaje de scikit de Python, herramientas que hacen gran parte de las matemáticas difíciles para usted, no podrá hacer que estas herramientas funcionen sin una sólida comprensión del análisis exploratorio de datos y Visualización de datos. Para aplicar correctamente las herramientas como caret y scikit-learn, deberá poder recopilar, preparar y explorar sus datos. Necesita una comprensión sólida del análisis de datos.

También revisa París La Torre Eiffel crece 7 pulgadas más alto cada verano

Shishu Raj

Matemáticas, particularmente cálculo multivariable (gradientes, en particular), álgebra lineal (soluciones y descomposiciones de sistemas lineales) y probabilidad / estadística (preferiblemente a nivel de posgrado). Estos proporcionarán una base suficiente para comprender los algoritmos y sus fortalezas / limitaciones. Para la investigación, se necesitarán cursos más avanzados (análisis real, topología …).

Arunkumar Gujjar

Una mente abierta para aceptar hechos, cuestionar los problemas desde una perspectiva diferente, preliminar del conocimiento de las matrices y las matemáticas.

Te sugiero que comiences con Andrew NG Course of ML en Coursera,

Primero le enseñará los conceptos básicos sobre cómo usar Matrix, Octave (Alternativa de código abierto para MATLAB), Algoritmos ML.

Luego, las preguntas en Problemas lo guiarán a su destino.

¿Alguna ayuda más? Siéntase libre de comentar.

COMO

Seguir y votar.

Arunkumar Gujjar

Tradicionalmente, los estudiantes primero pasarán meses o incluso años en la teoría y las matemáticas detrás del aprendizaje automático. Se sentirán frustrados por los símbolos y fórmulas arcanas o se desanimarán por el gran volumen de libros de texto y trabajos académicos para leer.

A menos que quieras dedicarte a la investigación de doctorado, es exagerado. Para la mayoría de las personas, el enfoque emprendedor es superior al enfoque académico por 3 razones:

Te divertirás más . Al alternar entre teoría, práctica y proyectos, llegarás a resultados reales más rápido. Este es un gran impulso en la moral.
Desarrollarás habilidades prácticas que la industria demanda. A las empresas no les importa si puedes obtener pruebas. Les importa si puedes convertir sus datos en oro.
Creará su cartera en el camino. Con proyectos prácticos, creará convenientemente una cartera que puede mostrar a los empleadores.

En pocas palabras, la forma de arranque automático es más rápida y más práctica.

Sin embargo, definitivamente pone más responsabilidad en sus manos para seguir adelante. ¡Esperamos que esta guía lo ayude a mantenerse en el buen camino!

Hay 4 pasos para aprender ML.

Prerrequisitos: construya una base de estadísticas, programación y un poco de matemática.
Modo esponja: sumérgete en la teoría esencial detrás de ML.
Práctica dirigida: utilice los paquetes ML para practicar los 9 temas esenciales.
Proyectos de aprendizaje automático: sumérjase en dominios interesantes con proyectos más grandes.

Arunkumar Gujjar

Como también un hombre nuevo en esta área, enumero varios requisitos previos necesarios para el aprendizaje automático, así como el aprendizaje profundo.

# matemáticas

álgebra lineal: se centran en el cálculo de la matriz, incluida la derivada, la factorización.

matemática superior: enfoque en derivación algebraica

# habilidades en programación

Python es una buena opción porque es fácil de comenzar y muchas de las excelentes bibliotecas de aprendizaje automático están escritas por él, incluyendo sklearn, pTorch, etc.

Isabel Metzger

Antes de desarrollar habilidades de aprendizaje automático, tomé tres clases de programación en la escuela de medicina: Python I y programación para análisis de datos con R, y bioinformática (usé python y R en esta clase).

Tomé una clase de informática de salud el semestre pasado, donde realmente apliqué el aprendizaje automático (¡y estamos presentando en el Simposio de Aprendizaje Automático de NYAS!). Pude comenzar a construir modelos de aprendizaje automático en 4 meses (¡y aprendo lentamente, por lo que definitivamente puedes aprenderlo en ese momento! Acabo de practicar / leer libros / hacer ejercicios todos los días)

Solo soy un principiante con el aprendizaje automático, pero personalmente creo que una clase de introducción sólida a Python o R y un análisis exploratorio de datos / curso intermedio proporciona suficiente conocimiento para comenzar un curso de aprendizaje automático. En la primavera, estoy aprendiendo profundamente.

Shishu Raj