Hay un buen número de clases introductorias de aprendizaje automático que se imparten en el nivel avanzado de pregrado / posgrado introductorio, y no estoy seguro de por qué este curso realmente debería ser diferente de esos. Dicho esto, intentaré establecer un plan de estudios basado en el aprendizaje automático: una perspectiva probabilística con material extra tomado de Introducción al aprendizaje estadístico. Supongo que los estudiantes que ingresan han tenido cursos de cálculo multivariable, álgebra lineal, probabilidad y estadística matemática.
El propósito de un curso como este es presentar a los estudiantes la forma en que las personas en el aprendizaje automático piensan y hablan sobre los problemas. Como tal, necesita introducir todos los algoritmos principales y un poco de la teoría. La tarea consistiría en una combinación de análisis de datos (¡en R, por supuesto!) Y algunos ejercicios matemáticos básicos. Aquí hay un bosquejo de los temas que cubriría y los capítulos correspondientes en los libros que mencioné:
- Introducción (Murphy 1–3; ISLR 2)
- ¿Qué es el aprendizaje automático?
- Teoría de decisión básica y el marco PAC
- Revisión de probabilidad
- El ingenuo clasificador bayesiano
- Modelos lineales básicos (Murphy 7, 13; ISLR 3, 6)
- Regresión lineal simple
- Revisión de álgebra lineal y estadísticas
- La distribución normal multivariante.
- Regresión lineal como MLE vs. regresión lineal para predicción
- Regularización, regresión de crestas y lazo.
- Modelos lineales avanzados (Murphy 8–9; ISLR 4)
- Regresión no lineal
- El equilibrio de sesgo-varianza
- Regresión logística
- Técnicas de optimización para la estimación de parámetros.
- Descenso de gradiente
- Método de Newton
- Regresión logística como modelo lineal generalizado.
- Clasificación (mis propias notas)
- Clases discretas vs. valores continuos
- Medidas de desempeño
- Regresión logística como clasificador
- Clasificación multiclase
- Evaluación del modelo fuera de muestra (ISLR 5)
- Validación cruzada
- El bootstrap
- Clasificadores no lineales (Murphy 14, 16; ISLR 4, 8–9)
- [matemáticas] k [/ matemáticas] vecinos más cercanos
- SVM y métodos basados en el núcleo
- Métodos basados en árboles
- Redes neuronales simples
- Ensemble learning
- Interpretabilidad del modelo
- Aprendizaje no supervisado (ISLR 10)
- Agrupamiento
- PCA
- Temas avanzados
- Modelos gráficos probabilísticos (Murphy 10)
- Aprendizaje en línea (Murphy 8.5)
- Aprendizaje profundo (Murphy 28)
Esto es algo ambicioso para una clase de semestre, pero creo que el núcleo es definitivamente factible.
- ¿Cómo es útil el Big Data para las personas?
- ¿Cuál es el flujo de trabajo habitual de un científico de datos antes de comenzar a analizar un conjunto de datos?
- ¿Cuáles son los mejores equipos de ciencia de datos fuera de los Estados Unidos?
- ¿Cuáles son los pros y los contras de usar Kaggle Scripts?
- ¿Cuál es el alcance y qué sucede exactamente en las pruebas de Big Data?