¿Cuál debería ser el contenido del curso ‘Introducción al aprendizaje automático’ para estudiantes de 6to semestre de CS sin conocimiento previo de ciencias de datos?

Hay un buen número de clases introductorias de aprendizaje automático que se imparten en el nivel avanzado de pregrado / posgrado introductorio, y no estoy seguro de por qué este curso realmente debería ser diferente de esos. Dicho esto, intentaré establecer un plan de estudios basado en el aprendizaje automático: una perspectiva probabilística con material extra tomado de Introducción al aprendizaje estadístico. Supongo que los estudiantes que ingresan han tenido cursos de cálculo multivariable, álgebra lineal, probabilidad y estadística matemática.

El propósito de un curso como este es presentar a los estudiantes la forma en que las personas en el aprendizaje automático piensan y hablan sobre los problemas. Como tal, necesita introducir todos los algoritmos principales y un poco de la teoría. La tarea consistiría en una combinación de análisis de datos (¡en R, por supuesto!) Y algunos ejercicios matemáticos básicos. Aquí hay un bosquejo de los temas que cubriría y los capítulos correspondientes en los libros que mencioné:

Introducción (Murphy 1–3; ISLR 2)

¿Qué es el aprendizaje automático?
Teoría de decisión básica y el marco PAC
Revisión de probabilidad
El ingenuo clasificador bayesiano

Modelos lineales básicos (Murphy 7, 13; ISLR 3, 6)

Regresión lineal simple
Revisión de álgebra lineal y estadísticas
La distribución normal multivariante.
Regresión lineal como MLE vs. regresión lineal para predicción
Regularización, regresión de crestas y lazo.

Modelos lineales avanzados (Murphy 8–9; ISLR 4)

Regresión no lineal
El equilibrio de sesgo-varianza
Regresión logística
Técnicas de optimización para la estimación de parámetros.

Descenso de gradiente
Método de Newton

Regresión logística como modelo lineal generalizado.

Clasificación (mis propias notas)

Clases discretas vs. valores continuos
Medidas de desempeño
Regresión logística como clasificador
Clasificación multiclase

Evaluación del modelo fuera de muestra (ISLR 5)

Validación cruzada
El bootstrap

Clasificadores no lineales (Murphy 14, 16; ISLR 4, 8–9)

[matemáticas] k [/ matemáticas] vecinos más cercanos
SVM y métodos basados en el núcleo
Métodos basados en árboles
Redes neuronales simples
Ensemble learning
Interpretabilidad del modelo

Aprendizaje no supervisado (ISLR 10)

Agrupamiento
PCA

Temas avanzados

Modelos gráficos probabilísticos (Murphy 10)
Aprendizaje en línea (Murphy 8.5)
Aprendizaje profundo (Murphy 28)

Esto es algo ambicioso para una clase de semestre, pero creo que el núcleo es definitivamente factible.

Aprendizaje automáticoCiencia de datosEducación en informática