¿Cuál debería ser el contenido del curso ‘Introducción al aprendizaje automático’ para estudiantes de 6to semestre de CS sin conocimiento previo de ciencias de datos?

Hay un buen número de clases introductorias de aprendizaje automático que se imparten en el nivel avanzado de pregrado / posgrado introductorio, y no estoy seguro de por qué este curso realmente debería ser diferente de esos. Dicho esto, intentaré establecer un plan de estudios basado en el aprendizaje automático: una perspectiva probabilística con material extra tomado de Introducción al aprendizaje estadístico. Supongo que los estudiantes que ingresan han tenido cursos de cálculo multivariable, álgebra lineal, probabilidad y estadística matemática.

El propósito de un curso como este es presentar a los estudiantes la forma en que las personas en el aprendizaje automático piensan y hablan sobre los problemas. Como tal, necesita introducir todos los algoritmos principales y un poco de la teoría. La tarea consistiría en una combinación de análisis de datos (¡en R, por supuesto!) Y algunos ejercicios matemáticos básicos. Aquí hay un bosquejo de los temas que cubriría y los capítulos correspondientes en los libros que mencioné:

  1. Introducción (Murphy 1–3; ISLR 2)
    1. ¿Qué es el aprendizaje automático?
    2. Teoría de decisión básica y el marco PAC
    3. Revisión de probabilidad
    4. El ingenuo clasificador bayesiano
  2. Modelos lineales básicos (Murphy 7, 13; ISLR 3, 6)
    1. Regresión lineal simple
    2. Revisión de álgebra lineal y estadísticas
    3. La distribución normal multivariante.
    4. Regresión lineal como MLE vs. regresión lineal para predicción
    5. Regularización, regresión de crestas y lazo.
  3. Modelos lineales avanzados (Murphy 8–9; ISLR 4)
    1. Regresión no lineal
    2. El equilibrio de sesgo-varianza
    3. Regresión logística
    4. Técnicas de optimización para la estimación de parámetros.
      1. Descenso de gradiente
      2. Método de Newton
    5. Regresión logística como modelo lineal generalizado.
  4. Clasificación (mis propias notas)
    1. Clases discretas vs. valores continuos
    2. Medidas de desempeño
    3. Regresión logística como clasificador
    4. Clasificación multiclase
  5. Evaluación del modelo fuera de muestra (ISLR 5)
    1. Validación cruzada
    2. El bootstrap
  6. Clasificadores no lineales (Murphy 14, 16; ISLR 4, 8–9)
    1. [matemáticas] k [/ matemáticas] vecinos más cercanos
    2. SVM y métodos basados ​​en el núcleo
    3. Métodos basados ​​en árboles
    4. Redes neuronales simples
    5. Ensemble learning
    6. Interpretabilidad del modelo
  7. Aprendizaje no supervisado (ISLR 10)
    1. Agrupamiento
    2. PCA
  8. Temas avanzados
    1. Modelos gráficos probabilísticos (Murphy 10)
    2. Aprendizaje en línea (Murphy 8.5)
    3. Aprendizaje profundo (Murphy 28)

Esto es algo ambicioso para una clase de semestre, pero creo que el núcleo es definitivamente factible.

Cuál debería ser la secuencia de los temas.

  • Estadísticas básicas / álgebra lineal para ML (funciones convexas y no convexas y optimización, análisis de hipótesis, etc.)
  • Conceptos básicos de modelos supervisados ​​- no supervisados
  • Conceptos básicos de clasificación – Modelos de regresión
  • Diferentes tipos de funciones de pérdida / costo (pérdida cuadrada, pérdida SVM, pérdida de registro, etc.)
  • Diferentes tipos de matriz / métodos de evaluación (precisión, recuperación, puntaje F2, AUC, etc.)
  • Diferentes métodos de optimización (SGD, Batch GD, etc.)
  • Métodos de regularización (p. Ej., L1-L2, Tikahov-Evanov)
  • Conceptos básicos de los modelos ML (Regresión logística, SVM, árboles de decisión, etc.)
  • ¿Cómo seleccionar y ajustar los modelos ML basados ​​en los datos que tiene?
  • Cómo mejorar los modelos ML (selección de características / ingeniería, conjunto, técnicas de refuerzo, por ejemplo, Adaboost)

¿Cuál debería ser el equilibrio entre la teoría y los ejemplos prácticos en clase?

  • Haga que sus tareas sean una buena combinación de teoría y problemas del mundo real. Como ejemplo, en la tarea, puede pedirles a los estudiantes que expliquen las formas de superar el sobreajuste / regularización L2 y, al mismo tiempo, debe pedirles que construyan los modelos de regresión en cualquier conjunto de datos de muestra y lo mejoren con esos métodos.
  • Consulte las asignaciones de cursos de NYU Data Science ML para tener la idea de aprendizaje automático y estadísticas computacionales

Creo que deberías echar un vistazo en el curso de Machine Learning del curso (de Andrew Ng) en Machine Learning – Stanford University | Coursera

La mayor parte de los cursos siguen ese orden (en realidad es común ver redes neuronales al final, pero a la mitad del curso también está bien y estima a los estudiantes porque es un tema muy candente hoy).

También me gustaría sugerirle que eche un vistazo al libro Introducción al aprendizaje estadístico con R (ISLR: Introducción al aprendizaje estadístico), que es una referencia increíble. Para el sexto semestre de CS, creo que ya tienen algunos conocimientos sobre cálculo, álgebra lineal, estadísticas y conceptos básicos de probabilidad. Esto debería ser un requisito previo.

Sobre el equilibrio de la teoría y la práctica: eso depende. Para un curso de ingeniería, creo que deberías concentrarte más en las tareas prácticas (por ejemplo, dar un problema de regresión y pedirles que encuentren una buena solución. Y recompensar lo mejor [Por diversión, no para promover una guerra] como una competencia de kaggle En realidad, podrías usar las competencias pasadas de Kaggle para esto).

Estoy seguro de que alguien le dará una respuesta más completa, pero como estudiante de pregrado, ese es el tipo de curso que realmente me gustaría tomar.

More Interesting

¿Vale la pena hacer el Programa de Diploma de Postgrado en Ciencia de Datos de Manipal Global Academy of Data Science?

¿Qué universidades son mejores para la ciencia de datos?

Desde la licenciatura en biología molecular hasta el aprendizaje automático de Python, ¿cómo y qué lo inspiró a emprender el camino hacia la ciencia de datos?

¿Cuál es la diferencia entre Driven-data y Data?

Estoy empezando en Kaggle. Tengo experiencia en aprendizaje automático y modelos gráficos probabilísticos. ¿Cómo puedo mejorar en Kaggle?

Cómo encontrar un buen formato para big data

¿Cuál es el mejor curso fuera de línea para big data y data science en Navi Mumbai?

¿Cuál es la diferencia entre el almacenamiento de datos, la minería de datos y el análisis de datos?

¿Aprender SQL es bueno para carreras potenciales en análisis financiero y de datos?

¿Cuáles son los mejores institutos para la capacitación en línea de ciencia de datos en Hyderabad?

Soy ingeniero industrial (nunca he estado en ciencias de la computación) pero estoy interesado en la ciencia de datos. ¿Qué tengo que hacer?

¿Un perfil como el mío tiene alguna posibilidad de ingresar a un buen instituto a través de GRE para obtener una maestría en ciencia de datos?

¿Hay alguna manera de comprimir una gran cantidad de datos a un tamaño muy pequeño como en una bomba zip?

Para Big Data, ¿cómo podría uno aprenderlo desde cero?

¿Por qué Excel es una herramienta tan infravalorada para el análisis de datos?