La agrupación puede ser una buena idea para un tema de aprendizaje automático (aprendizaje no supervisado) para estudiantes de secundaria, ya que es fácil mostrar las cosas gráficamente en 2D.
Fuera de la cabeza (inspirado en uno de los cursos de aprendizaje automático de Cornell), dado varios grupos sin etiquetar que podrían distinguirse; Aquí hay algunas preguntas divertidas y fáciles (descargo de responsabilidad: tengo una idea deformada de lo que significa divertido y fácil).
- k significa
¿Cuántos grupos crees que son?
¿Cómo lograste decir esto?
En sus propias palabras (deles una descripción general de lo que significa k): ¿cómo implementaría el código para esto?- ¿Qué se enseña en los cursos de posgrado de aprendizaje automático?
- ¿Cuál es el mejor lenguaje para el procesamiento del lenguaje natural?
- ¿Cómo es ser ingeniero de aprendizaje automático en Quora?
- ¿Puede proporcionar las tareas que se le han asignado mientras buscaba una maestría en el campo CS?
- ¿Cuáles son los mejores algoritmos para construir sistemas de recomendación?
Quizás para los más avanzados: ¿crees que el punto de partida es importante?
¿Cómo crees que la gente elige el número de grupos en la práctica? {más abierto; rebotar ideas sobre}
- agrupación de un solo enlace
Usted * podría * involucrar a los estudiantes dándoles una “cara sonriente” de puntos. Hecho bien: el perímetro de la cara forma un grupo; El interior de la cara (nariz, ojos, boca) forma otro grupo.
Demuestre cómo funciona el algoritmo visualmente en 2D -> luego pregunte a los estudiantes qué creen que realmente hace el algoritmo
Podría tener discusión (comparar y contrastar) agrupación de enlaces únicos con k-means.
- (para los realmente avanzados; agrupamiento espectral)
Aquí, no espere que los estudiantes comprendan las matemáticas básicas detrás de esto; pero podría tener alguna interfaz de arrastrar y soltar para construir gráficos; y luego “mostrar” los grupos después de que se haya implementado el grupo espectral.
Supongo que * podría * darles el código que más toma como entradas:
- “Distancias” (dependiendo de cómo se definan) entre puntos (ángulos, distancias euclidianas, l_1 distancia)
- “Decisión tomada” para formar un grupo
y hacer que los estudiantes experimenten para crear sus propios algoritmos de agrupamiento.
Puntos de referencia: compare con las etiquetas verdaderas de los datos que creó. De hecho, ¡los estudiantes de secundaria incluso podrían descubrir algo interesante sobre los datos que tienes de lo que no te diste cuenta!