No estoy de acuerdo con su afirmación de que son específicos del dominio, muchos son muy generales.
Caracterizaría tres algoritmos centrales porque muestran diferentes sabores del aprendizaje automático, y agregaría un cuarto para los matemáticamente inclinados:
1. Aprendizaje basado en vecino / instancia más cercano. Este es un algoritmo muy fácil: simplemente calcule la distancia a las instancias cercanas y elija la clase de la más cercana. Luego, puede obtener más fantasía a través de varios enfoques (por ejemplo, k vecino más cercano: elija los k más cercanos y vote entre las clases predichas), pero eso es todo para los twiddles.
- ¿Cuáles son las aplicaciones HOT de Machine Learning para las ciencias biológicas?
- ¿Cuáles son algunos buenos métodos para explorar datos de alta dimensión?
- Cómo implementar SVM yo mismo
- ¿Cuáles son algunas historias de éxito para Dirichlet Process Clustering?
- Al diseñar nuevas arquitecturas de aprendizaje profundo, ¿cómo se determina si la arquitectura es mala o si la optimización del modelo es el problema?
2. Bayes ingenuos: también muy limpios, tanto matemática como conceptualmente: trate cada atributo como una distribución de probabilidad independiente, modele las probabilidades en función de los datos observados y lleve el producto a todos los atributos, luego elija la clase con la probabilidad más alta. Muy simple.
3. Árboles de decisión: este es el algoritmo clásico de aprendizaje automático (CART o C4.5). En cada punto, tome una decisión simple sobre qué atributo probar, y cuando golpea una hoja del árbol, se etiqueta con una clase. No hay muchos parámetros para modificar: ¿cuál es el nodo hoja más pequeño que está dispuesto a aceptar?
4. [Más matemática] Máquinas de vectores de soporte: proyecte el problema de clasificación en un espacio dimensional alto, luego intente encontrar la superficie en ese espacio dimensional alto que separa las características tanto como sea posible (el margen). Una vez que tenga esa superficie, proyecte el nuevo punto en ese espacio y decida en qué lado de la superficie se encuentra. Este tiene algunos giros: ¿el principal es en qué espacio de alta dimensión proyectas?