¿Es necesario que un tipo de aprendizaje automático conozca todo tipo de modelos y algoritmos de aprendizaje?

Permítanme comenzar con una analogía. Cuando era más joven solía pintar. Con colores de póster (una pintura opaca soluble en agua). En teoría , podría gestione con el conjunto básico de 6 colores que puede comprar, creando los demás mezclándolos en una paleta. Pero eso no sería rápido. También podría ser una distracción. Especialmente cuando había un montón de otros tonos disponibles a bajo precio.

Veo algoritmos en Machine Learning como estos colores. Y el problema que estás tratando de resolver como la pintura que quieres hacer.

========================

Todos los algoritmos de aprendizaje automático resuelven un problema de optimización basado en ciertos supuestos sobre los datos.

Piense en la combinación (wref a un algoritmo):
problema de optimización resuelto + supuestos sobre datos
como una solución estándar preempaquetada que espera ser aplicada a un problema.

Ahora, cuando realmente está resolviendo un problema, los datos que está viendo tienen ciertas propiedades :

  • tienes mucho
  • no es de alta dimensión
  • la secuencia no importa
  • tiene solo un puñado de características discriminatorias
  • las etiquetas son linealmente separables

etc.

y hay ciertas métricas que quizás desee optimizar, por ejemplo, alta precisión, baja varianza, etc., dependiendo de la tarea exacta que esté resolviendo.

La solución que debe elegir idealmente debe tener sus ” supuestos sobre los datos” que coincidan con estas propiedades.

El ” problema de optimización que está siendo resuelto” por su solución idealmente debe coincidir con su objetivo de optimización.

Conocer más algoritmos te ayuda a hacer esta correspondencia más rápido. Y de manera más confiable, porque, muy probablemente, esta solución estándar proviene de una revista revisada por pares de autores que han dedicado mucho tiempo a estudiar su problema.

En teoría , podrías descubrirlos desde cero, pero no quieres. Y, de todos modos, encontrar un buen algoritmo desde cero es mucho más difícil que mezclar colores 🙂

Algunos problemas son fáciles de resolver con un tipo de algoritmo de aprendizaje automático, algunos con otro. Cuantas más técnicas conozca, mayor será la gama de problemas que puede resolver. No existe un algoritmo de aprendizaje universal para las computadoras, y no es probable que haya uno hasta que las computadoras puedan inventar el suyo.

Para un chico probablemente no, pero para un experto sí. Por ejemplo, hasta que comprenda cómo funciona Multinomial Naive Bayes, no podrá decir que es la mejor opción de algoritmo de aprendizaje cuando sus datos de prueba están sesgados con respecto a los datos de entrenamiento.

Hasta que comprenda cómo funcionan los SVM, no podrá descubrir cómo hacer que cometa menos errores en la clase A frente a la clase B. Y así sucesivamente.