Antes de elegir cualquier algoritmo de aprendizaje automático, uno debe trazar el objetivo (variables dependientes) con respecto a las características (variables independientes). Esto nos permite analizar qué tipo de conjunto de datos estamos tratando, es decir, si los datos están distribuidos de forma lineal o no lineal.
Si su conjunto de datos tiene muchas características, utilice cualquier técnica de reducción de dimensionalidad como PCA (Análisis de componentes principales), etc. para que podamos ver un diagrama 2D o 3D y verificar qué tipo de conjunto de datos es, lineal o no lineal. También nos permitirá aumentar la precisión de la predicción de la variable objetivo en etapas posteriores al permitirnos identificar características que están más correlacionadas con la variable objetivo.
Varios algoritmos de regresión están disponibles,
- ¿Qué estrategia emplearías para vencer a un algoritmo de computadora jugando póquer matemáticamente perfecto?
- ¿Qué es mejor entre la búsqueda binaria y el árbol de búsqueda binaria para buscar?
- ¿Cuál es el mejor algoritmo para encontrar el camino con dos limitaciones?
- ¿Qué estructura de datos debo usar en Java para almacenar y obtener el siguiente tipo de datos? ¿Cuál debería ser la estructura de mi clase para este propósito?
- ¿Cuál fue el algoritmo utilizado por AlphaGo para ganar el juego de Go contra el campeón europeo de Go humano?
- Regresión lineal
- Regresión polinómica
- Regresión SVM, etc.
En todos ellos, elegir la configuración adecuada y buena de los parámetros para el modelo de regresión elegido es el paso más importante. Entonces necesitaremos experimentar con eso. El descanso es el trabajo del algoritmo 🙂