Aprendizaje automático: al construir un modelo de regresión lineal, ¿cómo decido entre variar el grado del polinomio y variar el parámetro de regularización?

En realidad, como cualquier problema de aprendizaje automático, esto tiene que ver con la ingeniería de características. Eso siempre es un trabajo duro y un poco de suerte.

Por lo general, lo que uno hace es un poco de intuición. Lo hago de esta manera: hay muchas personas con más experiencia y pueden asesorar sobre mejores formas.

  1. Sé ‘basado en el conocimiento del dominio si una característica particular tendría más influencia en la variable objetivo. En tal caso, agrego 2do grado para esa característica.
  2. Uso la regularización L1 si tengo un conjunto de características dispersas para eliminar características innecesarias y luego uso el descenso de gradiente con la regularización L2 para llegar a las variables correctas.
  3. En cada lugar utilizo la validación cruzada, dependiendo del volumen de datos. Prefiero K-Fold para la competencia, ya que el conjunto de datos suele ser pequeño.

More Interesting

¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?

¿Cómo podría el aprendizaje automático mejorar la nariz electrónica?

¿Se puede trabajar en Machine Learning con un doctorado en estadísticas?

¿Cuáles son algunas buenas escuelas de investigación (PhD) para Inteligencia Artificial General (no Machine Learning)?

Cómo comenzar a trabajar en conjuntos de datos de Kaggle

Durante la validación cruzada k-fold, ¿cuáles son algunas soluciones posibles cuando la varianza de las estimaciones de error de prueba es muy alta?

¿Qué aplicaciones prácticas ve para ejecutar los modelos TensorFlow en un teléfono inteligente?

Estoy creando una plataforma de transmisión en vivo: ¿cómo puedo conectarme y usar varias cámaras web al mismo tiempo?

¿Hay ejemplos de organizaciones de ciencias de la vida que logren resultados en el descubrimiento de drogas a través del aprendizaje automático que no serían posibles sin el aprendizaje automático?

¿Cuáles son los formatos estándar para compartir datos de aprendizaje automático?

¿Qué algoritmo de recomendaciones es más efectivo para desarrollar un entorno de crowdsourcing y qué lenguaje de programación sugiere?

¿Cuál es la diferencia entre Hadoop y Teradata aster?

¿Cómo funcionan los aceleradores de procesador?

¿Cuáles son los puntos importantes de comparación entre Mahout y otras bibliotecas Java ML como Lingpipe o Weka?

Cómo iniciar el aprendizaje automático desde PHP