Utilizando la regresión logística y la regularización L1 / L2, ¿debo preocuparme por la selección de características?

Si está utilizando la regularización L1, entonces probablemente le interese la selección de funciones, ya que esa es su principal potencia. Reduce la complejidad del modelo aprendido al hacer que algunas características se ignoren por completo, lo que se denomina escasez. Como comentario aparte, pero como lo mencionas, la regularización L2 no es realmente fuerte para la selección de características, sino que trata de reducir la complejidad del modelo al evitar una ponderación muy grande en las características.

Para responder a su pregunta … Al usar la regularización L1, ya está pensando en la selección automática de funciones. La verdadera pregunta es: ¿debería preocuparse más por la selección de funciones? Eso depende de su problema, cuánto tiempo tiene y su nivel de experiencia.

Si usa la regularización L1 y sabe lo que significan las características, entonces es una buena práctica observar los pesos resultantes para ver qué características se seleccionaron / ignoraron. Comprueba cuán sensato es esto: en particular, observa si se desactivaron las funciones que sabes (o crees) que deberían ser importantes. Si es así, es posible que deba considerar el escalamiento adecuado o las técnicas de ingeniería de características que involucran combinaciones de las características existentes.

Aprendizaje automáticoCiencia de datosRegresiónRegresión logística

Related Content

Los algoritmos parecen estar involucrados con muchas partes de nuestras vidas. ¿Qué son y cómo podría aprender más?

¿Por qué asumiríamos que los datos son iid cuando no lo son?

Como desarrollador web junior sin una sólida base matemática, ¿qué enfoques debo tomar para dominar el aprendizaje automático y aplicarlo al mundo empresarial? Acabo de empezar a estudiar la "Introducción al álgebra lineal" de Gilbert Strang.

¿Cómo evaluaría un sistema de recomendación si todo lo que tiene son calificaciones de elementos de usuario?

¿Debo ir al análisis de datos o al aprendizaje automático?

¿Cuáles son algunas aplicaciones del aprendizaje semi-supervisado?

¿Qué significa el aprendizaje automático?

Si tu puedes. La regularización penalizará los términos que aumentan la complejidad del modelo sin mejorar su fidelidad, pero no hará la selección de características e ingeniería para usted. Para eso, puede usar PCA, CCA y otros métodos de reducción de dimensiones.

Alex Gilgur

Siempre debe preocuparse por la selección de funciones, a menos que sepa, a priori , exactamente qué funciones desea en su modelo.

Erlend Davidson

More Interesting

¿Cómo funciona el sistema de recomendación de filtrado basado en contenido por word2vec usando etiquetas?

¿Cómo se convierten los físicos en ingenieros de aprendizaje automático?

Para un SVM lineal, ¿cómo se elige la intersección b * para el límite de decisión de margen máximo?

¿Por qué ha sido tan efectivo OpenAI?

¿Qué computadora necesito para trabajar en aprendizaje profundo y redes neuronales?

¿Cuál es el mejor enfoque para aprender sobre los algoritmos de redes neuronales de predicción del mercado de valores?

En una unidad LSTM, ¿cuál es la razón detrás del uso de una activación de tanh?

¿Qué tamaño debería tener mi bosque aleatorio aproximadamente si tengo 17 variables y medio millón de registros?

¿Cuándo recomendaría los modelos gráficos sobre el aprendizaje profundo?

¿Cómo identificar el contexto basado en la oración?

¿Cuáles son los mejores usos de Deep Learning para la clasificación de relevancia de búsqueda?

¿Qué piensa sobre los procesos gaussianos profundos?

¿Hay alguna anomalía inexplicable en la codificación de la computadora que pueda sugerir que las máquinas tienen alma?

¿Qué teoría debería aprender a crear un algoritmo para clasificar los textos automáticamente?

¿Qué tipo de sistema de recomendación usar con datos extremadamente escasos?

Web Analytics