¿Qué es la selección de variables en bloques cuando se hace un análisis de regresión?

He estado tratando de resolver esto, y estoy luchando. La respuesta de Peter corresponde a lo que leí, pero pasa por alto el tema.

Mi razón para hacer la pregunta es determinar si es igual o similar a lo que hacemos en la calificación crediticia, que en mi antiguo empleador se llamaba ” puesta en escena “. Básicamente, implicaba la creación de grupos variables, pero cada vez que se consideraba un nuevo grupo había un desplazamiento para los resultados de todos los grupos anteriores. Esto se hizo para corregir los resultados, ya sea para dar mayor énfasis al primer grupo porque eran nuestros datos, o para reducir las variables que eran inestables o sospechosas.

Utilizamos la regresión gradual dentro del grupo, y teníamos ‘vays y medios’ para abordar los problemas relacionados con el sobreajuste, la inflación de varianza, las correlaciones, etc. . ‘

Por supuesto, habría otras formas de lidiar con los bloques. Por ejemplo, un ” conjunto de bloques sabios “, donde se crean diferentes modelos para cada grupo que luego se integran en uno con diferentes coeficientes beta para cada bloque. O ‘ reducción variable en bloques ‘, donde se desarrollan modelos para cada grupo solo para eliminar características impredecibles o débiles, antes de considerar todo en conjunto.

He creado estas etiquetas, aunque solo sea porque no conozco los nombres comúnmente aceptados. ¿Cómo se relacionan los enfoques secuenciales, jerárquicos y de bloques múltiples y cuáles son sinónimos? Si alguien puede ayudar, sería apreciado.

Block wise es una forma de construir modelos agregando variables en “bloques”; por ejemplo, puede agregar un grupo de variables demográficas en un bloque. No es lo mismo que secuencial o jerárquico, ninguno de los cuales hace esto.

Se usa cuando desea ver los efectos de agregar variables de esta manera, a menudo para comparar modelos con y sin ciertos tipos de variables.

Ciertamente es mejor que cosas como el cribado hacia adelante, hacia atrás, paso a paso o bivariado, todo lo cual puede dar resultados incorrectos. Si hay buenas razones para querer comparar modelos de esta manera, entonces blockwise es bueno.

More Interesting

¿Cómo manejo la recompensa retrasada en el aprendizaje por refuerzo?

¿Cómo puede un estudiante graduado de primer año en ciencias de la computación encontrar un trabajo en minería y análisis de datos después de graduarse?

Aprendizaje automático: ¿es el enfoque descrito a continuación una buena forma de evaluar la calidad de las recomendaciones basadas en comentarios implícitos?

¿Qué es el aprendizaje profundo para un principiante?

¿Cuáles son algunos proyectos que puedo hacer mientras aprendo aprendizaje automático?

¿Es posible conseguir un trabajo en Machine Learning sin experiencia laboral?

¿Qué son los estados espurios en las redes Hopfield?

Cómo hacer frente al aprendizaje de la ciencia de datos

Diseño de vectores de características para algoritmos de aprendizaje automático. ¿Debo poner características de diferentes dominios en el mismo vector?

Aprendí algo de teoría de la probabilidad, pero aún me cuesta leer el aprendizaje automático: una perspectiva probabilística. ¿Qué libro de texto de teoría de probabilidad me recomiendan para estudiar el aprendizaje automático?

¿Auto-sklearn es realmente mejor que un clasificador único optimizado por hiperparámetro? ¿Tienes experiencia con esto?

En los Estados Unidos, ¿es ilegal entrenar redes neuronales usando imágenes con derechos de autor?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

¿Cuál es el mejor curso en línea para el aprendizaje automático con Python?

¿Qué es la selección de variables en bloques cuando se hace un análisis de regresión?