¿Cuáles son los métodos de selección de funciones disponibles en los paquetes de Python?

Selección univariante

desde sklearn.feature_selection import SelectKBest

sklearn.feature_selection.SelectKBest – documentación de scikit-learn 0.18

Eliminación de características recursivas

sklearn.feature_selection.RFE – documentación de scikit-learn 0.18

¿Cuál es el mejor libro de matemáticas que debería leer un aspirante a científico de datos?
¿Existe algún beneficio de saber que Java debe seguir el camino de ser un científico de datos o puede tomarse como un complemento? (Java-as Map reduce los requisitos previos: análisis de Big Data)
¿Qué tipo de herramientas de colaboración reducirían la duplicación del esfuerzo de I + D en el análisis y el intercambio de datos?
¿Se puede confiar en los datos autoinformados?
¿Por qué agregar más como primera columna de datos en el aprendizaje automático?

Análisis de componentes principales

de sklearn.decomposition import PCA

Los árboles de decisión como Random Forest y Extra Trees se pueden usar para estimar la importancia de las características.

Supervisado

CIFE – Aprendizaje condicional infomax

MIM – Categorización de texto

JMI – No gaussiano

ICAP – Basado en datos mutuos

Sin supervisión

lap_score – Puntajes laplacianos

SPEC – Características espectrales

basado en estadísticas

low_variance – ML en python

Para obtener más referencias de API: documentación de scikit-learn 0.18 Verifique esto

Related Content

¿Cuál es el mejor libro para aprender Python para la ciencia de datos?

¿Por qué mi CNN proporciona una buena precisión en los datos de entrenamiento y prueba (división 80-20 del total de datos de entrenamiento) pero falla miserablemente en los datos de validación (no vistos)?

Cómo acceder a los valores de estas variables MATLAB en base a una matriz que almacena los índices de las columnas requeridas

¿DataCamp me ayudará a competir en las competencias de Kaggle? Soy un principiante.

¿Qué conjuntos de habilidades son imprescindibles para un aspirante a científico de datos además de la calificación educativa?

Con la automatización llegando al mundo, ¿qué crees que es lo próximo que le pasará a la gente?

¿Qué puedo hacer para deshacerme de la protección web de Sophos en la computadora portátil de mi escuela?

jundongl / scikit-feature es un paquete solo para la selección de características.

Rahul RM

More Interesting

¿Qué es la computación paralela y cómo se usa en ciencia de datos?

¿Por qué se considera que la ciencia de datos está de moda?

¿Es bueno aprender que la analítica de datos es más fresca cuando no tengo idea de la analítica de datos?

¿Cuál es el mejor curso para big data en Dehradun?

¿Cómo hizo el experto en aprendizaje automático Michael Jordan, de UC Berkeley, la transición de una licenciatura en psicología a las matemáticas y la informática, y qué motivó estas transiciones?

Actualmente, estoy trabajando con la tecnología AS400 y quiero ingresar al análisis de datos. ¿Cuál debería ser mi primer paso?

¿Puede Kotlin reemplazar a Scala en ciencia de datos?

¿Revisará mi currículum para los puestos de Analista de datos / Científico de datos y proporcionará algunos comentarios?

¿El aprendizaje automático tiende a producir ganancias de rendimiento marginales o revolucionarias?

¿Cuál es la diferencia entre analista de negocios, analista de datos, científico de datos, analista de inteligencia de negocios, analista de sistemas de negocios y gerente de producto?

¿Cómo genera LinkedIn exactamente la lista de usuarios que "los espectadores de este perfil también vieron"?

¿Cuáles son los alcances después de aprender Big Data Analytics?

Cómo encontrar la cantidad óptima de camas necesarias para una sala de hospital utilizando análisis de datos

¿Cuáles son las aplicaciones de los procesos estocásticos, particularmente en ciencia de datos y aprendizaje automático?

¿Qué ejercicio debo dar a mis alumnos en un curso de Big Data?

Web Analytics