¡Se requiere ingeniería de características para un aprendizaje adecuado!
1) Métodos de normalización y extracción de características (PCA)
2) Métodos de selección de funciones
a) Método de envoltura, por ejemplo, algoritmo SVM-RFE
b) Enfoque de filtro, por ejemplo, T-Statistics
c) Enfoque integrado, por ejemplo, regresión lineal de regularización L1
d) Método híbrido
e) Heurística como Algoritmo Genético
(Google para saber más …)
ambos métodos se pueden usar para reducir la dimensión, pero se requiere una función de error y validación adecuadas.
Una forma simple de acercamiento
1.Utilice todas las funciones, es decir, sin reducción de dimensión (use computación distribucional si puede)
2.Ingeniería de características (como un científico de datos) pero puede haber una posibilidad de pérdida de información. Puede usar herramientas estadísticas para encontrar la correlación entre los parámetros y el resultado.
¿Es bueno tener más y más parámetros capturados para los datos de calificación crediticia? ¿Los algoritmos comienzan a fallar / se vuelven inexactos si hay demasiados atributos en los datos? ¿Cómo se pueden erradicar los parámetros que no son muy útiles?
Related Content
Cómo resolver el siguiente problema de autómatas finitos
¿Qué métodos son buenos para la minería de texto corto semántico (como SMS, tweet)?
¿Cuál es el proceso de venta de patentes relacionadas con la informática y la tecnología?
¿Cuál es la computadora portátil más delgada y liviana del mundo?
¿La EPFL para la informática se considera a la par con CMU, MIT y similares o se considera inferior?
Echa un vistazo a la maldición de la dimensionalidad.
Se puede resolver mediante algoritmos para la reducción de dimensionalidad. El más conocido es el análisis de componentes principales.
More Interesting
¿Cuáles son las aplicaciones de la teoría de autómatas en simulación y modelado?
¿Cuál es el significado de determinista y no determinista en informática?
Cómo deshabilitar el ping a un enrutador
¿Qué significa la arquitectura del procesador de 32 bits?
¿Cuáles son algunas buenas estructuras de datos y algoritmos de hojas de trucos?
Cómo copiar softwares de una máquina Ubuntu a otra
¿Cómo ayudan los tipos en la verificación formal de los programas?
¿Es Londres una buena ciudad para una startup tecnológica?
¿El procesador multinúcleo o los multiprocesadores son más rápidos?
¿Vale la pena obtener un certificado verificado de CS50 en edX?
¿Qué debe hacer un investigador si su investigación falla?
¿Cuáles son las posibilidades de ser admitido en el programa de posgrado de Berkeley CS?