¿Es bueno tener más y más parámetros capturados para los datos de calificación crediticia? ¿Los algoritmos comienzan a fallar / se vuelven inexactos si hay demasiados atributos en los datos? ¿Cómo se pueden erradicar los parámetros que no son muy útiles?

¡Se requiere ingeniería de características para un aprendizaje adecuado!
1) Métodos de normalización y extracción de características (PCA)
2) Métodos de selección de funciones
a) Método de envoltura, por ejemplo, algoritmo SVM-RFE
b) Enfoque de filtro, por ejemplo, T-Statistics
c) Enfoque integrado, por ejemplo, regresión lineal de regularización L1
d) Método híbrido
e) Heurística como Algoritmo Genético
(Google para saber más …)
ambos métodos se pueden usar para reducir la dimensión, pero se requiere una función de error y validación adecuadas.
Una forma simple de acercamiento
1.Utilice todas las funciones, es decir, sin reducción de dimensión (use computación distribucional si puede)
2.Ingeniería de características (como un científico de datos) pero puede haber una posibilidad de pérdida de información. Puede usar herramientas estadísticas para encontrar la correlación entre los parámetros y el resultado.

Related Content

Cómo resolver el siguiente problema de autómatas finitos

¿Qué métodos son buenos para la minería de texto corto semántico (como SMS, tweet)?

¿Cuál es el proceso de venta de patentes relacionadas con la informática y la tecnología?

¿Cuál es la computadora portátil más delgada y liviana del mundo?

¿La EPFL para la informática se considera a la par con CMU, MIT y similares o se considera inferior?

¿Podría haber estándares de cifrado que descansen en un problema NP-hard distinto de la factorización entera?

¿Qué se requiere para simular una Tierra entera como el planeta y la vida en él?

Echa un vistazo a la maldición de la dimensionalidad.

Se puede resolver mediante algoritmos para la reducción de dimensionalidad. El más conocido es el análisis de componentes principales.

Martin Thoma

More Interesting

¿Cuáles son las aplicaciones de la teoría de autómatas en simulación y modelado?

¿Cuál es el significado de determinista y no determinista en informática?

Cómo deshabilitar el ping a un enrutador

¿Qué significa la arquitectura del procesador de 32 bits?

Si el mundo tal como lo observamos fuera realmente una simulación interactiva (como se sugiere en ciertas películas de ciencia ficción), ¿qué tipo de potencia informática se necesitaría para ejecutarlo? ¿Cuánto poder dibujaría?

¿La velocidad de ejecución de un algoritmo que, al ejecutarse, hace que el sistema físico en ejecución tenga experiencia subjetiva, hace alguna diferencia en la naturaleza de esta experiencia subjetiva?

¿Cuál es la mejor manera de hacer una copia de seguridad de los datos y hacer que duren toda mi vida?

¿Cuáles son algunas buenas estructuras de datos y algoritmos de hojas de trucos?

Cómo copiar softwares de una máquina Ubuntu a otra

¿Cómo ayudan los tipos en la verificación formal de los programas?

¿Es Londres una buena ciudad para una startup tecnológica?

¿El procesador multinúcleo o los multiprocesadores son más rápidos?

¿Vale la pena obtener un certificado verificado de CS50 en edX?

¿Qué debe hacer un investigador si su investigación falla?

¿Cuáles son las posibilidades de ser admitido en el programa de posgrado de Berkeley CS?

Web Analytics