¿Cuál es el mejor algoritmo para un conjunto de datos con muchas características correlacionadas, débiles y ruidosas?

Con conjuntos de datos muy grandes, desestructurados y ruidosos, a menudo es mejor realizar algún tipo de reducción de dimensionalidad. Debes buscar en PCA o ICA. El aprendizaje múltiple también proporciona una buena base (práctica y teórica) para la reducción de la dimensionalidad no lineal.

A menudo se dice que los datos que tiene son mucho más importantes que el algoritmo que implementa. Sería mejor mirar sus datos y hacer algún tipo de extracción de características. Las características que puede crear a menudo codificarán información semántica mucho más útil y no están tan dispersas como el vector covariable con el que comienza.

Pasando a los algoritmos reales, depende de la distribución de sus datos y del problema que tenga a mano. Si está haciendo una clasificación binaria, le sugiero que busque en las Máquinas de vectores de soporte de margen suave (SVM), ya que están bien fundamentadas en teoría y proporcionan una implementación poderosa para tratar con grandes conjuntos de datos también.

Los bosques aleatorios (RF) también actúan como buenos clasificadores. Puede usar un subconjunto del conjunto de entrenamiento para embolsar y crear una forma de clasificador de conjunto. Existen innumerables implementaciones diferentes de RF y todas tienen sus ventajas específicas según los datos que tenga y la tarea de clasificación en cuestión.

El último algoritmo que sugeriré investigar es Deep Learning Neural Networks (DNNs). Los DNN pueden formar arquitecturas complejas que parecen formar comportamientos y clasificaciones “inteligentes”. Los DNN pierden algunas de las ventajas que tienen las redes neuronales de perceptrón multicapa, como un entrenamiento más simple.

En general, el algoritmo que elija dependerá mucho del tipo de datos que tenga. Sugeriría pasar una cantidad significativa de tiempo trabajando en la limpieza de sus datos antes de seguir adelante. Cuando comience con la clasificación, siempre debe hacer una validación cruzada n- doble para asegurarse de que no está sobreajustando y que su algoritmo se generalizará a los nuevos datos que obtendrá.

Related Content

¿Cómo podemos demostrar que cada matriz 1D tiene un pico o que cualquier matriz 1D siempre tiene un pico?

¿Por qué las estructuras de datos y los algoritmos son tan importantes en informática?

¿Por qué la longitud de una matriz siempre es mayor que el índice más grande de la matriz?

¿Cuál es el mejor algoritmo de procesamiento de imágenes para comparar una pintura recibida como entrada contra la base de datos y seleccionar la coincidencia más cercana?

¿Convertir el tamaño de matriz en un número primo ayuda en la implementación de la tabla hash? ¿Por qué?

¿Mi disco duro externo está muerto?

¿Cuál es la diferencia entre las estructuras de datos de std :: vector y std :: deque?

Generalmente decido qué algoritmo usar en función de la función de destino (es decir, lo que está tratando de hacer) y no en función de las características. ¿Estás tratando de clasificar, predecir un puntaje, grupo, etc.?

En general, puede decorar las características a través de varios medios:

Alguna forma de factorización (SVD, PCA, Factorización de rango, etc.) que integrará las características en un vector de dimensión inferior en función de su ortogonalidad. También puede agrupar las funciones integradas, que pueden proporcionar un mejor rendimiento
Tomando el producto exterior de características. Por ejemplo, en lugar de una característica para el tamaño de una casa y otra característica para el costo, puede tener un conjunto de características binarias que representan pares de tamaño + costo, uno de los cuales es cierto.

Colleen Farrelly

No voy a trabajar Haga primero la reducción de dimensionalidad (el contenedor podría funcionar, o PCA / aprendizaje múltiple), luego otro algoritmo para modelar su resultado. Si está comparando dos grupos, la homología persistente podría ser una opción, ya que funciona bien cuando p> ny hay un gran desorden con los predictores.

Colleen Farrelly

More Interesting

¿Cuál es la mejor manera de practicar con algoritmos y estructuras de datos?

¿No es posible en un árbol de búsqueda binario que el sucesor de un elemento tenga más de un hijo?

Cómo escribir un algoritmo de la pila de programas usando una matriz en C

Dada una lista de cadenas, ¿cómo puedo determinar si existe un orden de caracteres para el cual las cadenas están ordenadas en orden lexicográfico?

¿Debo aprender a diseñar estructuras de datos antes de aprender sobre algoritmos?

¿Cómo debo tomar una entrada de orden 10 ^ 250 usando una matriz de caracteres en C?

¿Por qué y cómo son importantes los algoritmos en nuestra vida diaria?

Cómo revertir un número promedio de números sin los números

Ahora he leído sobre algoritmos y estructuras de datos como Al Klein me dijo. ¿Qué lenguaje de programación debo aprender?

Como principiante, ¿debería leer el libro CLRS antes de comenzar con Interviewbit?

En Python, ¿cómo reemplazo una cadena en el texto sin reemplazar las subcadenas?

Cómo desglosar un problema y resolverlo con el uso de la programación Java

¿Qué algoritmos utilizan Bing, Ask y DuckDuckGo para mostrar los resultados de búsqueda?

Cómo escribir un código para fusionar dos listas vinculadas ordenadas

¿Las estructuras en lenguaje C son similares a los objetos en Java?

Web Analytics