¿Cuál es el mejor algoritmo para descubrir características bien correlacionadas?

Otro método de aprendizaje no supervisado llamado mapa autoorganizado (SOM) también está adaptado a su problema (http://en.wikipedia.org/wiki/Sel…). El SOM es una red neuronal que tiene interesantes propiedades de agrupamiento, proyección y visualización.

Hay un buen ejemplo en el artículo de Wikipedia:
“Mapa autoorganizado que muestra los patrones de votación del Congreso de EE. UU. Visualizados en Synapse. Los dos primeros cuadros muestran agrupaciones y distancias, mientras que los restantes muestran el componente Aviones . Rojo significa un voto de sí mientras que azul significa un voto de no en los planos componentes … “

Una clara ventaja de este método es que es fácil de interpretar visualmente en un espacio de baja dimensión. Te ayudará a:

visualizar los racimos
Identifique qué características están correlacionadas en función de la similitud visual de sus planos componentes:

Esta cifra proviene de “Mejora de la búsqueda de correlaciones en una gran cantidad de planos de componentes SOM” (http://slidesha.re/h6SjC6). Vale la pena echarle un vistazo, especialmente si tiene demasiados planos componentes.

Aprendizaje automáticoRecuperación de información

Related Content

¿Qué funciona mejor, un ANN con miles de unidades por capa pero solo docenas de capas o uno con docenas de unidades por capa, pero cientos de capas?

Máquina de Boltzmann restringida (RBM): ¿Cómo se podría reformular (y / o explicar) las dos tareas en la siguiente diapositiva de una charla de Geoffrey Hinton?

¿Qué significa el impulso en las redes neuronales?

¿Por qué el aprendizaje automático se usa mucho para la clasificación de anuncios de Google y menos para su clasificación de búsqueda? ¿Qué llevó a esta diferencia?

¿Cuál es la diferencia entre el aprendizaje automático en Python y R?

¿Quiénes son los mejores ingenieros de aprendizaje automático?

¿Cuáles son los 10 mejores algoritmos de minería de datos o aprendizaje automático? En 2006, la Conferencia IEEE sobre minería de datos identificó los 10 algoritmos principales. ¿Siguen siendo válidos?

Tal vez intente el análisis factorial, que se usa para agrupar características en grupos, pero también se puede usar para encontrar correlaciones entre los factores. Es más común la psicometría, pero puede ser útil aquí, IIRC.

No me preocuparía tanto por la cantidad de grupos desconocidos. Hay formas de evitar esto … ajusta tu modelo varias veces y usa algún tipo de descenso de gradiente para elegir el número de grupos usando chi-cuadrado, AIC, etc. como medida de ajuste. También hay métodos adaptativos de k-means que intentan seleccionar el número de clústeres. También hay algunas cosas en la literatura de saltos reversibles que pueden ayudar con esto.

Nicolas Maillot

More Interesting

¿Qué tan bueno es el programa de maestría en visión por computadora de la Universidad Autónoma de Barcelona en términos de contenido, costo y futura carrera (directamente trabajo o doctorado)?

¿Cuáles son algunas de las funciones de uso común que se pueden extraer de la música con fines de aprendizaje automático?

¿Cómo se puede mejorar Google News?

¿Alguien puede responder a estas preguntas relacionadas con la competencia de kaggle?

¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?

¿Por qué una función del núcleo debe satisfacer la condición de Mercer?

¿Cuántas clases diferentes podemos tener prácticamente dentro de un conjunto de entrenamiento, mientras usamos el algoritmo KNN?

En Data Science, ¿cuáles son algunos proyectos específicos de la industria del juego?

¿Cómo funcionan los RBM? ¿Cuáles son algunos buenos casos de uso y algunos buenos artículos recientes sobre el tema?

¿Qué pila de tecnología usa Akinator?

¿Cuándo puede el aprendizaje profundo ser una herramienta inadecuada para una empresa?

¿Cuál es la diferencia entre validación y validación cruzada?

¿Son las redes aditivas recurrentes universalmente mejores que las LSTM y GRU?

¿Dónde caen los sistemas de recomendación en los enfoques de aprendizaje automático?

¿Qué tensiones tienen entre sí el diseño de productos y el aprendizaje automático?

Web Analytics