¿Cuáles son algunos buenos ejemplos donde el agrupamiento se usa como método para la extracción de características?

Existen numerosos tipos de técnicas de construcción de conjuntos de características disponibles. Un documento útil para tener en mente al abordar este problema es un buen documento general, como http: //machinelearning.wustl.edu…, de Guyon y Elisseef.

En la sección 5.1, la idea es encontrar varias características similares y reemplazarlas por un centroide de clúster producido por un algoritmo de clúster de su elección. De esta manera, la elección del algoritmo de agrupación puede depender de usted y de las suposiciones que haga sobre la relevancia de lo que hace que dos características sean similares. Esto es algo así como un arte en mi opinión y depende de qué tan bien haya elegido sus características y funciones de costo.

Existen numerosos ejemplos de cómo se usa esto en la práctica, pero lo mejor que he visto es el trabajo realizado con el Análisis de datos topológicos en Ayasdi (tenga en cuenta que estoy en una empresa de capital de riesgo que invirtió en ellos, pero es un trabajo muy convincente), vea su artículo en Nature (Extrayendo ideas de la forma de datos complejos usando topología) para más detalles y esta publicación de blog sobre un conjunto de datos popular, Data Pulls “Yellow Card” en EPL Player Valuation.

More Interesting

¿Cuál es la diferencia entre machine learning y IOT?

¿Cuáles son las principales diferencias entre la regresión logística, la red neuronal y las SVM?

¿Cómo sabes que tienes que "maximizar" el lagrangiano para resolver el problema dual?

Cómo comenzar a aprender sobre redes neuronales y conceptos de aprendizaje automático y ponerlos en uso en la vida real sin conocer las matemáticas avanzadas

¿Hay un equivalente a Rosalind en el aprendizaje automático?

¿Cuáles son los mejores recursos en línea para mejorar los algoritmos de aprendizaje automático?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización?

¿Cuáles son los trabajos más interesantes de CVPR 2016 y por qué?

¿Qué piensan los pequeños equipos de ciencia de datos sobre la plataforma Dato y el pensamiento de Carlos Guestrin detrás de la democratización del aprendizaje automático?

Cómo detectar regiones de texto solo de documentos escaneados

¿Qué tecnologías que no son de IBM se están utilizando para mejorar el ecosistema de IBM Watson?

¿Cómo entrenar codificadores automáticos dispersos en imágenes?

Comencé a aprender Machine Learning pero estoy luchando con conceptos matemáticos como la regresión lineal. ¿Cuál debería ser mi punto de partida en tal caso?

¿Cuáles son los posibles remedios si está atascado en la comprensión de la parte técnica de un trabajo de investigación de STEM?

Estoy creando una plataforma de transmisión en vivo: ¿cómo puedo conectarme y usar varias cámaras web al mismo tiempo?