¿Cómo podemos “entrenar” sistemáticamente los algoritmos de agrupación sobre qué combinaciones de atributos / características generan en última instancia los tipos deseados de agrupaciones?

Según la definición, parece que tiene algún tipo de “función de actividad física oculta” para diferentes agrupaciones. Aquí no hay almuerzo gratis; si hay algún tipo de mecanismo de puntuación que esperas que produzca la agrupación, debes darle al algoritmo algún tipo de pista sobre lo que es. Aquí hay algunas alternativas:

Optimización automática de los pesos del clúster.
Genere diferentes agrupaciones a partir de diferentes pesos de atributos y califique manualmente las agrupaciones resultantes. Luego puede usar su algoritmo favorito de aprendizaje activo / descenso de gradiente / evolutivo para ajustar de forma iterativa los valores.

Emparejar algoritmos de corte mínimo basados en gráficos + corte gráfico
¿Tiene algún tipo de noción acerca de qué instancias deberían o no estar en el mismo grupo, por ejemplo, si tomé una submuestra de 100 pares de puntos de datos, podría decirme “estos deberían estar en el mismo grupo y estos no deberían “. Si es así, puede crear un algoritmo de corte mínimo basado en gráficos que esté optimizado para estos emparejamientos.

Etiquetado de pares + transducción de máquina de vectores de soporte
Si hiciste el mismo etiquetado anterior y luego entrenaste una máquina de vectores de soporte transductivo (http://en.wikipedia.org/wiki/Tra…, entonces podrías usar los parámetros que aprendiste como pesos para el agrupamiento.

Related Content

¿Cuál es la parte más lenta del método SVM?

¿Cuáles son los componentes básicos del reconocimiento de voz desde el punto de vista DSP?

¿Qué es mejor para alguien que esté dispuesto a hacer un doctorado en visión artificial: conocer un método en profundidad y aplicaciones ampliamente, o lo contrario?

¿Cuál es la diferencia entre SVM y ANN?

¿Es razonable excluir valores atípicos en su conjunto de datos de entrenamiento para su clasificador?

¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?

¿Cómo pueden ejecutarse las aplicaciones basadas en navegador en un modo fuera de línea?

More Interesting

¿Es más fácil conseguir un trabajo de aprendizaje automático con maestros de una buena universidad que si solo eres autodidacta?

¿Cuáles son los efectos de una estimación de densidad de kernel en los momentos de una distribución?

¿Por qué se usa Python para el aprendizaje profundo si es tan lento?

¿Cuál es el propósito de usar más de una capa convolucional en una red neuronal convolucional?

¿Dónde puedo encontrar cursos de aprendizaje automático y redes neuronales en la web?

¿Qué es el algoritmo de cambio medio?

¿Qué se considera estado de arte para la traducción automática neuronal?

Cómo construir un reconocimiento de objetos basado en dispositivos móviles utilizando técnicas de aprendizaje automático

¿Qué algoritmos son buenos para usar en el procesamiento del lenguaje natural?

¿Por qué algunos clasificadores no pueden manejar los atributos continuos?

¿En qué se diferencia exactamente la generación del lenguaje natural de la comprensión del lenguaje natural?

¿Cuáles son las principales innovaciones y hallazgos del documento 'Diseño químico automático utilizando una representación continua de moléculas basada en datos'?

¿Qué conocimiento matemático se necesita para comenzar a trabajar en el aprendizaje profundo?

¿Tendrán alguna coincidencia los modelos gráficos probabilísticos y el aprendizaje profundo?

¿Qué son los algoritmos recurrentes de redes neuronales?

Web Analytics