¿Se pueden usar los árboles de decisión para encontrar atributos de variables latentes de una muestra?

Realmente no. Sin embargo, hay un enfoque que funciona bien si tiene grandes cantidades de datos que ocasionalmente he visto usar, que es:

Genere muchas combinaciones de atributos (por ejemplo, diferencias entre atributos, productos de atributos, relaciones de atributos, etc.). Básicamente, estos son atributos latentes.
Construye árboles de decisión usándolos.
Si una variable latente se usa mucho en los árboles de decisión (especialmente cerca de la raíz), sabrá que es útil como discriminante.

Sin embargo, realmente necesita muchos datos para hacer esto ; de lo contrario, los árboles de decisión se adaptarán en exceso. Cuando trabajé con Ross Quinlan (autor de C4.5), tenía una regla general que era mínima para construir un árbol razonable: 5 * número de atributos * número de valores que cada atributo podría tomar (para valores continuos , se ajusta a la precisión que le interesa).

Entonces, por ejemplo, si tiene 32 atributos y cada atributo toma 16 valores, necesita al menos 5 * 32 * 16 = 2560 ejemplos. Si, por ejemplo, observa productos de dos atributos, hay 32 * 31/2 = 496 atributos de producto. Entonces, de repente, necesitas 39680 ejemplos. Haz productos, proporciones, sumas y diferencias, y necesitas ~ 160,000 ejemplos.

Aprendizaje automáticoÁrboles de decisión

Related Content

¿Qué significa "tomar la media geométrica de la distribución predictiva producida por las redes de abandono exponencialmente numerosas" en redes neuronales profundas?

¿Cuáles son las aplicaciones del aprendizaje automático en optometría y ciencias de la visión?

¿Pueden los algoritmos de aprendizaje profundo predecir los resultados de los partidos deportivos?

¿Cuáles son algunos ejemplos de inteligencia artificial en sitios web?

¿Cuál es la divergencia KL entre un Gaussiano y un Student-t?

¿Qué recursos sobre modelos gráficos se recomiendan para los estudiantes de aprendizaje automático que desean ingresar al campo?

¿Cuál es la investigación más emocionante en informática en 2010? ¿Por qué es emocionante?

Los árboles de decisión son supervisados, por lo que necesitaría un conjunto de entrenamiento con esa variable latente observada. Sin embargo, si tiene eso, solo está utilizando un clasificador / regresor de árbol de decisión estándar.

Waleed Kadous

No están diseñados para eso. Tengo un artículo inédito que busca un hogar que se ocupe del modelado de vías a través de los árboles de decisión y su incapacidad para capturar toda la vía.

Existe un método de aprendizaje automático (basado en la ciencia de datos topológicos) que tiene la capacidad de encontrar variables latentes dentro de una muestra (independientemente de la estructura latente o el tamaño de la muestra). Es una generalización del análisis factorial: https://www.slideshare.net/Colle … https://www.slideshare.net/Colle …

Waleed Kadous

More Interesting

Cómo usar la red neuronal convolucional en sus proyectos

Cómo obtener todos los problemas de investigación en el aprendizaje por refuerzo

¿Cuáles son los primeros usos de la regresión logística?

¿Cuál es la mejor computadora portátil que puedo obtener para aprender el aprendizaje profundo con CUDA?

¿Por qué siempre ponemos log () en la estimación de máxima verosimilitud antes de estimar el parámetro?

Cómo implementar el aprendizaje sensible al costo en TensorFlow para penalizar la clasificación errónea en clases minoritarias (los datos tienen un problema de desequilibrio de clase)

¿Por qué es tan difícil automatizar la inferencia variacional?

¿Qué conocimiento debo tener antes de aprender el aprendizaje automático?

¿Cuál es una forma útil de clasificar los usos de las tecnologías de inteligencia artificial?

¿Deberíamos comenzar con Tensorflow, Keras o Sonnet para desarrollar un sistema de predicción de datos de series temporales? ¿Debemos usar solo lenguajes basados en Python?

¿Ubuntu es mejor con machine learning que mac?

¿Puede una red neuronal LSTM aprender a reescribir un código C en C ++ sabiendo que lo entrené con un conjunto de datos equivalente a la instrucción C / C ++?

¿Cómo debo abordar mi tesis sobre 'conversión de lenguaje de señas a texto'? ¿Cuál debería ser el método?

¿Cómo se justifica el uso de la desigualdad de Hoeffding para demostrar que el aprendizaje es factible?

¿Vale la pena el curso sobre aprendizaje automático en Coursera por la Universidad de Stanford?

Web Analytics