¿Por qué el aprendizaje en estructuras de datos complejas (gráficos, árboles, etc.) está tan poco representado en el aprendizaje automático?

No está subrepresentado. Hay muchos documentos sobre esto, demasiados para enumerar en una respuesta de Quora. Podría decirse que es una de las mayores áreas de investigación actuales. Pero aquí hay algunos excelentes con los que puede comenzar:

Predicción de objetos estructurados con máquinas de vectores de soporte por Thorsten Joachims, Thomas Hofmann, Yisong Yue y Chun-nam Yu

Formación en plano de corte de SVM estructurales, aprendizaje automático por T. Joachims, T. Finley, Chun-Nam Yu
Máquinas ocultas de vectores de soporte de Markov por Y. Altun, I. Tsochantaridis, T. Hofmann
Un método primal-dual para campos aleatorios de Markov de múltiples capas de orden superior por Alexander Fix, Chen Wang, Ramin Zabih

Y aquí hay algunos grandes libros sobre el tema:

Predicción estructurada y aprendizaje en visión artificial por Sebastian Nowozin y Christoph H. Lampert
Predicción de datos estructurados por Gökhan BakIr, Thomas Hofmann, Bernhard Schölkopf, Alexander J. Smola, Ben Taskar y SVN Vishwanathan

Y finalmente, aquí hay dos bibliotecas de aprendizaje automático (ambas publicadas en el Journal of Machine Learning Research) con un énfasis significativo en el aprendizaje de objetos con estructura compleja:

dlib – Aprendizaje automático
PyStruct – Aprendizaje estructurado en Python

Machine Learning

¿Qué es más robusto para datos ruidosos, un árbol de decisión o Naive Bayes?

¿Por qué es beneficioso centrar y normalizar los datos antes de ejecutar el Análisis de componentes principales en él?

¿Cómo se aplica el análisis tensorial al aprendizaje automático, en términos de contexto específico de aplicación?

¿Cómo se aplica la validación cruzada a la regresión logística? Quiero evaluar la precisión de un modelo de regresión logística en un conjunto de datos.

¿Cuáles son los libros de texto clásicos y de lectura obligatoria en las estadísticas?

¿Hay algún sitio legítimo para ganar algunos bitcoins?

La tendencia es manipular los datos en una matriz de características antes de entrenar clasificadores, etc. porque es mucho más eficiente computacionalmente representar los datos de entrada en una matriz. Esto permite escribir soluciones vectorizadas que aprovechan el código altamente optimizado en las plataformas más relevantes.

Si se trata de problemas a pequeña escala (por ejemplo, miles de registros de entrada), este no sería un gran problema (aunque la codificación puede ser considerablemente menos concisa). Sin embargo, si se trata de más registros o muchas características, esto podría llevar mucho tiempo entrenar modelos con cualquier solución no vectorizada (incluidas las matrices de características si la solución solo hace un bucle sobre los registros de entrada).

Puede encontrar ejemplos de código vectorizado y no vectorizado aquí: http://www.matlab-cookbook.com/recipes/0005_Programming/0010_Writing_better_code/035_vectorising.html

Chris Prosser

¿Hay algún ejemplo de tales cosas? No he oído hablar de ellos. Si yo fuera un jugador de apuestas, apostaría al hecho de que las estructuras de datos abstractas están destinadas a ordenar y almacenar información, no a aprender de ella. Cumplen un propósito no relacionado con el aprendizaje.

Joshua Rose

More Interesting

Cómo aplicar en la práctica PCA a la agrupación de trayectorias

¿Cuáles son los métodos de implementación con calidad de producción para los modelos de aprendizaje automático?

¿Cuáles son las ventajas y desventajas de tener mi propio servidor en la nube?

¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?

¿Qué es el 'aprendizaje automático de crowdsourcing'?

¿Qué papel juega la intuición en las matemáticas y puede la IA reemplazar completamente a un matemático?

¿Cómo podemos estimar múltiples parámetros de un clasificador?

¿Podemos construir una máquina de visualización de sueños usando el procesamiento de señales?

Procesamiento del lenguaje natural: ¿De qué maneras puedo probar el error de aplicar un modelo de tema a los tweets, dado que no hay un corpus conocido de etiquetas de temas?

¿Existe algún proyecto de código abierto que implemente algoritmos de aprendizaje profundo que aproveche la enorme potencia informática paralela de la GPU?