¿Cuáles son algunos temas inusuales en el aprendizaje automático que se pueden explorar como un proyecto de un mes? La tecnología cambia la vida futura

A2A. Esta es una pregunta increíblemente difícil, porque “inusual” y “un mes” depende de sus antecedentes (por ejemplo, ¿es un programador autodidacta, científico de la computación, estadístico?) Y experiencias previas de trabajo / investigación. Una introducción clásica al aprendizaje automático (a través de Coursera, o algunos libros estándar como el de Haykins), le dará una buena visión general de muchos algoritmos en el aprendizaje supervisado / no supervisado, y posiblemente algunas ideas sobre el aprendizaje de refuerzo. Entonces, aquí hay algunos buenos temas que me vinieron a la mente al leer la pregunta, que casi nunca encontré en los libros, y que podría abordar en un solo mes:

Conservación de la privacidad [1] : ahora puede ejecutar casi cualquier algoritmo de aprendizaje automático en la nube, pero ¿qué sucede cuando se trata de datos sensibles? ¿Qué pasa con las diferentes fuentes de datos que no pueden intercambiar información? Las nociones de privacidad también son útiles si no se trata de información distribuida, por ejemplo, puede usar el concepto de privacidad diferencial para garantizar la generalización de un modelo en situaciones en las que el bloqueo estándar no funciona, consulte [2].
Pruebas estadísticas : suponga que compara dos clasificadores en cuatro conjuntos de datos, y el clasificador A está obteniendo un mejor rendimiento que B en dos casos, peor rendimiento en un caso, y son iguales en el cuarto. ¿Puedes afirmar con una confianza dada que uno es mejor que el otro? Si proviene de un entorno de estadísticas, las pruebas estadísticas no son nada nuevo, pero en el aprendizaje automático se ha ignorado bastante a lo largo de los años, y ahora la tendencia está cambiando ligeramente, véase, por ejemplo, [3,4].
Optimización de hiperparámetros : una práctica estándar en el aprendizaje automático es optimizar los hiperparámetros (por ejemplo, la cantidad de neuronas en una capa oculta de una red neuronal) utilizando una búsqueda de cuadrícula en un rango prescrito, pero ¿puede mejorar en la práctica? Si está entrenando un modelo “pesado” (por ejemplo, una red profunda), puede aprovechar la optimización bayesiana [5] para encontrar una muy buena configuración de parámetros en un número muy pequeño de intentos. Hay algunos paquetes geniales que implementan esto que pueden ahorrarle cientos de horas de prueba. [1] ¿Quieres algo aún más fresco? Mira esto: [1502.03492] Optimización de hiperparámetros basada en gradiente a través del aprendizaje reversible.
La métrica de similitud [6] : este es uno de mis favoritos de todos los tiempos. Chen y sus colegas demostraron que se puede calcular la distancia entre cualquier tipo de objeto simplemente observando la longitud entre sus versiones comprimidas . La métrica óptima construida sobre esta idea tiene una interpretación matemática muy agradable (enmarcada en un contexto teórico de información), y puede usarla para hacer algunas cosas sobresalientes con un código increíblemente simple (por ejemplo, crear un árbol lingüístico muy preciso simplemente comprimiendo corpus de texto ) Más en general, la búsqueda de una medida de similitud óptima (especialmente cuando se trata de dominios no estructurados) es un tema muy agradable: el aprendizaje de similitud.
Aprendizaje activo : este es un conjunto de estrategias para elegir activamente un nuevo punto para actualizar los parámetros de un modelo. Esto es particularmente bueno en situaciones en las que puede consultar interactivamente a los usuarios de un sistema para obtener etiquetas: aprendizaje activo (aprendizaje automático).

Hay algunos otros temas que me vinieron a la mente, pero que podrían ser menos atractivos, o tal vez ya conocidos, por ejemplo, el manejo de conjuntos de datos desequilibrados [7] (muy común en situaciones del mundo real), transferencia de aprendizaje, clasificación de una clase, etc. .

Referencias

[1] Agrawal, R. y Srikant, R. (2000, mayo). Minería de datos para preservar la privacidad. En ACM Sigmod Record (Vol. 29, No. 2, pp. 439-450). ACM

[2] Dwork, C., Feldman, V., Hardt, M., Pitassi, T., Reingold, O. y Roth, A. (2015). La reserva reutilizable: preservar la validez en el análisis de datos adaptativo. Science , 349 (6248), 636-638.

[3] Dietterich, TG (1998). Pruebas estadísticas aproximadas para comparar algoritmos supervisados de aprendizaje de clasificación. Cálculo neuronal , 10 (7), 1895-1923.

[4] Demšar, J. (2006). Comparaciones estadísticas de clasificadores sobre múltiples conjuntos de datos. Journal of Machine Learning Research , 7 , 1-30.

[5] Snoek, J., Larochelle, H. y Adams, RP (2012). Práctica optimización bayesiana de algoritmos de aprendizaje automático. En Avances en sistemas de procesamiento de información neuronal (pp. 2951-2959).

[6] Li, M., Chen, X., Li, X., Ma, B. y Vitányi, P. (2004). La similitud métrica. IEEE Transactions on Information Theory , 50 (12), 3250-3264.

[7] Él, H. y García, EA (2009). Aprendizaje de datos desequilibrados. IEEE Transactions on Knowledge and Data Engineering , 21 (9), 1263-1284.

Notas al pie

[1] HIPS / Menta verde