Todos estos algoritmos de aprendizaje automático, ¿cuál es el punto? Parece que la elección del algoritmo de aprendizaje automático, el árbol de decisión, la red neuronal, svm, no es tan importante como la selección de características y el proceso de extracción de características que determina lo que entra, basura en basura, ese tipo de cosas.

Creo que esta es una visión simplista.

En primer lugar, la selección de características y la extracción de características están dentro del pliegue del aprendizaje automático, y existen muchas técnicas para automatizar el proceso. Por ejemplo, uno de los principales investigadores en el campo Andrew Ng ahora está investigando cómo automatizar la extracción de características. Cosas como el enfoque de selección de subconjunto de características de contenedor se consideran dentro del alcance del aprendizaje automático.

Mi doctorado estaba en Machine Learning, pero no inventé un nuevo algoritmo, simplemente descubrí cómo convertir automáticamente series de tiempo en problemas de clasificación convencionales (https://sites.google.com/site/wa…).

En segundo lugar, los algoritmos tienen características diferentes: no todo se trata de precisión. Utiliza diferentes algoritmos para diferentes situaciones y aplicaciones. Por ejemplo:

¿Quieres algo que sea potencialmente humano comprensible? Use árboles de decisión o reglas.
¿Tiene una situación en la que tiene mucha memoria, pero tiene que aprender de forma incremental y evaluar rápidamente? Usar vecino más cercano.
¿Tiene una decisión binaria clara en un espacio continuo? Utiliza SVM.
¿Tiene miles de atributos independientes y muchos datos? Usa ingenuo Bayes.
¿Tiene una situación en la que sabe qué atributos están correlacionados con cuáles? Usa redes Bayes.

Tienes la idea. Hay más en el aprendizaje automático que ejecutar ganar / perder / dibujar en su juego de herramientas de aprendizaje automático favorito y decir “Mire, mi algoritmo funciona mejor en estos conjuntos de datos”. Debe pensar en construir un sistema completo.

Ejemplo: probablemente las aplicaciones recientes más lindas del aprendizaje automático es la detección de partes del cuerpo de Kinect (http://research.microsoft.com/pu…). La elección de bosques aleatorios es crítica, principalmente porque tiene un cálculo acotado que se puede acelerar utilizando GPU, por lo que pueden garantizar que se ejecute siempre en 20 ms. No es tan simple como decir “SVM, red neuronal, árbol de decisión de todos modos”.

Cómo usar el pronóstico de series de tiempo para predecir el tiempo que tomaría realizar alguna tarea

Cómo hacer ingeniería de características para la regresión no lineal correcta

¿Cuál es el estándar de JMLR contra documentos en ICML y NIPS?

¿Cómo debe planificar un estudiante de CS su primer verano?

¿Cuándo es un bosque aleatorio una mala elección en relación con otros algoritmos?

¿Cuál es la diferencia entre un centro de datos virtual, un centro de datos en la nube y una nube privada? ¿Cuáles son los pros y los contras de cada uno?

Escribí una respuesta a una pregunta similar a la suya, disponible en ¿Qué enfoque de selección de características generalmente produce un modelo más preciso (dentro del rendimiento de la muestra): cuadro negro o intuición (explicación más detallada de la pregunta dentro)? Lo reproduzco como es:

Una respuesta breve: la extracción de características es una heurística derivada del conocimiento de dominio subyacente (Plotz et al. 2011), que puede funcionar en algunos dominios y puede que no funcione en otros. Por lo tanto, la pregunta de qué método de selección de características es mejor es bastante burda. En base a estos problemas, los investigadores ahora están tratando de aprender características directamente de los datos para encontrar una representación genérica y efectiva y el aprendizaje profundo está emergiendo como una buena metodología para alcanzar ese objetivo.

Referencia
Plötz, Thomas, Nils Y. Hammerla y Patrick Olivier. “Aprendizaje de características para el reconocimiento de actividades en informática ubicua”. Actas de la 22ª conferencia internacional conjunta sobre Inteligencia Artificial – Volumen Volumen Dos . AAAI Press, 2011.

Ben Packer

Si no le importa la ironía, lo que estoy leyendo parece “si todos los martillos son iguales, elegir uno no es tan importante como los destornilladores que permiten una cocción mucho mejor”.

Una de las cosas en las que paso más tiempo es documentar dónde los modelos, métodos, algoritmos, etc., son buenos o malos en situaciones abstractas y mejores o peores contra sus pares también en situaciones abstractas. Copio, pego una gran cantidad de información que encuentro (copia pegada un par de este hilo en realidad) en un cuaderno de Evernote que mantengo religiosamente como referencia.

No importa que haya miles de algoritmos, lo que importa es si sabemos cómo elegir algunos para trabajar en un contexto dado, medir su rendimiento y presentar los mejores resultados posibles.

Ricardo Vladimiro

More Interesting

¿Cuál es el nuevo enfoque o idea en la tecnología de Vicarious Systems?

¿Es posible mejorar automáticamente el archivo digital de una canción mediante muestreo y aprendizaje automático?

¿Por qué se utilizan imágenes en escala de grises para el análisis de componentes principales?

Cómo construir un motor de recomendación en tiempo real

¿Qué debo hacer para poder contribuir al campo de la visión por computadora y trabajar en Google en el futuro?

¿Qué modelo / algoritmo de ML utilizo?

¿Qué significa decir que las redes neuronales convolucionales comparten cálculos comunes a las regiones superpuestas?

¿Son los sistemas de recomendación actuales lo mejor que podemos hacer?

¿Qué es un campo aleatorio?

¿Es posible conseguir un trabajo en Machine Learning sin experiencia laboral?