Roar Nybø No estoy del todo seguro de que esta sea la misma pregunta que ¿Por qué se considera que los campeones de las hojas de cálculo son analistas de datos expertos, mientras que los estudiantes de informática están en segundo plano?
Esa pregunta era más sobre el lado de minería de datos / big data de CS, que se superpone pero no es un subconjunto o superconjunto del aprendizaje automático.
Cuando pienso en el aprendizaje automático, pienso en términos del tema de los libros de texto básicos de IA como “Reinforement Learning” de Sutton y Barto y “Machine Learning” de Mitchell. También pienso en términos de física cualitativa (QP) y mi campo de teoría de control local, de los cuales las personas de CS / AI generalmente no son muy conscientes.
- ¿Cuáles son algunos proyectos de investigación interesantes relacionados con el aprendizaje automático?
- ¿Cuáles son los casos de uso del uso del procesamiento del lenguaje natural (PNL) en diversas industrias?
- ¿Es esta tabla Hoja de trucos de Machine Learning (para scikit-learn) una descripción precisa de cuándo se deben aplicar diferentes técnicas de aprendizaje automático?
- En la clasificación automática de documentos, ¿cómo trato con categorías en conflicto?
- ¿La ingeniería de características es relevante para los bosques aleatorios? ¿Cómo son relevantes las transformaciones de centrado, escala y Box-Cox en este contexto?
El sentido que obtienes de esos libros y campos es un mapa que se parece a esto. No me dejes llevar por esto demasiado … bosquejo muy rápido para darte una idea de lo complicada que es la situación en el terreno. Probablemente podría obtener 10 versiones de este diagrama que son 10 veces mejores, y ninguna de ellas sería similar. Esto se debe a que la ciencia es joven y los paradigmas siguen divergiendo en lugar de converger.
Por lo tanto, el aprendizaje automático es “ciencia” si obtiene una aplicación que está dentro del rango de uno de los métodos codificados (donde la creatividad se reduce al ajuste de parámetros) en IA o teoría de control. Hay un conjunto más grande de métodos ad hoc, donde se trata principalmente de arte, donde la creatividad va más allá del ajuste de parámetros y básicamente se inventa representaciones y modelos de aprendizaje. Por lo general, esto sucede cuando el problema subyacente de optimización / decisión es NP-completo y primero necesita construir un modelo de condiciones locales de buen gusto, antes de dejar de lado uno de sus métodos favoritos.
En general, los métodos de aprendizaje inductivo son más “científicos” (bayesianos, SVM, etc.) mientras que los métodos de aprendizaje analítico (como el aprendizaje basado en explicaciones, EBL o razonamiento basado en casos, CBR) son más “artísticos”.
En la dimensión de la aplicación, la mayoría de los métodos en IA se aplican a modelos complejos, pero de mundo cerrado y no dinámicos.
La mayoría de los métodos en la teoría de control se aplican a problemas simples, pero de mundo abierto y dinámicos.
QP intenta cerrar la brecha, pero generalmente falla. Hay un famoso artículo de crítica llamado “Prolegómenos a cualquier física cualitativa futura” de Doyle y Sacks que debe leer para desarrollar un sentido apropiado de “gusto” en este campo.
La mayoría de las aplicaciones interesantes son AMBAS complejas y de mundo abierto, e incluso si adopta un enfoque multidisciplinario, tiene pocas posibilidades de éxito.
He tratado de mantener esta respuesta en un nivel de ciencia pop, pero realmente, una vez que haya tenido algunos problemas en su haber, se preocupará mucho menos por esta pregunta.
Debe tener en cuenta un par de percepciones más que existen.
- Las personas de optimización tienden a pensar que las personas de aprendizaje automático de IA son básicamente artistas de BS que visten cosas de optimización de panadería con disfraces y lo llaman “aprendizaje automático”. No estoy entre estas personas, pero debes saber que existen.
- La codificación del aprendizaje en el mundo abierto (consulte lo que eso significa en cualquier libro de texto de IA básico como Russell y Norvig) se encuentra en una etapa muy primitiva. Básicamente, el tipo de aprendizaje “No sé que no sé” o “desconocido desconocido”. No hemos ido mucho más allá de donde Von Neumann lo dejó con su autómata “constructor universal” en evolución en el mundo abierto. Hay mucho potencial allí.