¿Una máquina aprende una ciencia o un arte?

Roar Nybø No estoy del todo seguro de que esta sea la misma pregunta que ¿Por qué se considera que los campeones de las hojas de cálculo son analistas de datos expertos, mientras que los estudiantes de informática están en segundo plano?

Esa pregunta era más sobre el lado de minería de datos / big data de CS, que se superpone pero no es un subconjunto o superconjunto del aprendizaje automático.

Cuando pienso en el aprendizaje automático, pienso en términos del tema de los libros de texto básicos de IA como “Reinforement Learning” de Sutton y Barto y “Machine Learning” de Mitchell. También pienso en términos de física cualitativa (QP) y mi campo de teoría de control local, de los cuales las personas de CS / AI generalmente no son muy conscientes.

El sentido que obtienes de esos libros y campos es un mapa que se parece a esto. No me dejes llevar por esto demasiado … bosquejo muy rápido para darte una idea de lo complicada que es la situación en el terreno. Probablemente podría obtener 10 versiones de este diagrama que son 10 veces mejores, y ninguna de ellas sería similar. Esto se debe a que la ciencia es joven y los paradigmas siguen divergiendo en lugar de converger.

Por lo tanto, el aprendizaje automático es “ciencia” si obtiene una aplicación que está dentro del rango de uno de los métodos codificados (donde la creatividad se reduce al ajuste de parámetros) en IA o teoría de control. Hay un conjunto más grande de métodos ad hoc, donde se trata principalmente de arte, donde la creatividad va más allá del ajuste de parámetros y básicamente se inventa representaciones y modelos de aprendizaje. Por lo general, esto sucede cuando el problema subyacente de optimización / decisión es NP-completo y primero necesita construir un modelo de condiciones locales de buen gusto, antes de dejar de lado uno de sus métodos favoritos.

En general, los métodos de aprendizaje inductivo son más “científicos” (bayesianos, SVM, etc.) mientras que los métodos de aprendizaje analítico (como el aprendizaje basado en explicaciones, EBL o razonamiento basado en casos, CBR) son más “artísticos”.

En la dimensión de la aplicación, la mayoría de los métodos en IA se aplican a modelos complejos, pero de mundo cerrado y no dinámicos.

La mayoría de los métodos en la teoría de control se aplican a problemas simples, pero de mundo abierto y dinámicos.

QP intenta cerrar la brecha, pero generalmente falla. Hay un famoso artículo de crítica llamado “Prolegómenos a cualquier física cualitativa futura” de Doyle y Sacks que debe leer para desarrollar un sentido apropiado de “gusto” en este campo.

La mayoría de las aplicaciones interesantes son AMBAS complejas y de mundo abierto, e incluso si adopta un enfoque multidisciplinario, tiene pocas posibilidades de éxito.

He tratado de mantener esta respuesta en un nivel de ciencia pop, pero realmente, una vez que haya tenido algunos problemas en su haber, se preocupará mucho menos por esta pregunta.

Debe tener en cuenta un par de percepciones más que existen.

Las personas de optimización tienden a pensar que las personas de aprendizaje automático de IA son básicamente artistas de BS que visten cosas de optimización de panadería con disfraces y lo llaman “aprendizaje automático”. No estoy entre estas personas, pero debes saber que existen.
La codificación del aprendizaje en el mundo abierto (consulte lo que eso significa en cualquier libro de texto de IA básico como Russell y Norvig) se encuentra en una etapa muy primitiva. Básicamente, el tipo de aprendizaje “No sé que no sé” o “desconocido desconocido”. No hemos ido mucho más allá de donde Von Neumann lo dejó con su autómata “constructor universal” en evolución en el mundo abierto. Hay mucho potencial allí.

¿Se usa el álgebra abstracta en el aprendizaje automático?

¿Ubuntu es mejor con machine learning que mac?

¿Cuándo es PyTorch más útil en comparación con TensorFlow y viceversa?

¿Cuál es la diferencia entre redes neuronales y de creencias?

¿Existe algún programa que pueda ajustar computacionalmente funciones armónicas esféricas en un conjunto de datos?

¿Existe una solución tecnológica razonable para el calentamiento global?

El usuario de Quora dio una buena respuesta a la misma pregunta, pero expresó más específicamente: ¿Por qué los campeones de hojas de cálculo se consideran analistas de datos expertos, mientras que los estudiantes de informática toman un segundo plano? Un punto que eliminé de su respuesta es que el aprendizaje automático es un campo que carece de una teoría y un conjunto de herramientas definitivos para producir respuestas. En la mecánica clásica, puede conectar los números y obtener la respuesta correcta sin ninguna inteligencia o perspicacia. En ML no puedes.

Estoy de acuerdo con Andrés Corrada-Emmanuel en que el procesamiento previo es un tema que se pasa por alto. Si a ML le faltan piezas, ahí es donde están. En la investigación que estoy haciendo ahora, obtuve los mejores conocimientos sobre el problema al analizar realmente los problemas molestos de la recopilación y la limpieza de datos.

Rugido Nybø

Todas las ciencias son artes. Todas las artes son ciencias. A pesar de nuestros prejuicios personales hacia la certeza pura o la creatividad pura, el mundo real está formado por paradigmas desordenados. Un poco de esto, un poco de aquello. Los formalizadores / platónicos quieren pretender que todo es reducible a las formas perfectas. Los catalogadores / Aristotélicos que solo tenemos que catalogar todos los ejemplos prácticos. ¿No podemos todos llevarnos bien? 😉

Mi experiencia con la práctica del aprendizaje automático es que la recopilación y limpieza de datos puede representar hasta el 50% de su tiempo en un proyecto de investigación. Una vez pasé tres meses trabajando en el conjunto de datos de correo electrónico de Enron para prepararlo para probar un nuevo modelo LDA (el ART o el modelo Autor-Destinatario-Tema). La adaptación del modelo y el descubrimiento del tema tomó un mes.

Sin embargo, si observa el enfoque de la mayoría de los artículos y conferencias de LA, la mayor parte de su preocupación está en la parte teórica de su trabajo. La preparación de datos se considera una tarea baja, poco discutida por sus implicaciones teóricas, pero necesaria para la publicación de cualquier trabajo nuevo (los revisores de la conferencia degradan los documentos que utilizan solo conjuntos de datos sintéticos). Un poco esquizofrénico si me preguntas.

No me refiero a elegir en el campo de ML, todos los campos sufren esta guerra religiosa teórica versus experimental. El físico experimental Rutherford comentó una vez que los teóricos estaban sobre sus patas traseras y que el trabajo de los experimentadores era volver a derribarlos. La llegada de los grandes datos nos está volviendo hacia el lado de Rutherford.

Rugido Nybø

More Interesting

¿Cuáles son algunas aplicaciones de muestreo de importancia en Deep Learning?

¿Cómo se usa la pérdida de peso para la regularización en las redes neuronales?

Usando TensorFlow, ¿cómo construiría una IA que pueda reconocer patrones en secuencias numéricas y luego transmitir el patrón al usuario? Está destinado a aprender los patrones que le doy de comer.

¿Cuántas estadísticas y probabilidades debo saber para sumergirme en el aprendizaje automático?

¿Cuáles son los temas candentes en el aprendizaje automático y la lógica difusa juntos?

¿Puedo usar el aprendizaje profundo para aprender el aprendizaje profundo?

¿Hay alguna conexión entre el aprendizaje de kernel múltiple (MLK) y el aprendizaje profundo?

Cómo eliminar una fila completa de un conjunto de datos si encuentro entradas faltantes en R

¿Es posible asegurar trabajos solo en base a la experiencia en aprendizaje automático sin ser un ingeniero de software adecuado?

Cómo realizar un detector de rectángulo con un fondo y un primer plano complejos