¿Qué parte de Machine Intelligence no es la optimización (por ejemplo, un proceso de decisión de Markov)?

Permítanme comenzar discutiendo la diferencia entre la optimización y el aprendizaje automático:

La optimización cae en el dominio de las matemáticas . Los problemas matemáticos están matemáticamente bien definidos, es decir, hay alguna respuesta que puede obtenerse y verificarse como verdadera dada la potencia y el tiempo computacionales infinitos. La optimización cae en esta categoría: dado un problema de optimización, en principio, puede encontrar una solución al problema, sin ambigüedad alguna.

El aprendizaje automático, por otro lado, cae en el dominio de la ingeniería . Los problemas de ingeniería a menudo no están matemáticamente bien definidos. Por ejemplo, considere el problema del reconocimiento facial. No existe una formulación matemática precisa que describa inequívocamente el problema. Es decir, dadas 100 imágenes de una persona y un poder y tiempo computacionales infinitos, ¿hay alguna manera infalible de reconocer una foto invisible de esa persona? ¡No! La ingeniería se trata de analizar tales sistemas y de crear un “modelo” que explique aproximadamente el comportamiento del sistema. Este modelo ahora es susceptible de tratamiento matemático, utilizando técnicas matemáticas estándar. Esta es precisamente la relación entre el aprendizaje automático y la optimización: el aprendizaje automático implica elaborar un modelo matemático para un problema, que a menudo resulta ser un problema de optimización, que ahora se puede resolver utilizando técnicas matemáticas.

Por lo tanto, ML implica principalmente modelar sistemas inteligentes del mundo real, para hacer cosas inteligentes. Por ejemplo, observar a los conductores humanos para construir automóviles autónomos, resumir documentos grandes, comprender la semántica de imágenes y videos, etc. Esto es muy diferente de los problemas típicos manejados en campos como la investigación de operaciones (como la gestión de la cadena de suministro, la programación, etc. [ver Investigación de operaciones – Wikipedia]), o modelado matemático (astronomía, biología, economía, etc. [ver Modelado matemático]). La programación dinámica es una clase totalmente diferente: hay una función objetivo bien definida para empezar, y no hay un componente de modelado. Por lo tanto, pertenece a las matemáticas, en lugar de la ingeniería. Además, las aplicaciones de ML / AI son enormes.

Por lo tanto, está totalmente justificado tener un campo separado para AI / ML, que se centra en una pequeña clase de problemas de modelado. Es probable que se solapen con otras disciplinas, en términos de problemas resueltos y técnicas utilizadas, pero eso también es cierto entre física-química, física-matemáticas, economía-estadística, etc.

Aprendizaje automáticoInformática teóricaInvestigación de operacionesProgramación dinámica

Muchos resultados matemáticos se prueban con computadoras. Si un estudiante escribió un código como prueba en un examen sobre una prueba tradicional, ¿debería ser aceptado?

¿Qué debe incluirse en cualquier programa que use la función matemática?

¿Cuál es la correlación entre las matemáticas y la informática? ¿Por qué es necesario?

¿Qué algoritmo debo usar para crear un solucionador de Sudoku?

¿APUS es seguro para cualquier usuario?

¿La informática teórica tiene algo que ver con la minería de datos?

Voy a responder la pregunta no formulada: ¿por qué las personas que actúan como el aprendizaje automático es especial de repente?

La verdad es que no es tan repentino. La gente ha estado entusiasmada con las posibilidades de la IA desde los albores de la informática. Hemos estado en un ciclo de exageración de 10 o 15 años y luego decepción cuando las expectativas no coinciden con la realidad.

Más recientemente, Google realmente ha entusiasmado a la corriente principal con su profundo rendimiento en Go, IBM ha invertido una gran cantidad de fondos en Watson y su modelo basado en servicios, y están sucediendo cosas emocionantes con los autos sin conductor, Open AI, etc. Así que hay mucha publicidad en marcha el momento.

Además de algunas innovaciones clave que probablemente nos acompañarán por un tiempo, gran parte de este zumbido reciente se evaporará cuando la corriente principal nuevamente aprenda que no es tan simple como parece automatizar muchos trabajos. Incluso cuando superamos con éxito los desafíos técnicos, las barreras políticas y culturales a menudo parecen insuperables.

No me malinterpreten, estamos haciendo un progreso constante, pero la exageración actual no es acorde con los avances recientes, en mi opinión.

En cuanto a la otra parte de su pregunta, afirmando que en su mayoría son redes neuronales, no, ahí es donde la última ronda de mejoras y exageraciones han sido más evidentes. Hay muchas ramas de la IA, y aunque algunas parecen ver las NN como una solución única para todos, esto simplemente no es cierto. Los algoritmos genéticos, los sistemas basados en reglas, los sistemas difusos, los sistemas de aprendizaje por refuerzo, la teoría de la información e incluso los enfoques de modelos estadísticos más directos tienen su propio lugar en el panorama de la IA.

El problema que vemos en la investigación de IA es que tan pronto como una solución se comprende bien, las personas dejan de aceptarla como IA “real”. Creo que esto nunca ha sucedido realmente con las NN en gran medida porque no puedes hacer más que unos pocos pasos de propagación hacia atrás antes de aburrirte y querer matarte, aunque fundamentalmente es bastante sencillo en lo que respecta a los algoritmos.

Ivan Bindoff

More Interesting

¿Quién gana y por qué: física de estado sólido, informática teórica o programación práctica?

En programación, ¿lo nuevo suele ser mejor?

Proyectos teóricos de informática o desarrollo de aplicaciones, ¿qué le sugerirías a los estudiantes de primer año de informática?

¿Qué es la justicia fuerte y la justicia débil en los métodos formales?

¿Hay alguna manera de colapsar una expansión de Maclaurin a la función original?

¿Cuál es el problema P versus NP en informática?

¿Existe la probabilidad en la computadora?

¿Qué significa una garantía teórica en el aprendizaje automático?

¿Cuáles son los factores de (ab - b ^ 2)? ¿Es necesario conocer los valores de a y b, y si no, por qué no?

¿Por qué se acepta la tesis de Church-Turing? Tengo problemas para concebir un programa para una máquina de Turing que sume dos números arbitrariamente grandes.