En comparación con los matemáticos, ¿cuáles son las habilidades matemáticas de los investigadores de IA?

Existe un rango de conocimiento en IA que puede o no tener una comprensión más profunda de las matemáticas. Comprender la teoría matemática más profunda puede ser útil para explorar nuevas áreas de IA solo porque otros no se atrevieron a profundizar en eso.

Eso fue lo suficientemente vago. Pero, tenga en cuenta que los objetivos de las asignaturas son diferentes, al igual que los objetivos de física vs matemática, o programación de sistemas vs IA.

Entonces, recuerdo que algunos estudiantes graduados de CS en CMU, aquellos que se enfocaron en temas de OS atacaron a este estudiante de doctorado en psicología cognitiva que solo quería escribir su tesis, y su profesor le dio un asiento en la sala de informática de posgrado. Afortunadamente, los niños no eran físicamente agresivos. Pero, sí, fueron verbalmente agresivos con el Cog Scientist. Uno de los graduados de CS salió corriendo de la habitación y fue a su asesor inmediatamente para que echaran al Cog Scientist. El graduado de CS regresó en un estado de ánimo abatido, ya que su asesor le dijo que fuera amable con el Cog Scientist y que lo ayudara con los recursos.

Se supone que AI es el gemelo fraterno de Cog Sci. Pero puedes conocer a los tipos de IA que desearían que se pareciera más al diseño de una computadora y que esperan que la inteligencia se pueda entender sin referirse a los humanos. Pero, eso es más soñador que práctico. No es que se destinaron grandes cantidades de fondos a la esperanza de hacer máquinas sin referencia al ser humano. (por ejemplo, el programa DARPA Star Wars).

Entonces, entiendes que en algún momento, los programadores de sistemas no tenían interés en incluir AI en su espacio mental. Las computadoras eran solo máquinas. Y, UNIX era hermoso, mientras que todo el arte en el Louvre sería considerado como basura despreciable.

OKAY. Eso fue para entender los diferentes puntos de vista. La IA es una forma de ingeniería más que una forma de matemática. Es interesante que algunas de las primeras conferencias sobre memorias direccionables por contenido y recocido simulado para modelado cognitivo se presentaron en conferencias de física (como la conferencia Snowbird en Utah a principios de los años 80).

Entonces, la IA difiere de las matemáticas en que la IA generalmente busca usar las matemáticas en lugar de demostrarlo. Y, las matemáticas se mantienen dentro de un teorema y un marco de prueba. Las matemáticas numéricas demuestran la velocidad de los algoritmos para los cálculos numéricos, las tasas de convergencia, la proximidad de la aproximación y la calidad de las transformaciones. La IA usa rutinas numéricas para crear autómatas que llevan a cabo tareas específicas que tienen que ver con la memoria, el reconocimiento, la creencia, la búsqueda de objetivos y el logro.

Entonces, para una base de conocimiento, habría un almacenamiento de declaraciones sobre algún tema. Con suerte, la colección de declaraciones interactúa bien entre sí. Un programador de IA podría usar un lenguaje como Prolog (aún hasta el día de hoy) para averiguar si su base de conocimiento es consistente y para verificar si se puede agregar una nueva declaración. Los procedimientos de resolución en un lenguaje como Prolog pueden llevar a cabo una forma de deducción lógica para verificar las declaraciones.

Un teórico modelo, una especie de lógico matemático, consideraría la estructura de una colección de afirmaciones consistentes. Podría buscar un teorema sobre el número máximo de enunciados que permitirían un modelo consistente. Podría probar teoremas sobre cómo cambiarían las formas de las declaraciones cuando se definan ciertas entidades individuales. Cada teorema sería el resultado de su trabajo, y las pruebas serían registradas.

La geometría diferencial podría ser útil para construir robots. Se necesitan algoritmos para el movimiento a través del espacio, la prevención de colisiones y la descripción de vectores físicos en diferentes espacios articulares desde los sensores del punto de vista en un espacio más amplio.

Pero, un geómetra diferencial podría estar interesado en las expresiones algebraicas requeridas para describir el transporte paralelo. Podría estar interesado en demostrar que se utilizaría un cierto conjunto de matrices para describir las traducciones en las superficies de Riemann.

Existen teoremas sobre espacios de búsqueda y heurísticas que son peculiares de la IA. Estas son de hecho matemáticas. Pero, esto no es una desviación demasiado grande de la ingeniería, donde el uso de la disciplina matemática para hacer teoremas y pruebas para que se puedan definir buenos marcos para una mejor ingeniería. Y, los teoremas se pueden usar para establecer algoritmos de coincidencia de patrones, agrupamiento, etc.

Aquellos que exploran la física, la ingeniería y disciplinas similares a veces pueden contribuir a la matemática propiamente dicha, porque el trabajo revelará más áreas para las matemáticas. Se trata de pensar en las ruedas de entrenamiento y en cómo sacarlas de la bicicleta de carreras. Entonces, uno piensa en los árboles de búsqueda, y luego comienza a pensar en guiar los sistemas dinámicos. Uno piensa en controlar un robot, y luego piensa en permitir que los robots se salven de las caídas (rápido, barato y fuera de control) como base para caminar. Entonces, uno podría comenzar a pensar en el movimiento como algo relacionado con catástrofes. Entonces se podría explorar la teoría de la catástrofe tratando de pensar en un modelo de movimiento. Uno podría mirar las wavelets para comprender las señales y la agrupación de frecuencias en un concepto de tono. Entonces, uno podría mirar la naturaleza fractal de las transiciones tonales. No digo que todos estos saltos de pensamiento tengan sentido, sino solo querer ilustrar la idea de que uno puede saltar en la teoría matemática tratando de encontrar el modelo de inteligencia, o el manejo de datos perceptuales, que las matemáticas simples habían pasado por alto.

Entonces, si realmente desea hacer la máquina inteligente, es posible que necesite ser matemático, solo porque las matemáticas que necesita aún no se han inventado. Pero, entonces es probable que te encuentres luchando con las matemáticas de una manera más parecida a un físico o ingeniero que a un matemático puro.

¿Qué subcampo o resultado en matemática pura podría ser el próximo en encontrar aplicaciones (sorprendentes) del mundo real?

Si se demuestra P = NP, ¿cómo cambiará el campo de la inteligencia artificial?

Cómo calcular el inverso de la distribución normal estándar

¿Todos los números reales tienen una expansión binaria?

¿Es el código de computadora una forma de representación matemática?

¿Qué tan bueno es AMD Radeon R5 M430 2 GB?

En la gran mayoría de los casos, el nivel matemático de los investigadores de IA es incomparablemente más bajo que el de los matemáticos, y eso no es necesariamente algo malo. La forma más fácil de ver esto es en términos de lugares de conferencias y subcampos. La visión, la PNL y la mayoría de los investigadores de aprendizaje profundo tienen habilidades matemáticas extremadamente básicas en comparación con los matemáticos. Incluso muchos documentos de ICML / NIPS, que tienden a ser más matemáticos, son simplemente: tener una idea, hacer una pequeña ecuación presionando para mostrar las reglas de actualización, mostrar los resultados de los experimentos, y tal vez, si estás en el más lado matemático, pruebe algunas buenas propiedades del algoritmo. Incluso al hacer esto último, la sofisticación matemática es extremadamente baja en comparación con la mayoría de los trabajos en matemáticas.

Sin embargo hay algunas excepciones. Las personas que aprenden teoría son esencialmente matemáticos aplicados, y algunos de ellos son excelentes. Las personas que realizan estadística / probabilidad matemática a menudo trabajan en áreas relevantes para la IA, y esas personas tienen una alta sofisticación matemática, reflejada en sus documentos.

Alex Coninx

En muchas áreas de la IA, puede sobrevivir con álgebra lineal, cálculo multivariado, teoría de la probabilidad y algo de informática básica, aunque ese es el requisito mínimo.

En la práctica, la madurez matemática y la amplitud ayudan, y si tiene una experiencia más profunda que esta, tendrá mejores intuiciones y podrá contribuir a áreas más especializadas de investigación de IA. Incluso podría detectar una conexión interesante con algunas matemáticas más profundas que nadie había visto todavía.

Tener buenas intuiciones geométricas ayuda. Un conocimiento más profundo de las estadísticas (especialmente de la variedad Bayesiana, pero también de las estadísticas frecuentes y no paramétricas) y la optimización es muy útil. También es bueno tener una conciencia básica del análisis numérico.

El análisis funcional básico puede ser útil en muchas áreas, por ejemplo, métodos de kernel y optimización. Si se trabaja con datos o imágenes de series temporales, análisis complejos, procesamiento de señales, teoría de Fourier, etc. EDO / PDE para aplicaciones físicas de ML, teoría de control, etc. Muchas ideas de la física estadística se muestran en el aprendizaje automático probabilístico.

Si desea trabajar en el lado más teórico del campo, entonces, dependiendo del sabor de la teoría, algunos análisis más profundos, análisis convexos, estadísticas matemáticas, informática teórica, etc. pueden ser útiles para probar los límites. Estoy seguro de que otros pueden señalar otras áreas.

En general, creo que es justo decir que el campo es mucho menos exigente matemáticamente que el tipo de cosas en las que trabajan los matemáticos profesionales, aunque algunas partes son quizás comparables con algunas áreas de matemáticas aplicadas.

Si desea pasar a la IA y se pregunta qué áreas de matemáticas estudiar, me volvería muy bueno en esas áreas centrales, y luego más allá, profundice hasta que haya aprendido lo suficiente sobre IA / aprendizaje automático y los diferentes subcampos dentro de él.

Soumya Ranjan Dash

No hay comparación Los investigadores de IA (así como los investigadores en la mayoría de los otros campos de CS e ingeniería) deben ser competentes con las herramientas matemáticas que utilizan. (Para mí, eso significa principalmente álgebra lineal, estadísticas y algunas ecuaciones diferenciales). La matemática es un lenguaje que usan y una herramienta necesaria para diseñar los sistemas en los que trabajan.

Por lo que entiendo, los matemáticos hacen cosas muy diferentes. Profundizan en las teorías matemáticas, estudian las propiedades de los objetos matemáticos extraños de los que el investigador promedio de CS nunca ha oído hablar (y mucho menos entienden), diseñan nuevas abstracciones, escriben pruebas de teoremas que describen cómo esos objetos interactúan o están relacionados entre sí, y al hacerlo, expanden el conocimiento de su campo. No es solo que las matemáticas que hacen están más avanzadas; El alcance, el propósito y los métodos de su trabajo son diferentes.

Si me encuentro con un problema matemático en mi investigación, trato de resolverlo. Si no puedo, les pregunto a mis compañeros de trabajo si tienen una pista. Si no lo hacen, investigo y pregunto a más personas. Si nadie puede descifrarlo y empiezo a preguntarme si podría ser un problema matemático real y no solo un problema sobre mi dominio (y el de mis compañeros de trabajo), consideraré pedirle ayuda a un matemático.

Roman Trusov

¿Cuánta teoría matemática se necesita?

Usted y su amigo estaban discutiendo su idea de una nueva arquitectura neuronal, digamos, alguna modificación de las redes con un lado de aprendizaje de refuerzo, durante el almuerzo. Le brinda varios detalles técnicos sobre la implementación, que es más o menos claro sin más explicaciones.

Después del almuerzo regresas a la oficina y de repente preguntas, ¿por qué funciona ? Encuentra una habitación sin reservar, ve a la pizarra y comienza a definir brevemente una convolución a través de la Transformación rápida de Fourier. Ahora, como pasante, no estoy obligado a saber esto. Pero normalmente, estas cosas ni siquiera se explican. La gente simplemente escribe algunas ecuaciones, describe la idea en unas pocas oraciones, deriva el objetivo de la optimización y todos pueden escribir un código.

No necesita conocer todos los teoremas relacionados y poder probarlos de inmediato; de hecho, casi nadie lo hace. Pero se espera que comprenda todos los conceptos subyacentes muy rápidamente sin los Métodos numéricos 101. Por “entender” me refiero a “ser capaz de implementarlo en un tiempo razonable”.

En general, los investigadores de IA poseen habilidades mucho más aplicadas porque demostrar que algo no es suficiente, quieres que funcione. Para el matemático, las matemáticas son literalmente alfa y omega, para las personas con IA sirve como base para la creación de soluciones.

Roman Trusov

La matemática es un campo muy amplio, como ya sabes, y un matemático aplicado no es lo mismo que un teórico que trabaja en la teoría de números y el estudio de los números primos. La factorización prima, etc. obviamente tendría un impacto en la criografía, etc.

Del mismo modo, las pruebas en el embalaje tendrían un impacto significativo en la arquitectura de los chips de computadora a medida que se introducen más capas, etc.

Pero las matemáticas requeridas en la inteligencia artificial básicamente tendrían que estar relacionadas con alguna forma de lógica, lenguaje (jerarquía de Chomsky) y otros conceptos en informática (por ejemplo, autómatas, máquinas de turing).

Incluso si se considerara el aprendizaje profundo, el ajuste óptimo de la función en términos de pesos y características en las NN es una propiedad evolutiva o emergente. Puede haber aplicaciones de las matemáticas en la comprensión de estos sistemas que pueden estar cerca de las matemáticas de dinámica no lineal, por ejemplo, trayectorias, atractores, etc. Estudiarlos puede ayudar a un aprendizaje más rápido.

Se cruzarían con el análisis funcional, la optimización y la heurística, pero las matemáticas requeridas aquí no necesitan ser ODE / PDE. Las soluciones numéricas pueden ser útiles en ciertos casos, pero no veo muchas aplicaciones. ¿Cuántas veces en IA se necesita obtener una solución numérica para una función?

Las PDE, etc. y las soluciones numéricas son ciertamente útiles en simulaciones de sistemas simples a complejos en biología (biología de sistemas), predicción climática, etc. Pero difícilmente pueden clasificarse como IA.

En resumen, parece haber un pequeño componente de matemática relacionado con la computación que es aplicable en IA.

Alex Coninx

Depende un poco.

En un extremo, una gran cantidad de trabajos tempranos de IA centrados en sistemas expertos, no hay muchas matemáticas involucradas.

En el otro extremo, redes neuronales, aprendizaje profundo, eso es bastante intensivo en matemáticas.

En el medio, cosas como las redes cognitivas pueden ser informadas por la teoría de grafos, muchas cosas pueden ser informadas por la combinatoria.

Y, una gran cantidad de cosas se pueden modelar de formas distintas a las fórmulas matemáticas (por ejemplo, círculos y flechas en una pizarra, código), y se pueden probar a través de la fuerza bruta (ejecute el código). Aunque podría decirse que el código de computadora es una forma de representación matemática, si no es algo sobre lo que puede probar fácilmente las fórmulas.

Soumya Ranjan Dash

Si quieres hacer matemáticas, entonces el matemático es generalmente mejor. Si quieres hacer cosas prácticas con el aprendizaje automático, entonces dirígete a la persona que conoce el aprendizaje automático. Sin embargo, depende completamente de qué nivel de habilidad es el matemático y qué nivel de habilidad es la persona de aprendizaje automático. He visto a ambos muy calificados y poco calificados en ambas áreas. Por lo tanto, es completamente imposible hacer una caracterización general. Sin embargo, si ambos están en la cima de su juego, vaya a sus respectivos campos para las áreas en las que están mejor.

Roman Trusov

More Interesting

Si tengo una variable, X, en un modelo de regresión que se calcula usando otras tres variables (X = 0.3X1 + 0.5X2 + 0.2X3), ¿está bien que regrese 0.3X1, 0.5X2 y 0.2X3 por separado?

Como teórico, ¿cómo guardas notas?

¿Se pueden replicar completamente todas las funciones matemáticas utilizando una secuencia de operadores '+', '-', 'x', '/' (como puede y para la potencia x)?

¿Qué es p en 720p?

Cómo escribir un programa en Java para encontrar la suma de números primos de menos de 2 millones

¿Cómo sabe la CPU que estamos usando el complemento de uno o el complemento de dos para representar números negativos?

¿Cuál es la mejor manera de aprender el aprendizaje automático aprovechando mi sólida formación matemática?

¿Cuál es el límite y cómo puedo probar: [math] \ lim_ {n \ rightarrow \ infty} {n ^ dn ^ c} [/ math] cuando [math] 0 \ leq c <d [/ math]?

¿Cuáles son las mejores maneras de mejorar la habilidad de programación a través de las matemáticas?

Cómo comprender completamente los condicionales en matemáticas discretas