¿Cuáles son los 5 conceptos más importantes de la inteligencia artificial?

Preguntas como esta siempre son un desafío para responder, pero definitivamente vale la pena intentar sintetizar lo que uno ha aprendido durante toda una vida haciendo investigación en un campo. Entonces, ¿cuál es mi elección de los 5 conceptos más importantes en IA?

La inteligencia como búsqueda en espacios problemáticos: Alan Newell fue uno de los defensores más contundentes del concepto de búsqueda como categoría fundamental de problema. Su trabajo histórico en SOAR, una arquitectura cognitiva, se basó en modelar cada problema de IA como el de la búsqueda en algún espacio problemático. Si pensamos en los principales éxitos de la IA recientemente, ya sea Alpha Go Zero at Go o el jugador Jeopardy de IBM o incluso el éxito en la construcción de automóviles autónomos, está claro que la observación de Newell sobre la primacía de la búsqueda sigue siendo tan relevante hoy en día como Fue hace varias décadas. Mi antiguo asesor de tesis, Tom Mitchell, escribió un artículo influyente llamado “Generalización como búsqueda”, que muestra cuánto del aprendizaje automático es una vez más reducible para buscar en algún espacio de hipótesis (o espacio de parámetros). De hecho, es difícil pensar en un problema de IA que no implique alguna búsqueda. Entonces, la búsqueda aparece como la primera en mi lista de los conceptos más importantes en IA. Hay muchas formas de modelar la búsqueda: la búsqueda en espacios continuos es básicamente el trabajo de optimización, ya sea el tipo convexo tradicional como en métodos como máquinas de vectores de soporte, o el tipo no convexo en el aprendizaje profundo. Los problemas de búsqueda discreta son como problemas de satisfacción de restricciones (piense en Sudoku) o busque en juegos (ajedrez, Go) o búsqueda en mapas (por ejemplo, A * en Google Maps).
El conocimiento como mecanismo efectivo para simplificar la búsqueda: dado que la búsqueda es la categoría principal en IA, el principal problema que debe abordarse es cómo hacer que la búsqueda sea más eficiente. No hace falta decir que es poco probable que los métodos de búsqueda “ciegos” escalen en un problema real. La búsqueda es manejable cuando se guía por el conocimiento relevante. Por ejemplo, en la optimización convexa, uno explota el conocimiento de que la función que se minimiza tiene “forma de cuenco” y tiene un mínimo único. El conocimiento también es extremadamente útil para simplificar el espacio de políticas o mapeos que se buscan en el aprendizaje por refuerzo. Considere el problema de entrenar un auto sin conductor. Aquí, conocer las reglas de tráfico simplifica enormemente el problema de qué políticas son “legales”, y se pueden eliminar clases enteras de acciones ilegales. Newell también introdujo un concepto fundamental que desafortunadamente ha sido olvidado y necesita ser reintroducido al estudiante moderno de IA. Al igual que los sistemas informáticos pueden describirse en varios niveles, por ejemplo, el nivel de hardware, el nivel de software, etc. Newell introdujo el concepto fundamental del “nivel de conocimiento”, que caracteriza un sistema de inteligencia artificial por lo que “sabe”. Esta caracterización es notablemente útil para proporcionar una caracterización de alto nivel de un sistema, abstraída de los detalles de cómo se representa, almacena, accede y utiliza el conocimiento. Lamentablemente, el concepto de nivel de conocimiento rara vez se usa más, pero en mi opinión, continúa proporcionando una de las formas más importantes para distinguir los sistemas de inteligencia artificial de otros sistemas inteligentes. Los sistemas de inteligencia artificial son inteligentes en la medida en que “saben” cosas sobre el mundo, y pueden actuar racionalmente dado su conocimiento. Entonces, la caracterización del nivel de conocimiento de un sistema de IA es el segundo concepto más importante en IA.
Representación e inferencia manejable: se ha hecho evidente durante varias décadas de investigación en IA que la forma del conocimiento, la representación, juega un papel crucial en determinar cuán eficiente será la inferencia al usar el conocimiento para guiar las decisiones. Numerosos resultados, desde la teoría del aprendizaje PAC en la teoría del aprendizaje computacional hasta el trabajo en modelos gráficos para la inferencia probabilística y el trabajo en la inferencia lógica, muestran que existe una compensación fundamental entre la expresividad y la trazabilidad. Cuanto más expresivo es un esquema de representación del conocimiento, menos manejable es, y esto impone una barrera fundamental en la construcción de sistemas de IA eficientes. Tome el simple problema de aprender funciones booleanas a partir de ejemplos. Resulta que es extremadamente difícil, si no imposible, aprender eficientemente cualquier función booleana de un número relativamente pequeño de ejemplos de manera confiable, pero si uno limita la función booleana a una clase más pequeña, digamos expresiones booleanas conjuntas donde cada “cláusula” es limitado a una disyunción de, a lo sumo, literales “k”: existen algoritmos eficientes. Por lo tanto, las representaciones desempeñan un papel fundamental en la determinación de si una estructura de conocimiento dada se puede aprender y se puede utilizar de manera eficiente para reducir la búsqueda. En última instancia, ¿muchas preguntas básicas sobre la representación en IA se reducen al último P = NP? pregunta que ha atormentado a los informáticos durante más de cuatro décadas. En matemáticas, las representaciones juegan un papel clave en la comprensión de las estructuras fundamentales, como las transformaciones lineales o las simetrías. Para comprender una transformación lineal, uno la asigna a una matriz, que es una representación de esa transformación de alguna manera. Para comprender las rotaciones en seis dimensiones, uno lo asigna a un grupo de un tipo particular, que también tiene una representación matricial. La teoría de las representaciones forma el tercer concepto más importante en IA.
Optimización versus equilibrio: al dar objetivos a los sistemas de IA, una tendencia natural es esperar que sean capaces de encontrar una solución “óptima” con respecto a alguna pérdida o función de utilidad. Queremos que nuestro automóvil autónomo funcione de manera óptima de acuerdo con algún conjunto de métricas. Aquí yace el problema, como dice el refrán. La mayoría de los problemas del mundo real implican el intercambio de un conjunto de métricas incompatibles entre sí. Un automóvil autónomo que optimice la seguridad podría no optimizar otras métricas, como llevar a los pasajeros a sus destinos a tiempo. Al observar el proceso de selección natural, está claro que la biología favorece el proceso de equilibrio (encontrar soluciones de equilibrio) en lugar de la optimización. Si estoy tratando de decidir cuál es la mejor ruta, por ejemplo, desde San Francisco hasta Palo Alto todas las mañanas, está claro que tengo control sobre solo un pequeño número de variables, como si manejo o tomo el Caltrain, y si manejo , qué autopista elijo, Ruta 1 o 280, pero no tengo control sobre las decenas de miles de otros conductores que persiguen sus propios objetivos de conducción autosuficientes para llegar al trabajo. En el mejor de los casos, puedo tratar de equilibrarme y encontrar una solución tal que forme un tipo de equilibrio “local” de Nash, de modo que no haya una mejora local en mi política siempre y cuando los otros conductores no se desvíen de sus elecciones. Los equilibrios de Nash parecen fundamentales para diseñar sistemas de IA de múltiples agentes, ya que la optimización parece una métrica irremediablemente ideal que no se puede lograr en un problema del mundo real. Entonces, mi cuarto concepto más importante es el de encontrar soluciones de equilibrio.
Distributividad versus localidad y tolerancia a fallas: claramente, si vamos a construir sistemas de IA resistentes a fallas, deben tener cierta capacidad inherente para soportar fallas de componentes individuales. El cerebro humano no tiene comparación en este sentido, ya que incluso los pacientes con lesiones cerebrales graves pueden compensar sus pérdidas y recuperar una funcionalidad casi completa. Por lo tanto, cualquier sistema de representación del conocimiento que finalmente tenga éxito en IA debe ser igualmente capaz de un deterioro suave, donde la pérdida de componentes individuales no haga que todo el sistema quede inoperable. A diferencia de la mayoría de los sistemas informáticos modernos, donde la pérdida de un solo sector puede hacer que un disco duro sea ilegible a veces, los sistemas de inteligencia artificial necesitan conocimiento almacenado de una manera altamente redundante, para que el conocimiento pueda reconstruirse de una manera tolerante a fallas, de la misma manera que la memoria humana es capaz para reconstruir eventos. El requisito de tolerancia a fallas conduce inexorablemente a representaciones e inferencias distribuidas y, en última instancia, a modelos de IA inspirados neuronalmente, donde se combinan muchos elementos informáticos simples para producir un comportamiento inteligente. Por lo tanto, mi quinto concepto más importante en IA sería el diseño de sistemas paralelos distribuidos basados en el conocimiento que puedan funcionar de manera tolerante a fallas a prueba de fallas, al igual que el cerebro humano.

OK, aquí está mi lista de los cinco conceptos más importantes en IA, y por qué representan mis 5 mejores opciones. ¡Esperamos que te sea útil!

Aprendizaje automáticoArtificialinformáticaInteligenciaInteligencia Artificial General