¿Por qué los investigadores de IA no desarrollan más “sistemas expertos”?

TL; DR: una de las mayores revoluciones en inteligencia artificial en los últimos 30 años es un cambio a enfoques estadísticos y basados ​​en datos para construir sistemas inteligentes. Los sistemas basados ​​en datos suelen ser mucho más robustos y confiables. A medida que obtengamos más datos específicos de tareas de expertos en dominios específicos, espero que podamos construir sistemas expertos (confiables) con los que se soñó en las décadas de 1970 y 1980.

Para citar Wikipedia: “un sistema experto es un sistema informático que emula la capacidad de toma de decisiones de un experto humano”.

Bajo una interpretación amplia de esta definición, muchos sistemas actualmente están haciendo cosas que uno podría imaginar que hace un experto humano.

Por ejemplo:

– Amazon recomienda que los artículos se emparejen con las cosas que está comprando actualmente o considerando comprar.

– Traducción de idiomas de Google.

– Autos sin conductor

Todos estos ejemplos son cosas que requieren cierto nivel de habilidad o experiencia por parte de un humano para realizar. Si se compararan estos ejemplos con los ejemplos estereotipados de los años setenta y ochenta, la lista anterior de alguna manera parece menos profunda o más genérica. Una de las principales razones por las que se da el caso se debe a la disponibilidad de datos (por ejemplo, lo que otras personas compran en Amazon, los textos traducidos disponibles o el seguimiento de cómo conducen los humanos en entornos urbanos).

En la actualidad, la mayoría de los sistemas inteligentes se desarrollan de forma predominantemente basada en datos. En contraste, la mayoría de los sistemas expertos más antiguos tenían dificultades para construir una base de conocimiento adecuada para ser realmente útiles en la práctica. Como resultado, los sistemas expertos más antiguos no eran muy robustos y pueden fallar cuando se enfrentan a una situación que no estaba codificada en su base de conocimiento. Para obtener más información, consulte la sección de Wikipedia sobre las desventajas del sistema experto.

Eso no quiere decir que no hay sistemas en estos días que se esfuercen por alcanzar un nivel de “pericia” por el que se esforzaron los sistemas más antiguos. El principal ejemplo de esto es IBM Watson. Por ejemplo, vea este artículo sobre la solicitud de Watson para asistencia médica: Watson de IBM es mejor para diagnosticar el cáncer que los médicos humanos (Wired UK). Pero incluso los sistemas como Watson se desarrollan de una manera predominantemente basada en datos, y creo (corríjame si me equivoco) usan operadores lógicos poco profundos para tomar decisiones o recomendaciones, en comparación con los motores de inferencia lógica más complicados utilizados en el 1970 y 1980.

Como otro ejemplo, muchas cirugías en estos días se realizan con el sistema quirúrgico da Vinci. Realmente podemos rastrear todas las acciones que los cirujanos hacen cuando usan este sistema. Entonces, en principio, una vez que tenemos suficientes datos, podemos entrenar una versión automatizada de este sistema para realizar operaciones simples. Por ejemplo: la subvención Big NSF financia investigaciones para entrenar robots para trabajar con humanos.

Una conclusión razonable a partir de esto es que los datos son (en el primer nivel) más importantes que las inferencias lógicas complejas. Por ejemplo, la lógica proposicional es solo una forma compacta de almacenar múltiples escenarios IF-THEN-ELSE diferentes. En un caso ingenuo, si tenemos suficientes datos, podemos desplegar tales declaraciones condicionales en una gran tabla de búsqueda (y, por lo tanto, descartar todas las nociones de lógica proposicional), y examinar qué puntos de datos caen en cada celda de la tabla. Por supuesto, hacer que los dos (datos e inferencia compleja) trabajen en sinergia es aún mejor, que es lo que muchos proyectos de investigación se esfuerzan por hacer hoy en día.

En las décadas de 1980 y 1990, se desarrollaron sistemas expertos para muchas empresas y surgieron varias empresas de inteligencia artificial que arrinconaron el mercado de sistemas expertos. Hoy, los sistemas expertos son un problema resuelto con herramientas probadas. En la actualidad, los sistemas expertos son tecnología convencional y se encuentran a menudo en empresas donde las políticas deben automatizarse (procesamiento de préstamos, revisión de fraudes, gestión de inversiones, etc.). Los investigadores de IA se centran en problemas que no son estándar, de memoria o resueltos.

La otra razón por la que quizás no escuche sobre Expert Systems es que son herramientas de ventaja competitiva y las compañías no anuncian sus ventajas competitivas.

Lo hacen, pero aprender de los datos ha sido un enfoque más exitoso recientemente y es probable que esta tendencia continúe. Todavía hay experiencia involucrada en la aplicación de técnicas de aprendizaje automático.

Aquí hay un ejemplo de por qué los métodos estadísticos pueden ser superiores:

si se que es esto

entonces haz esto

¿Qué sucede cuando no sabes qué es? El sistema falla o tiene un caso predeterminado. Brindan conocimiento experto y usan soluciones codificadas en lugar de avanzar gradualmente el conocimiento y usan un enfoque más comparativo a través de estadísticas para descubrir rasgos y manejar más casos de uso.

Lo más parecido a un sistema experto sería un árbol de decisión codificado. Todavía se usan cuando la precisión es equivalente y la IA falla con demasiada frecuencia.

Un problema principal con los sistemas expertos de estilo antiguo eran sus limitaciones en la construcción de modelos. Puede ver que si simplemente analiza una situación en términos de reglas rígidas y preestablecidas, esto sería muy restrictivo. Las reglas estrictas a menudo asumen un modelo muy específico. Si algo sucede fuera de ese modelo, la regla puede romperse. Incluso cuando permite que un ES tenga variables, eso todavía no es suficiente para hacer un modelado flexible. Muchas veces, para llegar a comprender una situación, debe hacer crecer un modelo. Obviamente, un sistema rígido tendrá problemas con eso.
Hay ciertos tipos de situaciones que pueden manejarse mediante un conjunto rígido de reglas fijas. Por ejemplo, una máquina que tiene una arquitectura estática puede analizarse en términos de estados, y luego puede aplicar reglas a los estados y sus transiciones. Esto es algo que un ES puede manejar.
Pero un experto más moderno necesita combinar la creación dinámica de modelos con el razonamiento sobre el modelo.

El sistema experto generalmente necesita que las personas tengan un conocimiento profundo de la solución de un problema. Sin embargo, muchos problemas no tenemos tal conocimiento. ¿Sabes cómo un humano reconoce un automóvil a partir de una imagen?

¿Excepto IBM Watson?