¿Por qué los investigadores de IA no desarrollan más “sistemas expertos”?

TL; DR: una de las mayores revoluciones en inteligencia artificial en los últimos 30 años es un cambio a enfoques estadísticos y basados en datos para construir sistemas inteligentes. Los sistemas basados en datos suelen ser mucho más robustos y confiables. A medida que obtengamos más datos específicos de tareas de expertos en dominios específicos, espero que podamos construir sistemas expertos (confiables) con los que se soñó en las décadas de 1970 y 1980.

Para citar Wikipedia: “un sistema experto es un sistema informático que emula la capacidad de toma de decisiones de un experto humano”.

Bajo una interpretación amplia de esta definición, muchos sistemas actualmente están haciendo cosas que uno podría imaginar que hace un experto humano.

Por ejemplo:

– Amazon recomienda que los artículos se emparejen con las cosas que está comprando actualmente o considerando comprar.

– Traducción de idiomas de Google.

– Autos sin conductor

Todos estos ejemplos son cosas que requieren cierto nivel de habilidad o experiencia por parte de un humano para realizar. Si se compararan estos ejemplos con los ejemplos estereotipados de los años setenta y ochenta, la lista anterior de alguna manera parece menos profunda o más genérica. Una de las principales razones por las que se da el caso se debe a la disponibilidad de datos (por ejemplo, lo que otras personas compran en Amazon, los textos traducidos disponibles o el seguimiento de cómo conducen los humanos en entornos urbanos).

En la actualidad, la mayoría de los sistemas inteligentes se desarrollan de forma predominantemente basada en datos. En contraste, la mayoría de los sistemas expertos más antiguos tenían dificultades para construir una base de conocimiento adecuada para ser realmente útiles en la práctica. Como resultado, los sistemas expertos más antiguos no eran muy robustos y pueden fallar cuando se enfrentan a una situación que no estaba codificada en su base de conocimiento. Para obtener más información, consulte la sección de Wikipedia sobre las desventajas del sistema experto.

Eso no quiere decir que no hay sistemas en estos días que se esfuercen por alcanzar un nivel de “pericia” por el que se esforzaron los sistemas más antiguos. El principal ejemplo de esto es IBM Watson. Por ejemplo, vea este artículo sobre la solicitud de Watson para asistencia médica: Watson de IBM es mejor para diagnosticar el cáncer que los médicos humanos (Wired UK). Pero incluso los sistemas como Watson se desarrollan de una manera predominantemente basada en datos, y creo (corríjame si me equivoco) usan operadores lógicos poco profundos para tomar decisiones o recomendaciones, en comparación con los motores de inferencia lógica más complicados utilizados en el 1970 y 1980.

Como otro ejemplo, muchas cirugías en estos días se realizan con el sistema quirúrgico da Vinci. Realmente podemos rastrear todas las acciones que los cirujanos hacen cuando usan este sistema. Entonces, en principio, una vez que tenemos suficientes datos, podemos entrenar una versión automatizada de este sistema para realizar operaciones simples. Por ejemplo: la subvención Big NSF financia investigaciones para entrenar robots para trabajar con humanos.

Una conclusión razonable a partir de esto es que los datos son (en el primer nivel) más importantes que las inferencias lógicas complejas. Por ejemplo, la lógica proposicional es solo una forma compacta de almacenar múltiples escenarios IF-THEN-ELSE diferentes. En un caso ingenuo, si tenemos suficientes datos, podemos desplegar tales declaraciones condicionales en una gran tabla de búsqueda (y, por lo tanto, descartar todas las nociones de lógica proposicional), y examinar qué puntos de datos caen en cada celda de la tabla. Por supuesto, hacer que los dos (datos e inferencia compleja) trabajen en sinergia es aún mejor, que es lo que muchos proyectos de investigación se esfuerzan por hacer hoy en día.

¿Quora intenta convertirse en un motor de conocimiento de inteligencia artificial como la próxima evolución de un motor de búsqueda?

¿Qué productos de IA existen hoy para optimizar y agilizar los procesos comerciales?

En el futuro, ¿será posible que la inteligencia artificial lidere una empresa como la inteligencia ejecutiva detrás de la estrategia?

Si se crea una IA fuerte, ¿por qué debería servirnos?

¿Cuáles son las mejores universidades / institutos en la India para hacer doctorado en inteligencia artificial?

¿Cuál es la diferencia entre el equilibrio de carga de capa 3 y capa 4? ¿Por qué se usa layer-7 LB a pesar de sus inconvenientes de ser un cuello de botella?

En las décadas de 1980 y 1990, se desarrollaron sistemas expertos para muchas empresas y surgieron varias empresas de inteligencia artificial que arrinconaron el mercado de sistemas expertos. Hoy, los sistemas expertos son un problema resuelto con herramientas probadas. En la actualidad, los sistemas expertos son tecnología convencional y se encuentran a menudo en empresas donde las políticas deben automatizarse (procesamiento de préstamos, revisión de fraudes, gestión de inversiones, etc.). Los investigadores de IA se centran en problemas que no son estándar, de memoria o resueltos.

La otra razón por la que quizás no escuche sobre Expert Systems es que son herramientas de ventaja competitiva y las compañías no anuncian sus ventajas competitivas.

David Krueger

Lo hacen, pero aprender de los datos ha sido un enfoque más exitoso recientemente y es probable que esta tendencia continúe. Todavía hay experiencia involucrada en la aplicación de técnicas de aprendizaje automático.

David Krueger

Aquí hay un ejemplo de por qué los métodos estadísticos pueden ser superiores:

si se que es esto

entonces haz esto

¿Qué sucede cuando no sabes qué es? El sistema falla o tiene un caso predeterminado. Brindan conocimiento experto y usan soluciones codificadas en lugar de avanzar gradualmente el conocimiento y usan un enfoque más comparativo a través de estadísticas para descubrir rasgos y manejar más casos de uso.

Lo más parecido a un sistema experto sería un árbol de decisión codificado. Todavía se usan cuando la precisión es equivalente y la IA falla con demasiada frecuencia.

Andrew Scott Evans

Un problema principal con los sistemas expertos de estilo antiguo eran sus limitaciones en la construcción de modelos. Puede ver que si simplemente analiza una situación en términos de reglas rígidas y preestablecidas, esto sería muy restrictivo. Las reglas estrictas a menudo asumen un modelo muy específico. Si algo sucede fuera de ese modelo, la regla puede romperse. Incluso cuando permite que un ES tenga variables, eso todavía no es suficiente para hacer un modelado flexible. Muchas veces, para llegar a comprender una situación, debe hacer crecer un modelo. Obviamente, un sistema rígido tendrá problemas con eso.
Hay ciertos tipos de situaciones que pueden manejarse mediante un conjunto rígido de reglas fijas. Por ejemplo, una máquina que tiene una arquitectura estática puede analizarse en términos de estados, y luego puede aplicar reglas a los estados y sus transiciones. Esto es algo que un ES puede manejar.
Pero un experto más moderno necesita combinar la creación dinámica de modelos con el razonamiento sobre el modelo.

Zhiyong Wang

El sistema experto generalmente necesita que las personas tengan un conocimiento profundo de la solución de un problema. Sin embargo, muchos problemas no tenemos tal conocimiento. ¿Sabes cómo un humano reconoce un automóvil a partir de una imagen?

Zhiyong Wang

¿Excepto IBM Watson?

Andrew Scott Evans

More Interesting

¿Qué es un modelo de red neuronal?

¿Dónde puedo encontrar una comparación de las funciones de activación en redes neuronales profundas?

¿Qué es lo mejor para entrenar una red neuronal artificial, un algoritmo de retropropagación o un algoritmo genético?

¿Crees que la inteligencia artificial miente?

¿Puede un robot AI reemplazar a un abogado en la corte?

¿Qué es más realista en el futuro: una muy buena comprensión de cómo diseñar sistemáticamente redes neuronales o NN que se construyen por sí mismos?

¿Cuáles son algunos proyectos principiantes de Python y OpenCV?

¿Qué algoritmos de aprendizaje automático pueden producir una función de puntuación para medir la "similitud" entre dos objetos?