Si desea detalles técnicos sobre cómo Watson funciona detrás de escena, puede consultar el conjunto de 17 artículos llamados This is Watson IBM había publicado / publicado en el IBM Journal Of Research and Development (todos se pueden encontrar en línea). Para obtener una descripción general, consulte el documento Building Watson: una descripción general del proyecto DeepQA [1].
Lo que sigue es mi opinión al respecto (con muchos hechos :)).
Como mencionan en [1], los temas principales en Watson son:
- Paralelismo masivo : explote el paralelismo masivo en la consideración de múltiples interpretaciones e hipótesis.
- Muchos expertos : facilitan la integración, la aplicación y la evaluación contextual de una amplia gama de preguntas probabilísticas sueltas y análisis de contenido.
- Estimación generalizada de confianza : ningún componente se compromete con una respuesta; Todos los componentes producen características y confidencias asociadas, obteniendo diferentes interpretaciones de preguntas y contenidos. Un sustrato subyacente de procesamiento de confianza aprende a apilar y combinar las puntuaciones.
- Integre conocimiento superficial y profundo: equilibre el uso de la semántica estricta y la semántica superficial, aprovechando muchas ontologías poco formadas.
Lo que esto realmente significa es que Watson está lejos de ser un monlith cognitivo elegante. Watson no es mínimamente bello en el sentido de que utiliza un algoritmo unificador, que comprende la pregunta y encuentra una respuesta, pero está compuesto de muchos elementos pequeños (clasificadores, anotadores, módulos de PNL, etc.), cada uno de los cuales resuelve el problema que son. dado, a su manera. Ningún módulo ve el problema completo: los módulos están diseñados para satisfacer necesidades muy específicas como el análisis de preguntas, la evaluación de hipótesis, etc., y para una necesidad específica, rara vez hay un solo módulo que lo aborde, es decir, una necesidad específica se envía a diferentes módulos para ser resueltos y los resultados calificados / clasificados / agregados.
Aquí hay un esquema que muestra (de [1]) cómo Watson divide un problema en problemas más pequeños (no muestra los módulos involucrados en la resolución de estos problemas):
Para tomar un ejemplo (de [1] nuevamente) si la pregunta es
“Fue indultado presidencialmente el 8 de septiembre de 1974”
Un módulo de análisis poco profundo recuperaría el pasaje
“Ford padonó a Nixon el 8 de septiembre de 1974.”
basado en la coincidencia de términos ponderados y otro módulo podría clasificar el mismo pasaje alto porque hay una superposición considerable en las secuencias de palabras en la pregunta y el pasaje – “8 de septiembre de 1974”. Sin embargo, otro módulo no tan superficial obtendría una forma lógica de la oración para identificar que Nixon es el objeto del perdón, por lo que de los dos nombres presentes en el pasaje, Ford y Nixon, solo Nixon es la respuesta.
Creo que la recompensa para IBM al hacer el proyecto Watson no es que haya creado un sistema que pueda responder preguntas de manera universal en diferentes circunstancias, porque, en mi humilde opinión, no puede. No sin cierta capacitación, reevaluación de los diversos módulos internos, recalibración de estrategias de agregación, etc. El valor real es que ahora tiene un marco listo para la industria, DeepQA, que tiene un montón de módulos bien definidos y bien implementados, cada uno de los cuales puede hacer una tarea realmente bien, y los módulos pueden integrarse en un todo perfecto.
El purista en mí argumentaría que este es un sistema desordenado y no refleja la verdadera IA. Y esto puede ser correcto. Pero si mide el valor del sistema por sus resultados, creo que Watson definitivamente ha superado los límites de nuestra comprensión, ¡incluso si se trata de hasta dónde pueden llegar tales sistemas desordenados!
Para convencerte más, veamos este gráfico (sí, [1]):
Los puntos muestran cómo se han desempeñado los ganadores humanos en Jeopardy: cuántas preguntas han respondido (eje x) y cuántas de las respuestas fueron correctas (eje y). ¡Los puntos negros representan a Ken Jennings que ha tenido la racha ganadora más larga en Jeopardy! . Los humanos parecen responder solo cuando están muy seguros de la respuesta (y por lo general también lo hacen bien). Las líneas representan varias versiones de Watson. Lo que me emociona de este gráfico es algo que puede parecer muy trivial: las versiones finales realmente pasan por la “nube ganadora”.
Mi consejo sería ir por ello set Pero establezca sus expectativas correctas: este es un sistema con muchas partes móviles y es un sistema (predominantemente) de PNL en ese sentido, lo que significa que puede no ser un algoritmo de ML puro que funciona todo el día, pero muchas heurísticas, muchos análisis de lenguaje natural, posiblemente mucha ingeniería de plataformas, etc.