¿IBM Watson aprende las reglas de los datos?

En esencia, Watson es un complejo sistema de procesamiento de lenguaje natural (NLP). Hay numerosos procesos involucrados que se basan en reglas, como que Lucene crea una variedad de índices, basados ​​en reglas, como uno de los más de 20 pasos de preprocesamiento para el contenido del corpus (documentos que contienen el conocimiento del dominio).

Hay una segunda fase en la que los humanos proporcionan ejemplos de reglas implícitas. Una consulta textual está relacionada con una parte del corpus, preguntas y respuestas, esencialmente diciéndole a Watson que cuando ve la misma consulta después del entrenamiento, debe responder con el área del corpus indicada.

El desafío es que Watson, y PNL en general, es un sistema no determinista basado en probabilidades. El proceso de capacitación anterior se repite miles de veces y los algoritmos (hay cientos) acumulan probabilidades de la relación de una consulta de texto con un área del corpus.

Cuando el sistema capacitado recibe una consulta textual, encuentra muchas respuestas potenciales a las que asigna probabilidades, en base a los cientos de modelos capacitados, y responde con los candidatos de respuesta desde la probabilidad más alta hacia abajo. Los sistemas de PNL, y el aprendizaje automático en general, siempre son probablemente aproximadamente correctos.

Watson no aprende dinámicamente. Los seres humanos deben evaluar el flujo de consultas para identificar la nueva capacitación de preguntas y respuestas y el contenido del corpus necesarios para mejorar la comprensión de Watson. Luego pasan por el proceso de agregar contenido y realizar capacitación adicional para que Watson pueda responder a un mayor porcentaje de las consultas que la población de usuarios está proporcionando.

Sí, si considera que está cambiando su comportamiento en función de los patrones de datos que encuentra.

Realmente tendrá que pensar en cómo se define una regla. En resumen, es solo una reacción reflexiva a un estímulo. Encontrará esto implícitamente o explícitamente en cualquier programa de computadora.