¿Cuán relevantes son los temas de la web semántica y la recuperación de información para el aprendizaje automático? La tecnología cambia la vida futura

La teoría de la web semántica es importante porque se centra en el significado compartido, contextualizado, legible por máquina y cómo los humanos junto con las máquinas crean ese tipo de significado a través de la pila RDF / OWL, un enfoque estandarizado del W3C. Si desea aprovechar el significado legible por máquina a escala, deberá comprender este método estándar.

En estos días, ese tipo de significado a menudo es de crowdsourcing, mantenido, expandido, compartido y escalado como parte de la nube Linked Open Data. La nube LOD está zumbando con actividad humana todos los días. Grandes bases de conocimiento como Wikipedia, Wikidata, Geonames, etc. se actualizan continuamente, se convierten en RDF / OWL y se comparten a través de la nube pública.

Pero ese significado debe hacerse lógicamente coherente para que podamos aprovecharlo en el aprendizaje automático. Ese tipo de coherencia lógica se presenta en forma de gráficos de conocimiento, tanto gráficos generales como gráficos específicos de dominio (como para servicios financieros, compañías farmacéuticas o de energía) que se asignan al general utilizando RDF / OWL estándar.

Ahora piense en los tipos de inferencia que la inteligencia artificial debe abordar. No todo se puede abordar utilizando métodos como las redes neuronales por sí mismos. Los pioneros del aprendizaje profundo como Geoff Hinton y Yoshua Bengio reconocen que los enfoques de redes neuronales no son buenos para razonar. Es por eso que Bengio y su equipo, por ejemplo, están recurriendo a formas de representación del conocimiento para complementar los enfoques de redes neuronales de manera híbrida.

Si realmente desea saber hacia dónde se dirige el aprendizaje automático y aprovecharlo al máximo, deberá comprender cómo se pueden usar los gráficos de conocimiento en combinación con métodos como redes neuronales o métodos de aprendizaje automático más simples como árboles de decisión, bosque aleatorio , SVM, regresión, etc.

De la respuesta de Alan Morrison a ¿Cuán innovadora es la red neuronal diferenciable de DeepMind? Por ejemplo, ¿el modelo resolvió todo eso solo del lenguaje natural? Si es así, ¿cómo sabe el significado de “abuela”?

Ese tipo de inferencias es posible debido a los gráficos de conocimiento grandes, cuidadosamente configurados y mantenidos, gráficos estructurados y mantenidos por humanos para ser lógicamente consistentes, completamente desambigados y actualizados, presumiblemente todos con asistencia de máquina.

En esencia, este es un enfoque híbrido conexionista + simbolista de la IA (en términos de Pedro Domingos de The Master Algorithm ), una IA basada en el conocimiento (en la terminología tradicional de IA) que también utiliza redes neuronales y presumiblemente también otras técnicas de aprendizaje automático. Consulte Inicio desata su clon del ‘Gráfico de conocimiento’ de Google.

A partir de septiembre de 2016, otros fuera de Google pueden tener acceso a un gráfico de conocimiento igualmente poderoso, uno que ha estado en proceso durante más de una década: Cognonto está en la búsqueda del juego Big AI. Fred Giasson describe cómo funciona en su blog:

Mapeo de conjuntos de datos, esquemas y ontologías utilizando Cognonto Mapper

Entonces, no es la red neuronal en sí misma la que permite la desambiguación y la inferencia del lenguaje humano, sino la base del gráfico de conocimiento. Hasta donde yo sé, los gráficos de conocimiento más lógicamente consistentes y limpios en este momento son propietarios, por lo que necesitaría obtener acceso privado. Este se llama KBpedia. DBpedia es un precursor de código abierto, un punto de partida para algo como esto. KBpedia se basa en Wikipedia, Wikidata, DBpedia, Cyc, Geonames y otras bases de conocimiento. Es una especie de metaconocimiento base.

Así es como se puede utilizar KBpedia de Cognonto junto con Word2Vec en un contexto específico de dominio: Uso de Cognonto para generar modelos de word2vec específicos de dominio

En abril de 2017, Ontotext lanzó Fact Forge, que es un gráfico de conocimiento comparable de alguna manera a Cognonto que los desarrolladores pueden aprovechar a través de API. HechoForge

A continuación se muestra una descripción y pronóstico de la evolución del aprendizaje automático que articula cómo han evolucionado los diferentes tipos de aprendizaje automático. Los enfoques híbridos que aprovechan la representación del conocimiento a través de gráficos de conocimiento son los más avanzados que se están utilizando en algunas de las corporaciones más grandes ahora, incluidas Apple, GE, Google, IBM y Microsoft. Las plataformas informáticas cognitivas como IBM Watson y Digital Reasoning se basan en enfoques híbridos.

Del aprendizaje automático 101 (infografía)

Sé que esto es mucho para digerir, pero hay muchos aspectos del aprendizaje automático que las personas tienden a ignorar simplemente porque no entienden por qué son relevantes. Esas personas siempre estarán atrás.

Otros que tienen una comprensión general de alto nivel de cómo las máquinas y los humanos juntos crean comprensión y pueden usar una combinación de métodos complementarios y sinérgicos tendrán una ventaja incorporada.

Como comentario aparte, considere por qué Elon Musk está tan por delante del resto de nosotros en su pensamiento e ingeniería. Porque tiene el amplio conocimiento necesario para pensar en muchas, muchas disciplinas diferentes a la vez. Cómo Elon Musk aprende más rápido y mejor que los demás. Mejor no ser un Johnny One Note en esta Era del Conocimiento.

Aprendizaje automáticoInteligencia ArtificialRecuperación de informaciónWeb semántica