¿Cuál es la diferencia entre web ordinaria y web semántica?

Una web semántica es una web completa que funciona como un gráfico de conocimiento RDF (sujeto-verbo-objeto).

Para saber qué es un gráfico de conocimiento, consulte Conocimiento – Búsqueda interna – Google. Google, Facebook, LinkedIn, etc. tienen sus versiones de un gráfico de conocimiento internamente, y la mayoría de las Fortune 500 han intentado al menos a lo largo de los años desarrollar sus propios gráficos de conocimiento, aunque en pequeños bolsillos de cada organización.

Para obtener un informe completo sobre las tecnologías web semánticas y sus implicaciones para la empresa, consulte el Pronóstico tecnológico de primavera de 2009 de PwC sobre el tema.

RDF toma los elementos de datos identificados por los URI (identificadores uniformes de recursos, es decir, direcciones web semánticamente consistentes) y hace declaraciones sobre la relación de un elemento con otro. En esta visión de la Web, los datos no están en cubos o tablas. Están en gráficos que consisten en triples: combinaciones sujeto-predicado-objeto. En este universo de sustantivos y verbos, los verbos articulan las conexiones o relaciones entre sustantivos. Cada sustantivo luego se conecta como un nodo en una estructura en red, una que se escala fácilmente debido a la simplicidad y uniformidad de sus conexiones tipo web. [De la p. 7.]

Todas las bases de datos contienen entidades y relaciones. Las entidades son sustantivos (sujetos y objetos que describen personas, lugares y cosas) y las relaciones son verbos, cómo las personas, los lugares y las cosas están conectados entre sí.

Estás leyendo esta respuesta de Quora, y yo la estoy escribiendo, así que en una web semántica, una máquina podría leer ambas declaraciones e inferir que tú y yo tenemos al menos una conexión, es decir, ambos tenemos un papel en esta respuesta de Quora. En una red semántica perfectamente articulada donde toda la información disponible posible es recopilada, abierta, descrita ontológicamente y accesible, todas esas conexiones serían descritas y rastreables a través del gráfico. Por lo tanto, una tercera persona podría comenzar con datos sobre mí y seguir su nariz hasta datos sobre usted, y luego cada miembro de su familia, hasta el infinito.

Las bases de datos relacionales convencionales son en realidad deficientes en las relaciones. Las bases de datos de gráficos RDF abordan este déficit al especializarse en tres cosas: 1) desambiguación de las entidades, 2) articulación de las relaciones entre entidades (lo que ayuda en el proceso de desambiguación) y 3) que permite la integración a gran escala.

El objetivo de la web semántica es eliminar los silos, hacer que la web sea más precisa y más un conjunto bien integrado que permita el descubrimiento a escala web. Una vez que está integrado, puede dejar de buscar sus llaves debajo de la farola solo porque allí es donde ha estado la luz. Te has alejado de los silos de datos y del pensamiento silo.

Un elemento central de la noción de web semántica son las ontologías, modelos de datos de gráficos RDF extensibles y flexibles que sirven como una lógica de descripción rica para vivir con los datos y describir cada contexto individual de forma legible por máquina. La mayoría de las empresas usan taxonomías como mínimo en sus esfuerzos de gestión de datos, pero algunas sí usan ontologías. Las taxonomías son jerárquicas, pero las ontologías van más allá y permiten relaciones de cualquier persona, no solo de padres e hijos. Así, las ontologías son más precisas y reflejan más el mundo natural.

Las ontologías también permiten la inferencia, en la cual las máquinas identifican relaciones tácitas entre entidades que no se detallan en el modelo de datos inicial, pero que dependen de relaciones que antes eran explícitas. De esta manera, todo el gráfico puede desarrollarse y crecer a escala de máquina.

Una web semántica puede funcionar como una web legible por máquina de datos contextualizados. En teoría, esto permite el descubrimiento y la interoperación ideal en toda la web. Tenga en cuenta que el concepto ha evolucionado durante casi dos décadas y que la mayoría de los gráficos de conocimiento son internos. Mientras que algunos usan el método estándar W3C, otros usan ramificaciones de ese método. Un resultado imperfecto y no ideal para estar seguro, pero los conceptos básicos son críticos para comprender cómo resolver los problemas de gestión de datos. Y los métodos desarrollados hace una década o más siguen siendo útiles y valiosos.

En pocas palabras: la web semántica es la web para máquinas.

La web tal como está depende en gran medida del texto (prosa) e imágenes. Ambos son bastante difíciles de comprender para los programas de computadora. Representar el significado (semántica) del contenido en un lenguaje más simple (RDF) permite a nuestros amigos de silicio hacer un mejor uso del contenido.

Pero la idea de la web semántica no es solo hacer que el contenido que los humanos consumen también sea útil para las máquinas. Como resultado, RDF también proporciona una manera de hacer que diferentes bases de datos (“silos” de datos) sean compatibles entre sí, permitiendo que su contenido se combine y se reutilice. Entonces obtenemos una red de bases de datos utilizables por todos.

Genial, ¿no es así? Puedes tener una idea del poder de esto jugando con Wikidata Query Service. Haga clic en “Ejemplos”.

La web ordinaria tiene enlaces entre documentos.

La web semántica ha escrito enlaces entre entidades, donde todo puede ser una entidad (también documentos). En resumen, la semántica viene dada por el significado de los enlaces.

La web semántica es como la web ordinaria. En realidad es la misma web. La diferencia es que la “web semántica” está usando algunas etiquetas contextuales para marcar el contenido de una manera semántica.

Lo que esto significa es que, por ejemplo, un artículo se verá así

headline

Contenido

El punto es que ahora decimos cuál es el contenido. Lo marcamos, para que Google sea más fácil descubrir qué es qué. Es una gran victoria para la optimización de motores de búsqueda.