¿Qué está haciendo Google para avanzar / ser relevante en la web semántica?

Google actualmente está indexando datos RDFa que están incrustados en páginas web. Aunque RDFa en sí es bastante expresivo y puede representar estructuras de datos arbitrarias, parece que Google solo está indexando RDFa que se ajusta a su ontología limitada que puede usarse para describir las siguientes entidades:

Comentarios: (artículo, calificación, descripción, …)
Personas: (nombre, foto, amigos, …)
Negocio: (nombre, uri, teléfono, ubicación geográfica, …)
Eventos: (resumen, ubicación geográfica, fecha, …)
Video: (título, descripción, fuente, …)

ver: http://www.google.com/support/we…

Estos datos se utilizan para proporcionar una búsqueda semántica, ya que las entidades se escriben y tienen propiedades formales que se pueden utilizar para proporcionar significado al texto (por ejemplo, “título de video”). También permite que Google muestre resultados de búsqueda más completos en lugar de solo el título, el enlace y la descripción, por lo que es más fácil para un usuario extraer la información que busca de los resultados.

Aunque este es un comienzo en la dirección correcta de indexación de datos web. También es algo que podría haberse diseñado hace más de 10 años en función de la tecnología existente de relación y almacenamiento de datos.

Todavía me gustaría ver evidencia de un diseño que se pueda escalar para manejar estructuras de datos que no están dictadas por Google. Esto nuevamente me recuerda a los centros de datos centralizados de los últimos 30 años, donde los usuarios deben luchar para que se agregue una columna a una base de datos. Si quisiera describir “cocina” en mi restaurante, necesitaría el DBA maestro para bendecir este cambio. Este enfoque no funcionará en la web donde hay tantas necesidades diversas, por lo que todavía tienen algo de trabajo por hacer.