Google actualmente está indexando datos RDFa que están incrustados en páginas web. Aunque RDFa en sí es bastante expresivo y puede representar estructuras de datos arbitrarias, parece que Google solo está indexando RDFa que se ajusta a su ontología limitada que puede usarse para describir las siguientes entidades:
Comentarios: (artículo, calificación, descripción, …)
Personas: (nombre, foto, amigos, …)
Negocio: (nombre, uri, teléfono, ubicación geográfica, …)
Eventos: (resumen, ubicación geográfica, fecha, …)
Video: (título, descripción, fuente, …)
ver: http://www.google.com/support/we…
- ¿Cuál es el mejor navegador de Internet? ¿Por qué?
- ¿Qué pasa si Internet se cerró para siempre?
- Cómo cambiar la página de inicio de Internet Explorer en Windows 10
- ¿Cómo podemos encontrar la fuente de cualquier imagen en Internet?
- ¿Cómo perdió Internet Explorer el mercado ante otros navegadores como Chrome y Firefox?
Estos datos se utilizan para proporcionar una búsqueda semántica, ya que las entidades se escriben y tienen propiedades formales que se pueden utilizar para proporcionar significado al texto (por ejemplo, “título de video”). También permite que Google muestre resultados de búsqueda más completos en lugar de solo el título, el enlace y la descripción, por lo que es más fácil para un usuario extraer la información que busca de los resultados.
Aunque este es un comienzo en la dirección correcta de indexación de datos web. También es algo que podría haberse diseñado hace más de 10 años en función de la tecnología existente de relación y almacenamiento de datos.
Todavía me gustaría ver evidencia de un diseño que se pueda escalar para manejar estructuras de datos que no están dictadas por Google. Esto nuevamente me recuerda a los centros de datos centralizados de los últimos 30 años, donde los usuarios deben luchar para que se agregue una columna a una base de datos. Si quisiera describir “cocina” en mi restaurante, necesitaría el DBA maestro para bendecir este cambio. Este enfoque no funcionará en la web donde hay tantas necesidades diversas, por lo que todavía tienen algo de trabajo por hacer.