¿Cómo son exactamente estos ‘X mil millones de hechos’ en la red semántica de Google Knowledge Graph / Vault?

Freebase, la base de Google Knowledge Graph, almacenó hechos como triples, junto con su procedencia (quién los creó, cuándo, etc.) y un bit válido. La marca de tiempo y el bit válido permitieron consultar el estado de la base de datos en cualquier momento y recuperar datos “eliminados”.

La Bóveda del conocimiento y el proceso para construirla y mantenerla se describe mejor en https://www.cs.ubc.ca/~murphyk/P… Básicamente, introduce la probabilidad en la ecuación para que cada hecho haya asociado con ella la probabilidad que es cierto, que es una probabilidad fusionada derivada de un conjunto de probabilidades de entrada asociadas con las fuentes de información.

Si sigue el gráfico de citas para ese artículo principal, puede encontrar trabajos relacionados de los mismos autores y de otros. Por supuesto, la estructura física detallada, los mecanismos de acceso y los usos de la Bóveda de conocimiento no se han revelado (¿todavía?).

DESCARGO DE RESPONSABILIDAD: no trabajo en Google, estas son solo especulaciones

Mi mejor conjetura sería que almacena la mayoría de sus entidades y relaciones en formato RDF, como es común en los estándares web semánticos. Freebase, una de las bases de datos semánticas líderes, almacenó sus datos en RDF y Google los adquirió en 2010. En realidad, puede acceder públicamente a todo el volcado de datos Freebase / Google RDF aquí: Volcados de datos – API de Freebase – Desarrolladores de Google.

More Interesting

Cómo restringir datos de fondo en mi redimi note3

¿Cómo funciona la tecnología detrás de las tarjetas magnéticas en términos de datos? ¿Cómo se manejan los datos del usuario y los datos de RFID / Bar de la compra desde el deslizamiento del terminal a los sistemas de back-end?

Para la validación cruzada K-fold, ¿qué k se debe seleccionar?

¿Cómo es útil aprender Big Data a Hadoop?

¿Qué será mejor para un empleado de TI con experiencia de 3 años, para seguir un curso a tiempo completo o un curso a tiempo parcial en Data Science?

¿Cuáles son algunos proyectos de ciencia de datos de código abierto en Python?

¿Cuál es el mejor instituto para aprender el programa del aula del curso de análisis de big data en Bangalore?

¿Cómo resuelven los problemas los científicos de datos? ¿Cuál es el marco del proceso de pensamiento para enmarcar un problema y trabajar en la solución?

¿Cuál es una tarifa razonable para cobrar por la consultoría de ciencia de datos?

¿Hay algún beneficio al agregar las características originales junto con las reducidas por PCA?

¿Qué lenguaje de script puede funcionar con Big Data?

¿Cuáles son los preparativos iniciales para unirse a un programa de ciencia de datos para una nueva?

¿En qué trabaja la oficina de Palantir en París? ¿Trabajan en el aprendizaje automático o en la minería de datos?

Cómo usar datos de MongoDB para el análisis de datos

¿Por qué Two Sigma diseñó su concurso de Kaggle para eliminar cualquier beneficio del conocimiento del dominio?