Freebase, la base de Google Knowledge Graph, almacenó hechos como triples, junto con su procedencia (quién los creó, cuándo, etc.) y un bit válido. La marca de tiempo y el bit válido permitieron consultar el estado de la base de datos en cualquier momento y recuperar datos “eliminados”.
La Bóveda del conocimiento y el proceso para construirla y mantenerla se describe mejor en https://www.cs.ubc.ca/~murphyk/P… Básicamente, introduce la probabilidad en la ecuación para que cada hecho haya asociado con ella la probabilidad que es cierto, que es una probabilidad fusionada derivada de un conjunto de probabilidades de entrada asociadas con las fuentes de información.
Si sigue el gráfico de citas para ese artículo principal, puede encontrar trabajos relacionados de los mismos autores y de otros. Por supuesto, la estructura física detallada, los mecanismos de acceso y los usos de la Bóveda de conocimiento no se han revelado (¿todavía?).
- ¿Cuáles son los errores más comunes que cometen los nuevos científicos de datos?
- ¿Cuál es la mejor arquitectura de chispa (big data) crees que para este caso de uso?
- ¿Está bien incluir una variable no significativa en un modelo lineal generalizado (GLM)?
- Si está aprendiendo Data Science, ¿qué tan importante es saber cómo implementar modelos de Machine Learning en lenguajes de nivel inferior (por ejemplo, C ++ o Java)?
- Entre Data Analytics y JavaScript, ¿qué habilidad es más valiosa y por qué? Si tuvieras que estudiar uno de ellos, ¿cuál elegirías?