Después de Big Data, Smart Data es una tendencia en 2013. Entonces, ¿qué es Smart Data? ¿Tienes alguna definición clara?

Este es uno de esos acuerdos donde el término es lo suficientemente nuevo como para que todos tengan una opinión diferente sobre lo que significa. Pero puedo decirte cuál es nuestra definición (que es correcta, por cierto):

Los datos inteligentes son datos que tienen una semántica útil asociada a ellos.

Esa es la esencia de esto. Puede discutir si eso implica o no usar RDF o alguna otra tecnología de Web Semántica, o formatos específicos o vocabularios, y si tiene que estar hablando o no de datos que podrían convertirse significativamente en parte de Linked Data Cloud, pero la esencia cruda del término es que la semántica válida, bien definida y significativa está asociada con (podría decirse “llevada con”) los datos en sí.

Profundizando un poco más, diría que si desea tener una discusión seria sobre el uso de Smart Data, el punto de partida en realidad es la pila de Web Semántica: RDF, RDF / S, OWL, SKOS, Dublin Core, etc., y datos que podrían integrarse en la nube de datos vinculados.

Para uso puramente interno, podría aflojarlo un poco, pero si desea tomar datos de, por ejemplo, una aplicación CRM, y combinarlos con datos de, por ejemplo, un sistema MRP o SFA, la semántica es el meollo del problema. . Sin embargo, recuerde que tan pronto como quiera hacer cosas significativas en términos de combinar esos datos con cosas de “fuera del firewall”, es casi seguro que volverá a hablar sobre la pila de la Web Semántica, el RDF y sus amigos mencionados anteriormente. . Sería más fácil comenzar allí en primer lugar.

Big data es tan bueno como los datos que se están ingresando. Basura adentro, basura afuera.
Además, los datos son tan buenos (err … tan malos como) el eslabón más débil. Y cada organización tiene ESE UNO INDIVIDUO …

Big data tiende a volverse más inútil a medida que crece (¿contradictorio?), Y más difícil de analizar y verificar errores, y … y …
En mi universidad, un profesor tiene una beca de 2 años para escribir el módulo de verificación de datos para procesar la transcripción del papel a la computadora para reclamos de Workman’s Comp. Suena agotador y misteriosamente innecesariamente engorroso. Aparentemente hay 100 deletreos de restaurantes de uso común … lo escucharon aquí amigos. Más extraño que la ficción.

Creo que cada programador de bases de datos (big data o de otro tipo) desde aquí hasta el fin del mundo está ENFERMO Y CANSADO de pasar la mitad de su error de tiempo revisando humanos.

Las personas que no pertenecen a la base de datos piensan en la computadora como una caja mágica: deberían poder verter los datos de comercialización de China y los datos de comercialización estadounidenses y comparar y obtener un gráfico circular ordenado. En la mejor de las circunstancias, estaría traduciendo hasta que sus ojos sangren (las computadoras realmente no pueden hacer eso) solo para que coincidan con campos idénticos. Pero no son campos idénticos …

Por lo tanto, creo que lo que Smart Data es, como un movimiento, son los programadores de bases de datos que dicen: “No lo vamos a tomar más, lo vamos a arreglar”. Están motivados para reinventar la rueda desde el principio, por así decirlo.

Creo que Philips está en una excelente vía de solución con información semántica. Por ejemplo, si la base de datos china supiera cómo calcular un mapa de densidad de ventas y utilizara el mismo conocimiento conceptual que un sistema en inglés, de hecho podrían comparar manzanas con manzanas con bastante facilidad.

Quién sabe cómo evolucionarán estas cosas. Apuesto a que habrá muchas más soluciones por venir. Y luego esperamos integrar múltiples sistemas de bases de datos inteligentes. ¿Qué? ¿Estamos de vuelta donde empezamos? Ojalá no.

More Interesting

Elijo entre maestros en ciencias de datos en King's College London o maestros en línea de Berkeley. ¿Cuál recomendarías?

¿Qué tecnologías tienen buen futuro en el departamento de ciencia de datos?

¿Qué es el munging de datos? ¿Cómo se puede usar en una oración? ¿Hay algunos sinónimos? ¿De dónde viene la frase?

¿Qué proyectos combinan ciencia de datos y aerodinámica?

Tengo 7 años de experiencia en análisis y ciencia de datos. ¿Vale la pena hacer PGPBA de Greatlakes o IIMB o CBA de ISB?

Cómo identificar problemas en un producto mediante el análisis de los datos de la comunidad de usuarios donde el usuario hace preguntas y discute problemas relacionados con el producto

¿Cuáles son los casos de uso típicos para diferentes algoritmos de aprendizaje automático? Por ejemplo, ¿en qué condiciones típicas uno preferiría usar uno sobre el otro sin haber probado la precisión del aprendizaje?

¿Qué haces cuando tu modelo falla la validación cruzada?

¿Cuál es su viaje completo de aprendizaje / aplicación en Machine Learning / Data Science / NLP?

Con respecto a la infraestructura de big data, ¿cuáles son las soluciones más comunes?

¿Cuánta programación debe saber alguien antes de entrar en Machine Learning y Data Science?

¿Qué libro o curso en línea sería el mejor para aprender estadísticas para la ciencia de datos?

¿Cuál es el mejor programa de ciencia de datos?

¿Cuáles son las mejores universidades de minería en Estados Unidos?

¿Cuáles son los beneficios de una buena gestión de datos?