¿Cuál es el mejor ejemplo de big data?

Esta es una pregunta muy interesante que surge con mucha frecuencia. Honestamente, la respuesta varía drásticamente. Por un lado, hay personas que consideran que todo lo que no cabe en una hoja de cálculo de Excel es Big Data. Por otro lado, hay personas que consideran que millones de puntos de datos estáticos no son Big Data.

Un buen ejemplo de Big Data que he encontrado son los datos en el campo médico. El alcance de los datos médicos puede variar desde pequeños dominios clínicos hasta conjuntos de datos multidimensionales masivos que se extraen de una variedad de modalidades. Cuando se trata de técnicas de Big Data, cuanto más pueda aplicar de manera efectiva, más datos médicos podrá consumir. Desde la extracción de características en imágenes de Radiología y Patología, hasta la secuenciación del genoma humano, hasta el reconocimiento de patrones y la selección de subconjuntos en Registros Médicos Electrónicos, los datos médicos tienen información a la espera de ser extraída. Una vez que finalmente se sienta cómodo lidiando con la gran cantidad de modalidades presentes en los datos médicos, entonces se enfrenta a la pregunta real. ¿Cómo se combinan estos datos juntos? Una cosa es identificar patrones dentro de cada conjunto de datos, pero un juego de pelota completamente diferente cuando se trata de combinar datos en diferentes dominios, con datos que se almacenan en una gran cantidad de formatos diferentes.

Entonces ahí lo tienes. En mi opinión, el espectro de todos los datos médicos disponibles es el santo grial de los grandes datos.

Como observación, falta un componente en la definición que está citando en su párrafo inicial, y se refiere al hecho de que los datos son tan complejos en los 3V, que puede necesitar tecnología más avanzada que la que tiene actualmente una organización su disposición para poder almacenarlo y procesarlo todo.

Es muy conmovedor ver su interés en lo que los grandes datos pueden hacer en lugar de solo lo que son. De hecho, puede ser desafortunado que los grandes datos se vean más a menudo como una tecnología (una entrada) que como lo que pueden hacer (salidas). Desde la perspectiva de la junta y el buen gobierno de TI, lo que la gran cantidad de datos pueden lograr para la organización, dado el costo potencialmente grande, el esfuerzo y la transformación comercial involucrados, es lo que la junta debe responsabilizar a la organización. Así que creo que estás en el camino correcto con tu pensamiento aquí.

Finalmente, hay muchos casos de uso en Internet en estos días, algunos en negocios (Macy’s, Walmart), algunos en salud (proyecto del genoma humano), algunos en ciencia (Gran Colisionador de Hadrones), algunos en climatología (clima), algunos en deporte (Copa América) y sin duda muchos otros.

En todo caso, una cosa es cierta; Si bien una tecnología en particular puede ir y venir a medida que la tecnología evoluciona con el tiempo, los datos están aquí para quedarse, y solo serán cada vez más grandes. Por lo tanto, tiene sentido preguntarse qué datos podrían ayudar a una organización en particular a obtener una ventaja competitiva.

La característica de recomendaciones de productos establecida por Amazon es un excelente ejemplo. Las recomendaciones de productos generan una cantidad significativa de ingresos (una cifra que he visto citada es cercana al 40%) ayudando a las personas a encontrar el artículo que realmente desean.

Las recomendaciones de productos solo son posibles a través de grandes cantidades de datos, especialmente para los llamados elementos de “cola larga”, elementos que son bastante raros.

IBM usa datos para combatir el ébola

Genoma humano.

Creo que esto podría ayudarlo a comenzar: el 12º hombre de Alemania en la Copa del Mundo: Big Data

Aquí hay algunos ejemplos excelentes de la publicación del blog. 7 formas en que el entrenamiento de Big Data puede cambiar su organización

More Interesting

Cómo gestionar el big data

¿El análisis de datos es diferente del análisis de datos?

Soy un gran desarrollador de datos con antecedentes de Java, escrito en MR, Hive, Spark, Scala, Sqoop y Tableau. ¿Qué sigue para aprender a ser analista de datos / científico de datos?

¿Cuál es el software más eficiente para el análisis de big data?

Además de Ciencias de la Computación, ¿cuál es una mejor alternativa de programa de grado para ser un buen científico de datos?

¿Cuáles son los documentos recientes de ieee sobre minería de datos?

¿Cuáles son las herramientas más útiles para aprender sobre análisis de datos e informes?

¿Cuáles son las áreas de investigación activas en Análisis de datos / Minería de datos?

¿Qué tan buena es la colocación cooperativa para el programa de Big Data en SFU? ¿Cómo son las oportunidades de trabajo para el programa de Big Data en Vancouver para graduados de SFU?

¿Cómo se utilizan los grandes datos para identificar a los mejores compradores potenciales?

¿Cuáles son los principales desafíos al implementar infraestructuras de Big Data?

¿En qué se diferencia el desarrollo de software de aprendizaje automático industrial orientado a productos de la investigación académica de aprendizaje automático o el desarrollo de prototipos de investigación industrial?

¿Cuáles son las principales revistas / conferencias sobre minería de datos y aprendizaje automático a las que debe aspirar un doctorado?

¿Cómo es el título de MS Data Science and Analytics @Worcester Polytechnic Institute en términos de conexiones industriales y empleo después de la graduación?

¿Es posible mezclar datos para la ciencia de datos predictivos de tal manera que permanezcan todos los patrones imprevistos?