Esta es una pregunta muy interesante que surge con mucha frecuencia. Honestamente, la respuesta varía drásticamente. Por un lado, hay personas que consideran que todo lo que no cabe en una hoja de cálculo de Excel es Big Data. Por otro lado, hay personas que consideran que millones de puntos de datos estáticos no son Big Data.
Un buen ejemplo de Big Data que he encontrado son los datos en el campo médico. El alcance de los datos médicos puede variar desde pequeños dominios clínicos hasta conjuntos de datos multidimensionales masivos que se extraen de una variedad de modalidades. Cuando se trata de técnicas de Big Data, cuanto más pueda aplicar de manera efectiva, más datos médicos podrá consumir. Desde la extracción de características en imágenes de Radiología y Patología, hasta la secuenciación del genoma humano, hasta el reconocimiento de patrones y la selección de subconjuntos en Registros Médicos Electrónicos, los datos médicos tienen información a la espera de ser extraída. Una vez que finalmente se sienta cómodo lidiando con la gran cantidad de modalidades presentes en los datos médicos, entonces se enfrenta a la pregunta real. ¿Cómo se combinan estos datos juntos? Una cosa es identificar patrones dentro de cada conjunto de datos, pero un juego de pelota completamente diferente cuando se trata de combinar datos en diferentes dominios, con datos que se almacenan en una gran cantidad de formatos diferentes.
Entonces ahí lo tienes. En mi opinión, el espectro de todos los datos médicos disponibles es el santo grial de los grandes datos.
- Si pudiera contratar a 4/5 científicos / ingenieros para un equipo de análisis de big data centrado en elegir y responder preguntas comerciales concretas (por ejemplo, predecir una solicitud de producto), ¿cómo lo construiría?
- ¿Cuáles son algunas buenas academias en línea como Jigsaw que proporcionan certificación para Big Data Analytics?
- ¿Qué es la clasificación bayesiana en la minería de datos?
- ¿Una certificación de ciencia de datos es buena para una carrera?
- Tengo 24 años y tengo habilidades básicas de análisis de datos (R, Python, SQL, estadísticas, cálculo, etc.). Actualmente trabajo para una empresa de comercio de bonos, pero no soy lo suficientemente bueno (ni quiero) ser analista o ingeniero de datos profesionales. ¿Qué trabajos involucran estas habilidades en menor grado / qué otras habilidades los complementarían?