Recuerde que Big Data no es una materia académica, sino, en algunos términos, una exageración creada por la industria. Hemos estado lidiando con conjuntos de datos masivos desde hace mucho tiempo: Wikipedia ha existido, Google ha estado ocupando el rango de páginas desde hace décadas, el Proyecto Genoma Humano ha existido desde los años 90.
¿Cómo explica la industria los grandes datos? Se trata de las tres V ( aunque algunos expertos han agregado nuevas V ): volumen, velocidad, variedad. Cada vez que ves a alguien trabajando con datos que satisfacen estos tres, están trabajando con big data.
No investigas en big data. Trabajas en un aspecto de esto. Tengo amigos que trabajan en algoritmos de programación de trabajos para sistemas Hadoop. Algunas personas están trabajando en la construcción de algoritmos distribuidos para tareas de aprendizaje automático. Hay algunos que analizan aspectos de seguridad en la nube. Donde quiera que vaya, los datos reales de hoy son Big Data. Está en todas partes.
- ¿Los algoritmos tienen aplicaciones fuera de la informática?
- ¿Qué startups de aprendizaje automático tienen más probabilidades de convertirse en empresas multimillonarias?
- ¿Cuáles son las buenas nuevas empresas en Chandigarh en el campo de la informática y la informática?
- ¿Qué área de investigación debo elegir? Tengo opciones entre "Semántica de lenguajes de programación" y "Algoritmos y criptografía" de investigación para mi tesis de maestría, y estoy extremadamente confundido en las circunstancias.
- ¿Cuál es el 'borde' en la computación de borde?
Antes de elegir una universidad o un profesor, busque el trabajo que han estado haciendo y cuál fue su impacto en la sociedad: Stanford está profundizando en el aprendizaje profundo y utilizando el poder de los grupos masivos para resolver problemas de aprendizaje automático. Los profesores que trabajaban en bases de datos hace diez años ahora están trabajando con Big Data. Aquellos que habían estado trabajando con Machine Learning están interesados en el análisis de big data. Aquellos con campos relacionados con la infraestructura están en Cloud Computing.
Aquí hay un grupo de campos que puede contar como big data (sin ningún orden en particular):
> Sistemas distribuidos ( bases de datos de almacenamiento distribuido / computación distribuida)
> Aprendizaje automático en un entorno distribuido
> Compresión y almacenamiento de datos (y recuperación)
> Visualización de datos
> Extracción de información abierta
> Cloud Computing (otra palabra de moda)