En términos muy simples, Big Data es un gran volumen de conjuntos de datos con alta velocidad y una variedad diferente de activos de información. Para ser exactos, los datos en el rango de cientos de TB entran en la categoría Big Data.
Este Big Data se genera a partir de cada una de sus interacciones con internet directa o indirectamente. Se genera a partir de sus actividades de redes sociales, transacciones, correos electrónicos, sensores, compras de comercio electrónico, desde diferentes lugares que visita, como hospitales, restaurantes, centros comerciales, etc.
Big Data también se genera a partir de actividades no humanas como aviones, automóviles automáticos, automóviles, postes de electricidad, etc.
- AI aprende de los datos del pasado para predecir, entonces, ¿debería haber preocupaciones en torno al pensamiento grupal? ¿La creatividad tendrá éxito en un mundo más autónomo?
- ¿Es mejor utilizar algoritmos basados en reglas o de aprendizaje automático para la clasificación en un dominio de respuesta a preguntas cerrado?
- ¿Cómo puede ayudar una formación en procesamiento de señales en una carrera en ciencia de datos?
- ¿Cuál es la diferencia entre Hidden Markov Chain y Markov Chain?
- ¿Se siguen evaluando empíricamente las arquitecturas de redes neuronales profundas?
Varios casos de uso de Big Data
- Netflix utiliza Big Data para mejorar la experiencia del cliente
- Promoción y análisis de campaña por Sears Holding
- Análisis de los sentimientos
- Análisis de rotación de clientes
- Análisis predictivo
- Anuncios y publicación de anuncios en tiempo real
Comprendamos esto con el ejemplo del análisis de sentimientos
Una gran compañía aérea comenzó a monitorear tweets sobre sus vuelos para ver cómo se sienten los clientes sobre las actualizaciones, los nuevos aviones, el entretenimiento, etc. Nada especial allí, excepto cuando comenzaron a enviar esta información a su plataforma de atención al cliente y a resolverlos en tiempo real.
Una instancia memorable ocurrió cuando un cliente tuiteó negativamente sobre el equipaje perdido antes de abordar su vuelo de conexión. Recogen los tweets (que tienen problemas) y le ofrecen una actualización gratuita de primera clase en el camino de regreso. También rastrearon el equipaje y dieron información sobre dónde estaba y dónde lo entregarían.
No hace falta decir que estaba bastante sorprendido al respecto y tuiteó como un campista feliz durante el resto de su viaje.
El análisis de sentimientos es el análisis detrás de la sustancia de datos. Una tarea básica en el análisis de sentimientos es clasificar la polaridad de un texto dado a nivel de documento, oración o característica / aspecto, ya sea que la opinión expresada en un documento, una oración o una característica / aspecto de entidad sea positiva, negativa o neutral. La clasificación avanzada de sentimientos “más allá de la polaridad” se refiere, por ejemplo, a estados emocionales como “enojado”, “triste” y “feliz”.
Lea sobre los casos de uso de Big Data en detalle
¿Cómo llegó Big Data a la imagen?
Esta información o Big Data necesita una plataforma innovadora para una mejor comprensión, comprensión y toma de decisiones.
Pero,
El 90% de los datos que se generan hoy en día no están estructurados y nuestras tecnologías tradicionales no pueden manejarlos.
La velocidad y las formas en que se genera Big Data dificulta la administración y el procesamiento a través de las tecnologías tradicionales de administración de DataBase. Aquí viene el papel de varias herramientas y tecnologías de big data como Hadoop.
Apache Hadoop es la herramienta de Big Data más popular y poderosa. Proporciona la capa de almacenamiento más confiable del mundo: HDFS, motor de procesamiento: MapReduce y capa de administración de recursos: Yarn que resuelve todos los problemas de big data.
La imagen muestra algunas de las características de Hadoop que han ayudado a administrar Big DataVer para carreras y roles laborales en Big Data
Ver carreras y roles laborales en Big Data
SI te gusta la respuesta, por favor, UPVOTE y sigue mi cuenta Shailna Patidar para mis respuestas regulares en Big DAta nad Hadoop.