¿Qué opinas sobre Big Data? ¿Es bueno o malo?

IBM permite a las empresas capturar, administrar y analizar datos estructurados y no estructurados utilizando su producto Big Insights. IBM tiene sus procesos basados ​​en Hadoop, que tiene una plataforma tecnológica rápida y de código abierto para hacer frente a la gran cantidad de datos. Hadoop-as-a-service le permite a IBM aplicar una poderosa recopilación y visualización de flujos de datos que implican la mejor flexibilidad en su clase para el almacenamiento y la gestión de datos. IBM actualmente ofrece soluciones para análisis avanzados, integración y gobierno, gestión de datos y contenido, código abierto, gestión de contenido empresarial, servicios de datos en la nube.

Microsoft, con sede en Washington, Estados Unidos

Una vez más, es la plataforma Hadoop donde Microsoft ejecuta sus soluciones de big data. Se usan en la nube o en Windows. Los grupos empresariales pueden hacer el mejor uso de Hadoop para obtener datos significativos sobre las herramientas estándar de Microsoft como MS Excel y Open Office 365.

Con sede en Intel en California, EE. UU.

El Intel Developers Forum en California adopta un enfoque exhaustivo para proporcionar soluciones de big data con Apache Hadoop. La compañía tiene como objetivo proporcionar responsabilidad, privacidad, seguridad, transparencia y un uso apropiado e innovador de los datos utilizando los conceptos de HDFS (Sistema de archivos distribuidos Hadoop), Java y Map Reduce.

Amazon, el gigante de comercio electrónico líder en el mundo, es un centro de datos y conjuntos de datos incalculables, y tiene su sección principal de fuerza de trabajo dedicada a administrar, administrar, analizar y almacenar estos datos y usarlos para mayores ventas y tráfico. Dado que el panorama es increíblemente vasto, los servicios web de Amazon se basan en Hadoop, Hive, Pig y Apache Spark para crear una gran pila de datos y presentarla de la mejor manera a los clientes, escalando la economía y el ROI.

Teradata – Dayton, Ohio (Estados Unidos)

Examinando el hardware para procesar y obtener el fondo de los grandes datos, Teradata inventó escalar los clústeres de servidores. Al trabajar con varios servidores, la compañía azotó diez servidores con 100 terabytes cada uno para obtener un petabyte, que ahora está listo para administrar los grandes datos. Por lo tanto, esta compañía cree que la escalabilidad es el Big Everest Climb de Big Data. Teradata se basa en estrategias para tratar con múltiples servidores y emplea un sistema de hardware de nodo de servidor. Ha agregado análisis para documentos de texto, hojas de cálculo y documentos de procesador.

VMware– California, EE. UU.

Venerado en todo el mundo por su almacenamiento en la nube y Logging as a service (Laas), los profesionales de VMware proponen v Sphere Big data Extensions (BDE), un dispositivo virtual de código abierto que ayuda a los administradores de datos a implementar y administrar clústeres de Hadoop en la infraestructura virtual de vSphere. Con la ayuda de BDE, los profesionales pueden crear, monitorear y supervisar los componentes de Hadoop. De hecho, esto promueve un escalado más rápido y flexible, ya que el almacenamiento y la informática son procesos diferentes y mantienen los datos seguros y persistentes.

Hay varias otras empresas y empresas comerciales como DataStax, Attivio, Good data que esperan nuevas formas de lidiar con el volumen, la variedad, la velocidad y la veracidad de big data. Teniendo diferencias en el tipo de datos que trabajan, estas empresas están destinadas a encontrar profesionales con múltiples habilidades de análisis y codificación para Big Data Analytics. También debe comenzar a pensar en el futuro de su empresa y en el suyo, y en las implicaciones y soluciones a largo plazo para desarrollar su negocio, clientes, ingresos y, por supuesto, su carrera en estas empresas de gobierno de todo el mundo.

Los grandes datos son neutrales , pero las personas que intentan usarlos pueden causar mucho bien y mal. Big Data es un gran recurso con potencial que aún podríamos no comprender por completo, sin embargo, éticamente hay varias preguntas en las que estoy muy interesado. Le daré mi favorito:

Imagine que ha recopilado suficientes datos sobre personas que cometen delitos en todo el mundo. Big data … realmente enorme … Y usted tuvo éxito al construir un modelo que puede predecir si alguien comete un delito incluso antes de que lo haga. El modelo es brutalmente nítido: el 99.9% de las predicciones son correctas. ¿Cómo usas este algoritmo?

Puede decir que es claro y debe encarcelar instantáneamente a todas las personas predichas por el algoritmo como ‘futuros criminales’ y, por lo tanto, salvar muchas vidas. De hecho, también estaría arruinando muchas vidas, porque si predice erróneamente el 0.1% con 1 millón de delincuentes, también ha arruinado otras 100,000 vidas, porque los ha encarcelado falsamente como ‘futuros criminales’.

Claro, el daño que podría ser causado por los “futuros delincuentes” correctamente clasificados podría ser más severo, pero ¿no tenemos todos derecho a un juicio justo? ¿Qué pasa con la presunción de inocencia? ¿Pero no es demasiado tentador actuar sobre ese modelo? Me temo que aquí es donde puede estar el mal de los grandes datos . No en grandes datos, sino en las personas que tienen la tentación de usarlos para bien o para mal. O en el ejemplo que he dado, tal vez ambos al mismo tiempo.

Neutral. Al igual que cualquier tecnología, puede usarse tanto para el bien como para el mal.
Me gusta un mundo donde se usa Big Data pero solo para buenos propósitos.

Y al menos un tipo de Big Data es importante debido a problemas éticos e incluso si es ilegal en algún país, espero que haya algunos héroes que lo hagan ilegalmente, esperen hasta que la norma contra él se derrumbe y luego lo revelen, legalizando así retroactivamente su acciones ilegales pasadas. Me refiero a fotos de calles como Google Street View.

La razón es que, años después, estas fotos tienen un valor histórico, independientemente de las preocupaciones de privacidad inmediatas. Por ejemplo, algunas personas consideran que hay una necesidad “obvia” de difuminar caras y placas en Google Street View, pero desde la perspectiva del futuro observador, las preocupaciones de privacidad de las fotos antiguas no importan tanto como la preservación histórica. Y no, la versión borrosa no es “suficiente”, la calidad es horrible.

Es una parte necesaria y buena de la evolución de los datos para manejar la necesidad analítica de datos creada por cargas / feeds de datos voluminosos + pequeños que han sido destruidos durante las últimas 3 décadas. Después de 7-10 años, el big data se convierte en norma como un sistema operativo que se ejecuta en computadoras muy pequeñas, como la informática portátil, también conocida como niebla o computación periférica.

Big Data es solo el comienzo del procesamiento de unidades cognitivas que conducen a Big Wisdom. Lea mi libro sobre Aprovechar el poder de la sabiduría. En general, demasiados datos sobre las personas no son buenos. De esta manera perderemos nuestra individualidad, imprevisibilidad e intuición, así como también la libertad.

Big Data es solo un fenómeno que estamos viendo. Esos datos ahora se capturan fácilmente dada la tecnología actual que tenemos.

Ya sea bueno o malo, realmente depende de la persona que lo use y de cómo se esté usando. ¿Es equivalente a preguntar si un cuchillo es bueno o malo?

Al igual que cualquier tecnología, depende de quién esté usando.

More Interesting

¿Quién debería hacer big data?

¿Hay empresas en la India que empleen estudiantes universitarios y los capaciten en Big Data Analytics / Data Science?

¿Cuáles son algunas necesidades de análisis de datos insatisfechos o de abastecimiento público relacionadas con el problema del cambio climático?

¿Hay alguna manera de que podamos incorporar la genómica y las imágenes médicas a la ciencia de datos como postgrado?

Tengo un programa en el que los datos se generan muy rápido, ¿cómo inserto los datos en una base de datos?

¿Cuál es la diferencia entre ciencia de datos, aprendizaje automático e inteligencia artificial?

Comparta materiales gratuitos interesantes sobre ciencias de datos / Big Data / Machine Learning aquí?

Como científico de datos, ¿es mejor especializarse en la recopilación o el análisis de datos?

¿Cuál es el mejor instituto en India para la ciencia de datos y análisis de negocios?

¿Cómo convertirse en un científico de datos financieros? Quiero aplicar programación, matemáticas y finanzas en un solo trabajo. Tengo una licenciatura en informática, soy bueno con Java y C ++, y estoy aprendiendo R y Python. ¿Cuál debería ser mi próximo paso?

¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?

¿Cuál es la diferencia entre el almacenamiento de datos, la minería de datos y el análisis de datos?

¿Cuáles son los mejores programas de ciencia de datos en Bangalore?

¿Cómo pasaste de ser un estudiante de sociología a alguien que cursa estudios de posgrado en ciencia de datos?

¿Cuál debería ser el flujo de aprendizaje para la ciencia de datos?