¿Cuáles son algunos proyectos en Big Data y machine learning?

Big Data Analytics es para ayudar a las empresas a tomar decisiones comerciales más informadas al permitir que DATA Scientist, modeladores predictivos y otros profesionales de análisis analicen grandes volúmenes de datos de transacciones, así como otras formas de datos que pueden ser aprovechadas por los programas convencionales de inteligencia empresarial (BI) . Eso podría incluir registros del servidor web y datos de Internet Click Stream, contenido de redes sociales e informes de actividad de redes sociales, texto de correos electrónicos de clientes y respuestas de encuestas, registros detallados de llamadas de teléfonos móviles y datos de máquinas capturados por sensores conectados a INTERNET. Algunas personas se asocian exclusivamente Big Data con datos semiestructurados y no estructurados de ese tipo, pero las empresas de consultoría como Gartner Inc. y Forrest er Research Inc. también consideran que las transacciones y otros datos estructurados son componentes válidos de las aplicaciones de análisis de Big Data. Puede visitar este enlace para obtener más información: Cursos de Big Data en Intellipaat

Los grandes datos se pueden analizar con las herramientas de software comúnmente utilizadas como parte de las disciplinas de Advance Analytics, como la minería de datos de análisis predictivo, el análisis de texto y el método estadístico. El software de BI convencional y las herramientas de visualización también pueden desempeñar un papel en el proceso de análisis. Pero los datos semiestructurados y no estructurados pueden no encajar bien en el Data Warehouse tradicional basado en la base de datos relacional. Además, es posible que los almacenes de datos no puedan manejar las demandas de procesamiento que plantean los conjuntos de grandes datos que deben actualizarse con frecuencia o incluso de manera continua, por ejemplo, datos en tiempo real sobre el rendimiento de aplicaciones móviles o de oleoductos y gasoductos. Como resultado, muchas organizaciones que buscan recopilar, procesar y analizar grandes datos han recurrido a una nueva clase de tecnologías que incluye Hadoop y herramientas relacionadas como Yarn Spook, Spark y Pig, así como bases de datos No Sql. Esas tecnologías forman el núcleo de un marco de software de código abierto que admite el procesamiento de conjuntos de datos grandes y diversos en sistemas en clúster.

En algunos casos, los sistemas Hadoop Cluster y No SQL se están utilizando como plataformas de aterrizaje y áreas de preparación de datos antes de que se carguen en un almacén de datos para su análisis, a menudo en forma resumida que es más propicio para las estructuras relacionales. Sin embargo, cada vez más, los proveedores de Big Data están impulsando el concepto de una toma de datos de Hadoop que sirve como el depósito central para los flujos entrantes de datos sin procesar de una organización. En tales arquitecturas, los subconjuntos de datos se pueden filtrar para su análisis en almacenes de datos y bases de datos de análisis, o se pueden analizar directamente en Hadoop utilizando herramientas de consulta por lotes, software de procesamiento de flujo y tecnologías SQL y Hdoop que ejecutan consultas interactivas y ad hoc escritas en SQL Las posibles trampas que pueden hacer tropezar a las organizaciones en iniciativas de análisis de big data incluyen la falta de habilidades analíticas internas y el alto costo de contratar profesionales analíticos experimentados. La cantidad de información que suele estar involucrada, y su variedad, también pueden causar dolores de cabeza en la gestión de datos, incluidos la calidad de los datos y los problemas de coherencia. Además, integrar sistemas Hadoop y almacenes de datos puede ser un desafío, aunque varios proveedores ahora ofrecen conectores de software entre Hadoop y bases de datos relacionales, así como otras herramientas de integración de datos con capacidades de big data.

El gran proyecto de IBM Watson.

Watson es un sistema informático de respuesta a preguntas capaz de responder preguntas formuladas en lenguaje natural, desarrollado en el proyecto DeepQA de IBM

Para cada pista, las tres respuestas más probables de Watson se mostraron en la pantalla del televisor. Watson constantemente superó a sus oponentes humanos en el dispositivo de señalización del juego, pero tuvo problemas en algunas categorías, especialmente en aquellas que tienen pistas cortas que contienen solo unas pocas palabras.

En febrero de 2013, IBM anunció que la primera aplicación comercial del sistema de software Watson sería para decisiones de gestión de utilización en el tratamiento del cáncer de pulmón en el Centro de Cáncer Memorial Sloan Kettering junto con la compañía de seguros de salud WellPoint.

El ex jefe de negocios de IBM Watson, Manoj Saxena, dice que el 90% de las enfermeras en el campo que usan Watson ahora siguen su guía.

Ref: Saluda a IBM Watson y Watson (computadora)

Big Data como servicio público se está poniendo de moda.

A medida que el universo de datos digitales crece cada día más, los gobiernos locales y nacionales están adoptando métodos innovadores para aprovechar la tecnología de Big Data para servir mejor a los ciudadanos.

Consulte el último blog de SQream Technologies: ¿Puede Big Data servir mejor al público? – SQream

More Interesting

¿Cuáles son los casos de uso de aprendizaje profundo en CRM?

¿Cuál es el mejor método para presentar la idea de una red neuronal de convolución a un profano?

¿Es posible que un ingeniero de procesamiento de señales se involucre en el campo del aprendizaje automático?

¿Qué tiene de bueno la PNL?

Will Naive Bayes dará un buen resultado si el conjunto de entrenamiento es mucho más pequeño que el no. de características en un clasificador de aprendizaje automático?

¿Cómo combino análisis de series temporales y regresión lineal?

¿Cuál es la forma correcta de crear consultas jerárquicas?

¿Cómo utilizan las empresas los algoritmos de IA en aplicaciones prácticas?

¿Por qué nadie recomienda JavaScript / Node.js como lenguaje para el aprendizaje automático o el análisis de datos?

¿Cuál es el método del núcleo? ¿Cómo se usa en los sistemas de recomendación?

¿Cuál es el poder computacional de las redes neuronales no recurrentes frente a las redes neuronales recurrentes?

¿Qué es un sistema o algoritmo de recomendación que dice 'Dado que consumiste X {a} veces, Y {b} veces y Z {c} veces, ¿cuál de {X, Y, Z} debería recomendarte que consumas a continuación'?

¿Qué utiliza la aspiradora robótica como recompensa si utilizan el aprendizaje por refuerzo como algoritmo?

¿Cómo probar formalmente que el producto de dos núcleos es un núcleo? Si K1 (x, x1) y K2 (x, x2) son ambas funciones del núcleo, entonces K1 (x, x1) K2 (x, x2) también es un núcleo

¿Cómo puedo comenzar el trabajo de investigación sobre aprendizaje automático y cómo puedo elegir un tema o problema en el aprendizaje automático?