Los “datos” fueron hijastros de las “aplicaciones” durante muchas décadas, a pesar de que ambos son parte del mismo conjunto y deben considerarse como un activo de información. Muchos no querían pensar en “datos”. Era demasiado arcano, demasiado diminuto. Déjelo en manos de los estadísticos.
Lo que es diferente ahora es la naturaleza ilimitada de los datos y cómo algunos pueden extraer el gran volumen de datos para obtener información que no teníamos antes.
Las máquinas ahora pueden reconocer e interpretar el lenguaje humano porque tenemos grandes volúmenes de datos de lenguaje para procesar. Son capaces de reconocer caras porque las máquinas pueden aprender sin supervisión de enormes conjuntos de entrenamiento en sitios de video generados por los usuarios.
- ¿Cuáles son las desventajas comunes de tener un conjunto de datos dispersos al crear un modelo ML?
- Cómo desarrollar la intuición de datos
- Cómo gestionar el big data
- ¿Cómo se pueden combinar las técnicas de minería de texto con los sistemas de recuperación de información?
- ¿Mi experiencia en Java cuenta para Big Data?
Ahora las máquinas están aprendiendo a reconocer todo tipo de patrones en los datos a una escala y velocidad que los humanos no podrían lograr por sí mismos. No son solo datos en sí mismos, son datos de dispositivos de imágenes de gigapíxeles que pueden escanear todo el cuerpo en busca de indicios de cáncer, o datos capturados por sensores instalados en automóviles autónomos sobre objetos cercanos y vehículos en movimiento que pueden eliminar fuentes de humanos. error y hacer posibles los autos sin conductor.
Duke University Dermascopio de cuerpo entero.
De Lauren Bange de la Universidad de Duke, http://www.pratt.duke.edu/news/s…
Podemos hacerlo porque miles de millones de transistores ahora se pueden empaquetar en un solo microprocesador, ahora se pueden almacenar decenas de gigabytes en un solo módulo DRAM, se pueden almacenar decenas de terabytes en un solo disco duro y miles de los conjuntos de datos se pueden integrar y distribuir entre decenas de miles de servidores para ser consultados como un único sistema de procesamiento de datos.
Sobre todo, podemos permitirnos hacer esto ahora, y el costo de hacer ese procesamiento y almacenamiento sigue disminuyendo. A través de redes de intercambio de código como Github y comunidades de código abierto como Apache, el software significa que puede obtener información de todo tipo de datos está disponible para su descarga gratuita por cualquier persona con una conexión a Internet y una computadora portátil.
Es una nueva frontera para la inteligencia empresarial y el análisis, por lo que es un diferenciador importante para las empresas que entienden el valor de una nueva clase de aplicaciones basadas en datos, un diferenciador que no existía antes. Industrias enteras están siendo interrumpidas por aquellos que saben cómo aprovechar el nuevo potencial de la información correcta en el lugar correcto en el momento correcto.
De http://www.pwc.com/us/en/technol…