La “ciencia de datos” es una combinación actual de matemática, estadística / probabilidad, programación y aprendizaje automático que requiere la mayoría de las habilidades multidisciplinarias que se enumeran aquí:
El conjunto de conocimientos y habilidades necesarios para el aprendizaje profundo
- ¿Cuáles son las válvulas de big data?
- ¿Qué tan unidos están la inteligencia empresarial y la ciencia de datos?
- ¿El éxito del aprendizaje profundo es una noticia falsa?
- ¿Cuáles son los mejores KPI para el equipo de Data Science?
- ¿Cuáles son algunos cursos de análisis de datos?
De la respuesta de Alan Morrison a ¿Cuál es el camino de aprendizaje de los grandes datos?
Análisis de datos: “El concepto de big data ha existido durante años; La mayoría de las organizaciones ahora entienden que si capturan todos los datos que se transmiten a sus negocios, pueden aplicar análisis y obtener un valor significativo de ellos. Pero incluso en la década de 1950, décadas antes de que alguien pronunciara el término “big data”, las empresas estaban utilizando análisis básicos (esencialmente números en una hoja de cálculo que fueron examinados manualmente) para descubrir ideas y tendencias.
Sin embargo, los nuevos beneficios que aporta el análisis de big data son la velocidad y la eficiencia. Mientras que hace unos años una empresa habría reunido información, ejecutado análisis e información desenterrada que podría usarse para decisiones futuras, hoy esa empresa puede identificar ideas para decisiones inmediatas. La capacidad de trabajar más rápido, y mantenerse ágil, le da a las organizaciones una ventaja competitiva que no tenían antes “.
Desde SAS, Big data analytics: qué es y por qué es importante
“Big Data” son datos menos estructurados en cientos de terabytes a petabytes. Son cantidades de datos que no se han modelado por adelantado para ir de forma ordenada a tablas donde podrían analizarse convencionalmente a través de una base de datos relacional. Esos datos pueden incluir contenido de redes sociales, por ejemplo, cualquier tipo de contenido digitalizado o datos numéricos que no hayan sido preparados para el análisis.
De la respuesta de Alan Morrison a ¿Cómo se analizan los grandes datos?
“La minería de datos es el proceso de encontrar anomalías, patrones y correlaciones dentro de grandes conjuntos de datos para predecir resultados”.
Desde SAS, ¿Qué es la minería de datos?
El aprendizaje automático (otro concepto relacionado que puede interesarle) acerca a los humanos y las máquinas al permitir que los humanos “enseñen” máquinas. Las máquinas aprenden procesando un conjunto de entrenamiento válido que contiene las características necesarias para ajustar un algoritmo. El algoritmo permite a las máquinas ejecutar tareas específicas, como clasificar el correo electrónico.
Pero los beneficios van más allá de lo que era posible con el filtrado de correo electrónico hace una década. Hoy, con la ayuda del aprendizaje automático, los drones pueden mapear un sitio como un puente en tiempo casi real y luego evaluar el alcance de un proyecto de reconstrucción de forma rápida y precisa.
Vea el diagrama de Venn a continuación para obtener más distinciones y explicaciones relacionadas.
Del resumen de aprendizaje automático (infografía)
Para obtener más información sobre los fundamentos del aprendizaje automático, consulte nuestra serie completa de infografías en Machine learning 101 (infografía)