El aprendizaje automático y las estadísticas son parte de la ciencia de datos. La palabra aprendizaje en aprendizaje automático significa que los algoritmos dependen de algunos datos, utilizados como un conjunto de entrenamiento, para ajustar algunos parámetros del modelo o algoritmo. Esto abarca muchas técnicas, como la regresión, la ingenua Bayes o la agrupación supervisada. Pero no todas las técnicas encajan en esta categoría. Por ejemplo, la agrupación no supervisada, una técnica estadística y de ciencia de datos, tiene como objetivo detectar agrupaciones y estructuras de agrupación sin ningún conocimiento o conjunto de capacitación a priori para ayudar al algoritmo de clasificación. Se necesita un ser humano para etiquetar los grupos encontrados. Algunas técnicas son híbridas, como la clasificación semi-supervisada. Algunas técnicas de detección de patrones o de estimación de densidad encajan en esta categoría.
Sin embargo, la ciencia de datos es mucho más que aprendizaje automático. Los datos, en la ciencia de los datos, pueden provenir o no de una máquina o un proceso mecánico (los datos de la encuesta pueden recopilarse manualmente, los ensayos clínicos involucran un tipo específico de datos pequeños) y tal vez no tenga nada que ver con el aprendizaje, como acabo de comentar. Pero la principal diferencia es el hecho de que la ciencia de datos cubre todo el espectro del procesamiento de datos, no solo los aspectos algorítmicos o estadísticos. En particular, la ciencia de datos también cubre
integración de datos
- ¿Qué nuevas ideas puede proporcionar la ciencia de datos en los datos de transporte?
- Cómo implementar Data Compression + Denoising usando Machine Learning
- ¿Cómo se pueden utilizar los grandes datos para mejorar la eficiencia de las operaciones de vuelo?
- ¿Cómo se sienten los estudiantes de doctorado en aprendizaje automático después del reciente aumento del aprendizaje profundo? ¿Creen que gran parte de su arduo trabajo se desperdiciará?
- ¿Debo usar big data como tema de investigación para mi tesis? ¿Cuál es la diferencia entre cloud computing y big data?
arquitectura distribuida
automatizar el aprendizaje automático
Visualización de datos
tableros y BI
ingeniería de datos
despliegue en modo de producción
decisiones automatizadas basadas en datos …