¿Existe una conexión entre la ciencia de datos y el aprendizaje automático?

De Wikipedia con resumen hecho por mí:

Data Science = es un campo interdisciplinario sobre métodos, procesos y sistemas científicos para extraer el conocimiento o las percepciones de los datos en varias formas, ya sea estructuradas o no, de manera similar a Knowledge Discovery en bases de datos (KDD).

Aprendizaje automático = es el subcampo de la informática que brinda a las computadoras la capacidad de aprender sin ser programado explícitamente (Arthur Samuel, 1959). Evolucionado del estudio del reconocimiento de patrones y la teoría del aprendizaje computacional en inteligencia artificial, el aprendizaje automático explora el estudio y la construcción de algoritmos que pueden aprender y hacer predicciones sobre los datos: dichos algoritmos se superan siguiendo instrucciones estrictamente estáticas del programa al hacer predicciones o decisiones basadas en datos, mediante la construcción de un modelo a partir de entradas de muestra. El aprendizaje automático se emplea en una variedad de tareas informáticas en las que no es factible diseñar y programar algoritmos explícitos; Las aplicaciones de ejemplo incluyen el filtrado de spam, la detección de intrusos en la red o personas maliciosas que trabajan en busca de una violación de datos, reconocimiento óptico de caracteres (OCR), motores de búsqueda y visión por computadora.

Parece que hay una diferencia. El aprendizaje automático hace que las máquinas sean más independientes (sobre estudiar, aprender cosas), Data Science le brinda la capacidad de extraer datos en varias formas.

El aprendizaje automático es parte de la ciencia de datos.

Otras partes de la ciencia de datos: limpieza de datos, análisis exploratorio de datos, inferencia estadística, muestreo de datos, aplicaciones de datos.

La consulta a continuación, contra un conjunto de estados parcialmente ordenados restringidos por una heurística de unión de datos, define una máquina de estados finitos no determinista de múltiples niveles ordenada como una cadena de Markov.

Eso, combinado con una función logística difusa, define una red neuronal.

seleccione a.state, a.probability, b.state, b.lower, b.upper

de estados a, estados b

donde a.nextState = b.state

y a.probabilidad entre (b.lower, b.upper)

y joinHeuristic (a.state, a.probability, b.nextState, b.lower, b.upper, b.probability)

agrupar por a.state, a.probability, b.state, b.lower, b.upper

More Interesting

¿Es la tasa de falso rechazo (FRR) similar a la tasa de falsos positivos (FPR)? Entonces, si es similar, ¿por qué hay disponibles diferentes definiciones para cada una de ellas?

¿Hay alguna trampa en los recientes anuncios de Microsoft e IBM sobre los avances en el reconocimiento de voz?

¿Cuáles son las deficiencias del aprendizaje profundo? ¿Cuál es el mayor defecto o limitación del aprendizaje profundo?

Cómo implementar Inteligencia Artificial en un Proyecto Arduino

¿Cuál es la relevancia de la factorización matricial en el aprendizaje profundo?

¿Cuál es la diferencia entre CNN y RNN?

¿Cómo funciona la regresión lineal múltiple en variables categóricas?

¿Qué caminos puede tomar un ingeniero mecánico para comenzar a trabajar con robótica, aprendizaje automático e inteligencia artificial?

¿Cuáles son algunos de los problemas de desarrollo que enfrenta la inteligencia artificial?

¿Qué libro de los dos es más completo para PNL: el de Jurafsky o el de Manning?

Como el sistema de recomendación está relacionado con el aprendizaje automático, ¿cuál será la próxima moda en los sistemas de recomendación?

¿Cuál es el mejor modelo de predicción de la siguiente palabra en R?

¿De qué manera las competencias de minería de datos y aprendizaje automático ayudan / restan valor a estos campos académicos y sus aplicaciones comerciales?

¿Puedo tomar el curso de aprendizaje automático de Andrew Ng siendo un estudiante de secundaria con algo de experiencia en programación y sin conocimientos avanzados de matemáticas?

¿Por qué los modelos gráficos probabilísticos tienen un rendimiento inferior en las tareas de clasificación en comparación con las redes neuronales o las máquinas de vectores de soporte?