¿Cómo se relaciona el aprendizaje automático con la ciencia de datos?

Gracias por el A2A.

Es una parte importante de la ciencia de datos.

Típicamente, la inferencia existe como una forma de dar sentido a algo de una población que usa estadísticas. La mayoría del modelado de datos en estadísticas típicas es inferencia. La razón detrás de esto es la disponibilidad de datos, por ejemplo, es muy difícil hacer una pregunta a cada persona en un país.

Luego, dos cosas cambian: la primera es la disponibilidad de datos. De hecho, puede recopilar datos de toda una población de interés. La segunda es que, a menudo, está menos interesado en inferir de los datos, pero más interesado en usarlo para predecir algo o prescribir una acción automáticamente.

Ahí es donde interviene el aprendizaje automático. Los algoritmos de aprendizaje automático, aquellos que tienden a distanciarse de las “estadísticas típicas” a menudo son menos interpretables pero más potentes en productos predictivos puros.

Esto significa que, dependiendo de los objetivos de un equipo de ciencia de datos, siempre hay espacio para el aprendizaje automático. Algunos equipos trabajan casi exclusivamente con el aprendizaje automático, integrando nuevos productos y características basadas únicamente en la capacidad de estos sistemas. Lo usamos para productos de datos específicos, pero a menudo utilizamos estadísticas comunes y modelos de datos que personalmente no llamo aprendizaje automático.

Si piensa en todas las disciplinas y habilidades que potencialmente pueden formar un equipo de ciencia de datos, el aprendizaje automático es seguro en el grupo central.

Espero que esto ayude.

El aprendizaje automático es un método de análisis de datos que automatiza la construcción de modelos analíticos. Usando algoritmos que aprenden iterativamente de los datos.

Ejemplos de problemas de aprendizaje automático

reconocimiento óptico de caracteres : clasifique las imágenes de caracteres escritos a mano por las letras representadas.

detección de caras : encuentre caras en las imágenes (o indique si hay una cara presente).

filtrado de spam : identifica los mensajes de correo electrónico como spam o no spam.

detección de temas : categorice los artículos de noticias (digamos) sobre si se trata de política, deportes, entretenimiento, etc.

La ciencia de datos es el estudio de dónde proviene la información, qué representa y cómo se puede convertir en un recurso valioso en la creación de negocios.

¿Cuáles son buenos ejemplos del uso de la ciencia de datos para el desarrollo y / o el bien social?

La pregunta es cómo el aprendizaje automático y la ciencia de datos se relacionan entre sí: el aprendizaje automático es una herramienta matemática para comprender y extraer información de un gran conjunto de datos. Puede usar el ecosistema Hadoop para administrar sus datos. Ahora aproveche esos datos y aplique el aprendizaje automático a través de Mahout

Data Scientist debe necesitar un conjunto de habilidades

Esto puede ser difícil de responder porque el término “ciencia de datos” es amplio, algo vago y aún evoluciona. Personalmente, creo que la ciencia de datos aplica varias técnicas analíticas, incluido el aprendizaje automático, a las aplicaciones empresariales. Como resultado, hay superposiciones significativas.

Pero también hay algunas diferencias. Por ejemplo, un concepto que probablemente encontrará en el aprendizaje automático pero no en la ciencia de datos es el aprendizaje por refuerzo. Simplemente no hay tantas aplicaciones de aprendizaje por refuerzo en el mundo de los negocios a partir de ahora.

Por el contrario, un concepto que probablemente encontrará en la ciencia de datos pero no tanto en el aprendizaje automático es el diseño experimental. Esto no significa que el diseño experimental esté completamente excluido del aprendizaje automático. Simplemente no se enfatiza mucho en este momento.

Por supuesto, ambos campos están evolucionando tan rápido que todo esto podría cambiar en un futuro cercano.

Los enfoques basados ​​en fórmulas directas son menos efectivos para tratar la extracción de información útil de los datos. Es por eso que utilizan algoritmos de aprendizaje que se basan en los datos mismos para extraer un buen conocimiento sobre los datos.
De esta manera, los algoritmos de aprendizaje automático se utilizan para extraer conocimiento de los datos. Que se llama ciencia de datos.

Sigue esto
¿Cómo se relaciona la ciencia de datos con el aprendizaje automático?

More Interesting

¿Me puede recomendar un curso avanzado de ciencia de datos?

¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?

A los 28 años, y aprendiendo a programar. ¿Me he perdido la oportunidad de conseguir un trabajo en ciencia de datos y aprendizaje automático en el Reino Unido?

Para algoritmos de bandidos con múltiples brazos, ¿tiene sentido dejar de muestrear un brazo si el límite de confianza superior p% es menor que el límite de confianza inferior p% de un brazo de diferencia?

¿Cuál es la mejor manera posible de comenzar a aprender rápidamente y obtener un control firme de las ciencias de datos?

¿Cuál es el punto de CRM-DBA, big data / data science, piratería de datos y minería de datos?

¿Qué papel deberían jugar los estadísticos en la ciencia de datos?

¿Cuál es la mejor manera de comenzar una carrera en ciencias de datos después de completar un título en ciencias físicas?

¿Cuáles son algunos problemas de ciencia de datos que deben resolverse?

¿En qué casos un análisis causal es más apropiado para una empresa o departamento de investigación que el modelo predictivo?

¿Qué credencial de ciencia de datos es más valiosa, un certificado en línea de la escuela de extensión de Harvard o un MSC en línea del Data Science Tech Institute (París)?

¿Qué herramientas e idiomas necesito saber para convertirme en un científico de datos en el futuro?

¿Cuáles son las 5 principales ventajas principales de Big Data?

¿Qué tipo de libertades tengo con los datos de Kaggle?

¿Cómo abordaría un nuevo trabajo de TI (software flexible, ciencia de datos) en una empresa muy grande donde se supone que todas las personas son muy hábiles?