¿Cuál es la diferencia entre un científico de datos y un ingeniero de aprendizaje automático en LinkedIn?

Aquí está la diferencia en el papel y las responsabilidades entre el científico de datos y el ingeniero de aprendizaje automático.

Científico de datos:

El científico de datos es responsable de diseñar y ejecutar procesos relacionados con el modelado predictivo / analítico, la minería de datos y la investigación en conjuntos de datos complejos a gran escala, utilizando estadísticas, aprendizaje automático, modelado de gráficos, minería de texto y otras técnicas modernas.

Ingeniero de Aprendizaje Automático:

Un ingeniero de Machine Learning es responsable de resolver problemas complejos de big data en el espacio publicitario en línea utilizando minería de datos, aprendizaje automático, análisis estadístico y economía computacional. Tienen un gran conocimiento profundo y amplio en aprendizaje automático, minería de datos y estadísticas.

La ciencia de datos y el aprendizaje automático parecen disciplinas similares, pero son muy diferentes. Déjame intentar explicar cómo.

La ciencia de datos implica la creación de grandes bases de datos de información de las cuales se puede extraer información útil. Ahora, los datos en el banco deben evaluarse, escanearse e integrarse primero para convertirlos en una forma homogénea y utilizable. Aquí es donde entra la máquina inclinada.

El aprendizaje automático es una metodología para enseñar a las máquinas a ser más inteligentes y más interactivas con otras interfaces. Por ejemplo, se está desarrollando una nueva vacuna en un laboratorio. Ahora, la temperatura de la mezcla química no debe superar los 40 grados, pero la fricción debido a la alta velocidad de la centrífuga hace que la mezcla se caliente a 41 grados, la máquina ajusta automáticamente la velocidad para que vuelva a bajar a 40. Esto es solo un ejemplo. El aprendizaje automático se puede aplicar para expandirse en los campos de escáneres cerebrales, automóviles autónomos, etc.

La ciencia de datos, por otro lado, implica un enfoque más sofisticado y sistemático. Una vez que los datos se procesan, se extraen para extraer información útil de ellos. La información se puede utilizar para rastrear a los usuarios de un sitio web de redes sociales, estimar el tiempo de entrega de un paquete de mensajería, etc. El resultado final en un esfuerzo o experimento de ciencia de datos es entregar una solución a un problema comercial existente o encontrar formas de ejecutarlo mejor Un negocio existente.

Espero que esto ayude. ¡Aclamaciones!

En resumen, el factor diferenciador clave es que el aprendizaje automático o los ingenieros de relevancia, como se les llama en LinkedIn, crean productos y servicios, mientras que los científicos de datos se centran más en el análisis y la información de decisiones estratégicas y de producto.

Los ingenieros de Relevance crean productos y sistemas de personalización en todas las líneas de productos de la empresa y, por lo tanto, generan valor para los miembros y clientes de LinkedIn, así como las principales métricas comerciales. Los ejemplos incluyen Personalización de feed, clasificación y entrega de anuncios, clasificación de búsqueda, recomendaciones de trabajo, etc. Estos sistemas de recomendación se basan en una amplia gama de metodologías estadísticas / de aprendizaje automático (modelos lineales generalizados, métodos basados ​​en árboles, redes profundas, modelos latentes, etc. ), así como la infraestructura distribuida de aprendizaje automático, la indexación y los sistemas de servicio en línea, que desarrollan los equipos. El trabajo representativo también se publica en las principales conferencias como KDD, WWW, WSDM, etc. (por ejemplo, consulte la lista de 11 documentos aceptados para KDD 2016).

Los científicos de datos en LinkedIn se centran principalmente en la toma de decisiones. Los científicos de datos trabajan en análisis de inmersión profunda para ayudar a guiar las decisiones de estrategia de productos, evaluar las oportunidades de mercado, diseñar experimentos y, en general, responder algunas preguntas fascinantes de productos con datos.

En general, ambos tipos de roles ofrecen muchos desafíos súper emocionantes al trabajar con los datos únicos y los espacios comerciales de LinkedIn.

Hablando en general:

  • Un ingeniero de aprendizaje automático trabajará más en el modelo, cómo hacerlo mejor, más rápido, y en el diseño de una tubería para procesar los datos de manera eficiente.
  • Un científico de datos analizará más el panorama general e intentará dar sentido a los datos, pero sin profundizar tanto en el núcleo del sistema de procesamiento de datos.

No tengo ni idea sobre Linked in, pero Machine Learning es parte de la ciencia de datos, es para hacer que Machine aprenda algo. Funcionará como si el correo fuera spam o no. Pero el científico de datos tiene muchas cosas que hacer, como minería de datos, análisis de datos, visualización, etc.

Entonces, la diferencia básica entre ML y data science es la diferencia entre ML Engineer y data scientist.

Data Scientist es en general un campo de campo donde se requieren muchas habilidades.

Y Machine Learning es uno de ellos.

El aprendizaje automático no es un área específica más nueva, sino que involucra muchos subdominios de informática

Aquí para aclararnos

Fuente: PayScale