hmm
Usted pregunta sobre los títulos de trabajo, pero creo que quiere una respuesta que explique los roles que desempeñan las personas (o se supone que deben jugar).
Le sugiero que revise este documento. Podría ayudar.
- ¿Qué corporaciones / empresas multinacionales indias están contratando para trabajos de nivel de entrada en ciencia de datos o análisis de datos? ¿Cuáles son los requisitos para lo mismo?
- ¿Cómo es ser un científico de datos en Apple?
- ¿Existe algún servicio web asequible para importar datos de un CSV, conectarlos, limpiarlos y analizarlos?
- ¿Cuáles son algunos de los "productos de datos" creados por los grandes como Amazon, LinkedIn, Twitter, Facebook, etc.?
- Si quiero desarrollar herramientas analíticas en tiempo real para mi sitio web y agregar recomendaciones basadas en objetivos en tiempo real, ¿cuál entre PredictionIO y EasyRec sería una mejor opción? ¿Hay otras opciones mejores (de código abierto) disponibles aparte de estas dos?
El documento a tamaño completo está aquí: Data Science no es una isla – ByteSumo Limited
El diagrama se llama trillium-venn, un tipo de diagrama que inventé, y ahora uso mucho. En él, hay un trillium azul que define equipos (círculos) y propósito en texto azul.
El trillium amarillo muestra el efecto y el propósito de la colaboración entre los equipos. Cuando este diagrama se ejecuta en el sentido de las agujas del reloj, la ciencia de datos / aprendizaje automático comenzará a transformar una organización.
Si considera que mi diagrama es un “Modelo operativo”, queda claro cuáles son las diferencias en los roles y por qué son necesarios. Las habilidades detrás de esos roles cambiarán con la tecnología, pero los roles en sí mismos son bastante estables.
(1) Científico de datos: explica el arte de lo posible, ayuda a definir hipótesis, prueba los datos para su propósito, retroalimenta problemas con la recopilación de datos, diseña experimentos, construye prototipos, entrena / ajusta modelos, documenta y explica la efectividad de los modelos / prototipos Ayuda a explicar y entregar proyectos exitosos a ingenieros de datos para la industrialización en los sistemas de producción.
(1.b) Ingeniero de Aprendizaje Automático: a menudo es un especialista en el equipo de Ciencia de Datos, que se centra particularmente en un tipo de aprendizaje automático, y sus métodos y herramientas para ajustar y entrenar modelos, y potencialmente hacer I + D para construir nuevos tipos de modelos. Nota: esto puede adaptarse a tipos específicos de datos y algoritmos. Por ejemplo, un ingeniero de algoritmos de gráficos, un ingeniero de aprendizaje profundo, un ingeniero de procesamiento de lenguaje natural, etc.
(3) Ingeniero de datos: trabaja en el equipo que crea herramientas de procesamiento de datos de grado de producción que se escalan, son resistentes y seguras. Se centran en componentes y plataformas compatibles reutilizables, y tienen un gran interés en los flujos de datos, ETL e integraciones de sistemas, todo lo que coloca los modelos de ciencia de datos en los sistemas de producción. Es probable que también estén trabajando arduamente para crear flujos de datos de monitoreo de desempeño e inteligencia de negocios, y / o almacenes de datos, lo cual es parte de su herencia.
Espero que ayude.
UNA