En primer lugar, la gran mayoría del tiempo dedicado a la ciencia de datos consiste en enmarcar el desafío o problema comercial como un problema de datos más objetivo y obtener y transformar los datos requeridos.
Enmarcar el problema: el problema generalmente siempre es nuevo; por ejemplo, una semana puede tener una gran participación del cliente en su aplicación, la siguiente puede estar perdiendo clientes, pero en la mayoría de los casos tiene demasiados datos y no está seguro de dónde Mira. Pensar en varios escenarios posibles para diagnosticar el problema requiere creatividad
Extracción de los datos y limpieza: una vez que haya identificado algunas hipótesis que desea probar. Probarlos requiere encontrar los datos y limpiarlos para conectarlos a varios modelos y análisis para extraer información. Si bien las filas de datos a menudo cambian, el esquema de datos no cambia con tanta frecuencia, por lo que este proceso a menudo puede ser muy monótono y rutinario. En particular, le gustará ejecutar las mismas transformaciones de datos una y otra vez, y debido a que probablemente esté reutilizando varios modelos que haya creado antes o que haya encontrado en línea, las transformaciones de datos deberán estar en formatos que requieren los modelos utilizados anteriormente. Aunque es posible que pueda automatizar algo de esto, debido a que las fuentes de datos para cada experimento cambian, esto todavía requiere un trabajo manual por parte del científico de datos.
- ¿Cómo se puede ser un mejor dueño de mascotas a través de la ciencia de datos?
- ¿Qué tan confiables son las estadísticas oficiales del gobierno en los Estados Unidos?
- ¿Cuáles son algunos ejemplos de cómo se aplica la ciencia de datos en la inversión?
- Por lo general, en la tercera sección de un artículo describimos el tipo de datos, la fuente de datos, el análisis de datos, etc. ¿Es este un método o una sección de metodología?
- ¿Cómo juegan un papel los datos y el análisis en el negocio de un cliente?
Selección y prueba del modelo : durante la selección del modelo, nuevamente necesitará algo de creatividad para interpretar los resultados de cada modelo. Dado que los resultados del modelo a menudo no son deterministas y tienen muchas variaciones, el análisis requiere una mente ágil y curiosa para profundizar en la raíz central del problema y encontrar una solución.
Espero que esto ayude 🙂