¿Vale la pena intentar hacer ciencia de datos si uno no tiene experiencia en informática, matemáticas o estadísticas?

Está bien, no hay problema.

La situación no es tan compleja.

Resolvamos el problema paso a paso. Estoy considerando que tienes seis meses en la mano.

Paso 1: comience con cualquier lenguaje de programación (C ++) mi sugerencia y estadísticas para el administrador o estadísticas para la administración . Intenta terminar el libro en 30 días. En este momento, se sentirá cómodo con los conceptos básicos de programación con una pequeña idea sobre la estructura de datos. He echado de menos más arriba, necesita resolver los ejemplos con papel de lápiz y sobresalir.

Paso 2: elija cualquier conjunto de datos con su elección y comience a trabajar con él. Debe cubrir los conceptos básicos de C Crear U actualizar R recuperar D eliminar. Haga este período de 30 días también.

Después de 30 días, debe saber cómo recuperar datos de tablas, subconfigurar, unir varias tablas, calcular resúmenes e insertar o escribir en una nueva tabla o archivo.

Paralelamente, inicie la visualización básica con Microsoft Excel (estoy considerando que terminó con los libros y trabajó todos los ejemplos). Después de Excel, comience con Tableau o Microsoft Power BI para diferentes ejercicios de visualización (consulte sitios web individuales y youtube toneladas de material disponible).

En resumen, en estos treinta días está listo con conceptos intermedios de estadísticas y programación, conceptos DBMS con buenas habilidades de visualización en Excel o cualquier herramienta.

Pasaron dos meses y ahora ha terminado con la mayoría de las cosas que necesita aprender.

Ahora, es hora de que algunas acciones elijan el lenguaje de su elección, ya sea R o Python, y comience a trabajar en eso. Únase a cualquier curso de edx, coursera o datacamp. Apunte a los próximos 30 días para obtener comodidad de nivel intermedio en el idioma seleccionado. Siempre tenga en cuenta que necesita practicar tanto como sea posible. En estos 30 días, debería poder realizar las acciones mencionadas a continuación utilizando su idioma preferido:

  1. Importación y exportación de datos.
  2. Manipulación de datos dentro del entorno
  3. Conéctese a una base de datos y ejecute consultas
  4. Visualización de datos

La mitad del viaje ha terminado, ahora es el momento de una acción real. Únete al mundo del aprendizaje automático. Seleccione su conjunto de datos para practicar. Debe comenzar con los conceptos y métodos supervisados ​​de aprendizaje automático (regresión lineal, regresión logística, tress de decisión, bosque aleatorio, todo esto es por ahora).

Qué flujo necesita seguir para aprender Cualquier algoritmo:

  1. Importación y gestión de datos.
  2. Preparación de datos para modelar
  3. Establece tu estrategia de modelado
  4. Ejecute su algoritmo
  5. Validar las salidas
  6. Mida el rendimiento de su solución.
  7. Despliegue de solución
  8. Seguimiento y estrategia de revisión

Espero que tarde entre dos y tres días en terminar con un algoritmo. Por lo tanto, la máquina supervisada se realizará en 12 a 15 días.

Ahora es el momento de los métodos sin supervisión. Puede comenzar con métodos de múltiples variantes, como análisis de componentes principales, análisis factorial y análisis de clúster.

A finales de este mes, ha terminado con el módulo de aprendizaje automático y tiene una idea justa sobre qué hacer, cómo hacerlo y cuándo hacerlo. Con el aprendizaje parte, te estoy deteniendo aquí.

Han pasado cuatro meses, es hora de comenzar con pocos estudios de casos disponibles en Internet. Intente agregar de 4 a 5 estudios de caso en su perfil. Tomará otro tiempo de un mes.

Este es tu último amigo, trata de codificar tanto como sea posible (4–6 horas en un día), repasa todo lo que has aprendido en los últimos cinco meses y comienza a buscar trabajo.

La mejor de las suertes.

Actualizaré enlaces pronto.

Sí, pero un poco de fundamentos en matemáticas y estadísticas serían de ayuda.