Como especialista en estadística, ¿qué cursos de informática debo tomar para convertirme en científico de datos?

Hola veena

En mi experiencia, hay muchas cosas que hacer y siempre tienes que prepararte en algún patrón, y créeme, después de seguir algún patrón, no necesitas seguir un patrón, sino aplicar lo que mejor se adapte.

Hay cuatro cosas desde el punto de vista que un científico de datos exitoso y profesional necesita comprender:

(1) Matemáticas (álgebra lineal, cálculo, probabilidad)

(2) Informática

(3) El requisito / preocupación para qué solución se está estudiando

(4) ADA – (Diseño y análisis de algoritmos)

El científico de datos es un espectro de roles que conforman equipos de ciencia de datos, como los ingenieros que configuran bases de datos, las protegen y verifican la escalabilidad. Por otro lado, debe encontrar el valor de los datos grandes.

En lo que respecta a dominar el tema, debes mejorar tus habilidades en:

  1. Estadísticas del sistema
  2. Bases de datos SQL / NoSql
  3. Matemáticas
  4. datos / aprendizaje automático
  5. Visualización de datos

Vemos cómo estas habilidades son útiles en estos: –

Estadísticas : obtenga una base sólida en esto, observe cuán simples pueden ser muchos análisis (por ejemplo, división, mirar distribuciones, etc.), en el nivel más básico, deben comprender la regresión lineal y logística, el análisis de supervivencia, regresión binomial negativa u otras técnicas impulsadas por el aprendizaje automático que podrían ser útiles.

Bases de datos : primero aprenda MS SQL Server, comience a escribir lenguaje de consulta estructurado y experimente con tantos como pueda. Mongo DB también es útil, debes aprender Mongo, esto será más para ti.

Aprendizaje automático : se puede hacer una gran cantidad de ciencia de datos con consultas SQL como seleccionar, unir y agrupar, pero a veces debe hacerlo, probar algoritmos más simples como Naive Bayes y regresión lineal regularizada. una vez que domines en básico, puedes proceder a algos más complejos.

Visualización de datos: la ciencia de datos consiste en comunicar sus hallazgos y encontrar una parte increíblemente valiosa de eso. Python ofrece MATLAB, que es funcional, incluso si carece ascéticamente. R ofrece ggplot, que es agradable y más fácil de entender.

Estas son las cosas que puede considerar para estudiar y prepararse para el científico de datos.

Aquí hay listas útiles de clases que pueden ayudar a preparar a alguien para convertirse en un científico de datos: ¿Qué clases debo tomar si quiero convertirme en un científico de datos?

Aquí hay algunas clases de informática que serían útiles:

  • Teoría general de la programación (programación de introducción, estructuras de datos y algoritmos)
  • Aprendizaje automático
  • Visualización
  • Ingeniería de software

Big Data es el nuevo científico de datos de títulos de trabajo. Si bien no está vinculado exclusivamente a los proyectos de Big Data, el rol del científico de datos los complementa debido a la mayor amplitud y profundidad de los datos que se examinan, en comparación con los roles tradicionales … Puede visitar este enlace: Hadoop All in 1, ciencia de datos, estadísticas y probabilidad – Clases de capacitación de cursos combinados en línea | Hadoop All in 1, Data Science, Statistics and Probability – Cursos de cursos combinados en línea Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas, análisis y matemáticas.

Lo que distingue al científico de datos es la perspicacia empresarial fuerte, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es curioso, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “. Preguntas de la entrevista de ciencia de datos | Preguntas más frecuentes | Intellipaat

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Los científicos de datos son curiosos: exploran, hacen preguntas, hacen un análisis de “qué pasaría si”, cuestionan los supuestos existentes y procesan preguntas de entrevistas de ciencia de datos | Top y más solicitados | Intellipaat

Los datos se duplican cada dos años, y todos han oído hablar de los números de crecimiento absurdos indicados en los informes. En este contexto, el resultado inevitable es la aparición del Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y proyectar el mapa tecnológico para hacer posible la transición de datos a ideas. El alcance del trabajo de un científico de datos incluye la identificación de las fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

Por el momento, el papel de un científico de datos lo desempeña una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de esa clase. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que puedan estar más allá del ámbito de los modelos actuales y los problemas comerciales. El analista de negocios trabajaría en los datos que ha recopilado el científico de datos. James Kobielus, un analista senior de Forrester, en su negocio, llega a comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para trabajar con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con el surgimiento de una carrera de pleno derecho, esto pronto cambiará.

Las discusiones sobre quién está calificado exactamente para ser un científico de datos no difieren demasiado del debate que se sostuvo anteriormente sobre si, sin embargo, al principio, los expertos de la industria han indicado que un científico de datos debe tener una maestría en matemáticas o estadísticas. Mientras tanto, el CTO del grupo en Shoppers Stop dice: “Hay una escasez de profesionales a los que se les puede llamar científicos de datos. Por el momento, quien tiene pasión por trabajar con datos está llenando el vacío ”.

Un científico de datos trabajará en el desarrollo de nuevos algoritmos y presentará nuevos patrones e ideas sobre los datos que de otro modo permanecerían ocultos. “Junto con las estadísticas, un científico de datos puede tener una calificación en economía, y definitivamente necesita una docena o más de experiencia trabajando con diez a quince herramientas de BI”, dice Chuck Hollis, vicepresidente de marketing global y CTO, EMC.

un proveedor de servicios de análisis y ciencia de decisiones dice que “los científicos de datos también incursionarán en psicología experimental, antropología y ciencias sociales”. Con la necesidad de establecer centros de excelencia de BI (CoE), los análisis se institucionalizarán.

Con la llegada de las redes sociales impactando la mayoría de las facetas de los negocios, las organizaciones esperan integrar la tecnología, el software social y el BI para crear un entorno de toma de decisiones agradable. El científico de datos será responsable de proporcionar un contexto social a la información. BI y análisis bailan a una nueva melodía cuando adoptan nuevos enfoques como Hadoop. No esperan datos estructurados, limpios y prístinos, sino que trabajan con una mezcla de datos para proporcionar un análisis en tiempo real o cercano. La analítica descriptiva, la analítica inquisitiva, la analítica predectiva y prescriptiva son parte del nuevo paradigma, con el científico de datos en el centro.

La curva de evolución se está moviendo del soporte de decisiones a ser cada vez más operacional, con una progresión inminente que llevará la competencia estratégica a un nivel completamente nuevo con los científicos de datos en la imagen. BI entró en escena hace quince años y TI poseía estas iniciativas. Ahora, BI es una función comercial que involucra investigación de mercado con un enfoque central en análisis. Las compañías con grandes volúmenes de datos (internos y externos) irían a The Notion Market sin pestañear, pero las compañías más pequeñas lo pensarían dos veces antes de pagarle a alguien para hacer algo que su proveedor de BI les dijo que haría su producto de BI.

Sin embargo, no es que haya científicos de datos en abundancia, todos clamando por empleos. Por el contrario, como dice Hollis de EMC, “Hay una escasez de talento. Por cada científico de datos, hay treinta trabajos esperando “.

En respuesta a este problema, Analytics as a Service se presenta como una alternativa factible. La analítica como servicio aún es incipiente y evoluciona; A medida que crece la complejidad y emergen modelos de servicio maduros que están vinculados con los resultados y el éxito, la tasa de adopción aumentará. La posibilidad de contratar a un científico de datos a través de un proveedor de servicios de análisis es un paso intermedio para muchas EMPRESAS medianas y pequeñas

Complete un menor y tome algunas asignaturas optativas relacionadas con el aprendizaje automático y las bases de datos.