Cómo comenzar mi carrera en ciencia de datos como estudiante de primer año en India

Hola

Para iniciar una carrera en el dominio de Big Data como analista de datos o ingeniero de datos, necesita los siguientes requisitos previos:

Comprensión de la programación (Java es beneficioso para comprender MapReduce)
Comprensión de SQL
Aptitud Matemática

Si tiene los requisitos previos mencionados anteriormente, puede aspirar a una carrera prometedora en el dominio de Big Data.

¿Qué sistema operativo es mejor para Python, R y data science, Mac o Windows?
¿Cuál es el mejor programa de ciencia de datos?
¿Cuál es una explicación amable de GradientBoost?
¿Qué algoritmos se utilizan para resolver problemas de aprendizaje automático basados en gráficos?
¿Puedo usar RStudio para la minería de datos donde necesito tomar un conjunto de datos de detección de intrusos? ¿Alguna sugerencia?

Y su exitoso comienzo en una carrera como analista de datos o ingeniero de datos requerirá una comprensión profunda de lo siguiente:

Hadoop Stack (HDFS, Zookeeper, Yarn, MapReduce, Pig, Hive, Sqoop, Flume, Oozie, etc.)
Spark (Scala, conceptos básicos de Spark, RDD, Kafka, DataFrames, limpieza de datos, Spark Streaming, Spark SQL, Hive-on-Spark, procesamiento y análisis de gráficos, aprendizaje automático, GraphX, SparkR, etc.)

Y aunque aprender Hadoop solo puede ayudarlo a comenzar, le recomiendo sinceramente aprender Hadoop y Spark, ya que Spark tiene mucho más potencial.

Con esta comprensión, nosotros en CloudxLab hemos diseñado nuestro curso sobre “Big Data con Hadoop & Spark” para que los aspirantes como usted puedan completar el curso y comenzar su carrera en Big Data. Puedes consultar los detalles aquí. También tenga en cuenta que aprender los conceptos será beneficioso solo cuando realice prácticas en un grupo real de computadoras a las que se pueda acceder en línea desde cualquier lugar y desde cualquier dispositivo, y en CloudxLab proporcionamos esta plataforma para la práctica práctica real. .

Por supuesto, también debe explorar otras opciones antes de decidir.

Big DataCiencia de datosOrientación profesionaltrabajos y carreras

¿Cuál es una mala manera de comenzar a aprender ciencia de datos, aprendizaje automático y aprendizaje profundo?

¿Existe algún beneficio de saber que Java debe seguir el camino de ser un científico de datos o puede tomarse como un complemento? (Java-as Map reduce los requisitos previos: análisis de Big Data)

¿Es cierto que la mayoría de los científicos de datos tienen al menos un título de maestría o doctorado?

¿Qué empresas están haciendo aprendizaje automático real en lugar de ciencia de datos hacky?

¿Qué clases de CS son las más importantes para un ingeniero de big data?

¿Cómo se convierte uno en científico?

Para los graduados más avanzados en ingeniería o matemáticas / estadísticas, el enfoque se centra más en la resolución de problemas analíticos y la exposición a algún lenguaje de programación. Y luego pueden postularse a las empresas de análisis, ya sea a través de ubicaciones en el campus o unidades de colocación fuera del campus, y tratar de acertar en su proceso de entrevista.

La capacitación en ciencia de datos de habilidades de TI se ha estructurado para aquellos que desean desarrollar los conocimientos y habilidades avanzados necesarios para trabajar como científicos de datos. Obtenga su certificación de ciencia de datos y destaque, ya sea que esté buscando cambiar de trabajo, obtener una promoción o mejorar sus habilidades actuales.

Data Science Certificate Training ha sido diseñado para prepararlo para un trabajo en el espacio analítico. El curso de certificación de ciencia de datos lo convertirá en un experto en la comprensión del problema, el diseño del análisis y la aplicación de técnicas de modelado predictivo utilizando R para obtener información comercial de los datos. R es el lenguaje de programación más utilizado hoy en día en el campo de la ciencia de datos y el análisis.

En el programa de certificación de ciencia de datos, obtendrá habilidades en gestión de big data, análisis avanzado, aprendizaje automático y visualización de datos, junto con las habilidades de comunicación esenciales que necesitan los científicos de datos de hoy.

El papel de un científico de datos ya se ha ganado el apodo de “el trabajo más sexy del siglo XXI”. Según un informe del Instituto Global Mckinsey [, habrá una escasez de 140,000 a 190,000 profesionales de la ciencia de datos para 2018 solo en EE. UU.

En lo que respecta a la India, hay algunos estudios que creen que la industria de análisis / ciencia de datos en la India se encuentra en una fase en la que TI estuvo hace unos 10-15 años y, por lo tanto, se puede esperar un auge en la externalización de análisis a la India.

También creo que India con su grupo de talentos de ciencia de datos / análisis puede muy bien ser el líder en esta industria. Ya hay algunas historias de éxito como Mu Sigma y Fractal analytics. Además, ahora estamos viviendo oficialmente en la era del “Big Data”.

Shaunak Sirodaria

La carrera de ciencia de datos implica una combinación de habilidades en torno al manejo de datos, modelado y habilidades de presentación. Si planea comenzar una carrera en este campo, sugeriría que primero analice el dominio de SQL y la herramienta de programación como R. Esto debería ayudarlo a solicitar puestos de Analista de datos. Gradualmente, puede ver cómo desarrollar habilidades en torno a estadísticas, aprendizaje automático y / o presentar ideas a equipos de negocios. Espero que entiendas que es muy difícil ser un experto en todas estas áreas. Durante un período de tiempo, sabrá qué área le gusta más y luego podrá planificar profundizar su conocimiento y crecer en la carrera profesional adecuada. Un ejemplo de carrera profesional podría ser Data Analyst> Sr Data Analyst> Jr Data Scientist> Senior Data Scientist
Espero que esto ayude.
Gracias

Sathyanarayanan Mudhaliyar

Servicios de capacitación en habilidades de TI La capacitación en ciencia de datos se ha estructurado para aquellos que desean desarrollar el conocimiento avanzado y las habilidades necesarias para trabajar como científicos de datos. Obtenga su certificación de ciencia de datos y destaque, ya sea que esté buscando cambiar de trabajo, obtener una promoción o mejorar sus habilidades actuales.

No hay un requisito previo específico para el curso, pero la exposición al núcleo de Java y la capacidad matemática serán útiles. IT Skills puede brindarle cursos gratuitos a su propio ritmo que cubran las necesidades de Hadoop, R y el controlador para mejorar los conceptos básicos necesarios para el curso.

Shaunak Sirodaria

El primer paso para comenzar una carrera en Data Science es adquirir las habilidades y para eso debes inscribirte en un programa de Data Science. Hay muchas opciones disponibles donde puede aprender Ciencia de datos. Sin embargo, aprender de un instituto creíble le dará una ventaja competitiva. Intellipaat es un instituto ampliamente conocido y reputado que ofrece un amplio curso de ciencia de datos que cubre todos los aspectos importantes.

Para dar un buen comienzo a su carrera en Data Science, necesita obtener una certificación. Cloudera es uno de los proveedores de certificación más valiosos e Intellipaat lo ayuda a obtenerlo sin ningún esfuerzo adicional. Completar un programa de capacitación le brinda una exposición equivalente a seis meses de experiencia en la industria. Por lo tanto, ya no se mantendrá más fresco y comenzar una carrera será más fácil para usted.

Mira este video de Data Science:

Anupriya Kamra

Primero, solo tenga una idea aproximada de lo que son los grandes datos y si está realmente interesado, tome cualquier curso en línea. Comience con Hadoop, Spark y realice los cursos de minería de datos.

El analista de Big Data

Supongo que por ciencia de datos te refieres al análisis de datos. Busca un buen instituto y haz entrenamiento. Pueden ayudarte a conseguir un trabajo también …

El analista de Big Data

More Interesting

¿Puedo convertirme en un científico de datos sin aprender Python, pero solo con conocimientos de programación Java y aprendiendo el lenguaje R?

Aprendizaje profundo: ¿Cuándo aplicamos la eliminación de ruido en el codificador automático de eliminación de ruido?

¿Cómo se negocian los datos?

Quiero hacer un análisis de datos sobre datos sanitarios. ¿Dónde puedo encontrar estos conjuntos de datos?

¿Cuál es la mejor manera de elegir el número de componentes en PCA durante la reducción de dimensionalidad?

¿Cuál es la forma más rápida de realizar un EDA en un conjunto de datos con más de 100 variables?

¿Addepar tiene roles de tipo científico de datos?

¿Cuáles son algunos buenos proyectos sobre aprendizaje automático y minería de datos?

¿Cómo tenemos equilibrio de carga en los reductores en caso de sesgo de datos?

¿Utiliza bibliotecas o código usted mismo cuando usa un algoritmo de aprendizaje automático? ¿Qué hace un científico de datos con esto en su trabajo?