¿Cuál es la mejor manera de comenzar con la ciencia de datos?

Gracias Tarun Kumar MM por A2A.

El objetivo principal en la ciencia de datos es hacer el análisis cualitativo más alto de los mayores fragmentos de datos en el mínimo tiempo posible. Aquí hay un algoritmo para su consulta.

Paso 1- Aprenda el concepto de álgebra lineal , teoría de la probabilidad y estadística, cálculo multivariado. Lea la respuesta de Adarsh ​​a ¿Qué libros de matemática y álgebra lineal debo consultar para ingresar al aprendizaje automático? Deben ser adecuados para el autoaprendizaje.

Paso 2- Antes de comenzar con la ciencia de datos, conozca el propósito y las diferencias entre varios términos. He notado que algunas personas con 1 año de experiencia en este campo incluso no pueden diferenciar los términos. Lea la respuesta de Adarsh ​​a ¿Cuál es la diferencia entre análisis de datos, big data (Hadoop) y ciencia de datos? ¿Puedes explicar cada uno de ellos y cuál es la relación entre ellos? y la respuesta de Adarsh ​​a ¿Cuál es el propósito del análisis de datos?

Paso 3- Aprende cualquiera de los lenguajes de programación entre R y Python. Lea la respuesta de Adarsh ​​a Buscando comenzar una carrera en Data Science, ¿cuál de estos tres lenguajes de programación debería aprender primero: R, Python o SAS?

Paso 4- Comience con cualquier libro de Big Data y canales de YouTube en línea para comprender el concepto. Le ayudarán a comprender el concepto en secuencia. Hay muchos buenos canales de YouTube que ofrecen tutoriales gratuitos y aprendizaje paso a paso. Lea la respuesta de Adarsh ​​a ¿Cuáles son los mejores libros para aprender Big Data?

Paso 5- Una vez que obtenga el concepto básico, comience a practicar con problemas de la vida real desde el más simple en Your Home for Data Science

Paso 6- Para agudizar su habilidad y exposición en la industria, puede asistir a algunos cursos de capacitación y certificación. Al optar por el instituto, tenga cuidado ya que hay mucha publicidad en este campo. No vayas con instituto, ve con los mejores entrenadores. Lea la respuesta de Adarsh ​​a ¿Qué curso de certificación debería optar, big data y Hadoop, o Hadoop y Spark?

Paso 7- Mantén la paciencia en todos los pasos y no te rindas. Lea la respuesta de Adarsh ​​a ¿Qué tan difícil es estudiar análisis de datos?

Paso 8: ¡ Ya terminaste! Enhorabuena 🙂

Buena suerte, mis mejores deseos 🙂

Su pregunta implica que cree en la planificación y luego en traducir las cosas en acción. Según mi experiencia, tengo las siguientes sugerencias para usted. El aprendizaje no ocurre de la noche a la mañana, así que aproveche una buena cantidad de tiempo. Estos son los pocos temas que deberían cubrirse en Data Science.

Matemáticas y estadísticas: las matemáticas y las estadísticas juegan un papel importante en la cuantificación del mundo que nos rodea. Las máquinas solo entienden los números y para tratarlos eficientemente, las matemáticas y las estadísticas juegan un papel importante. La mayoría de los problemas comerciales se pueden traducir en problemas orientados a los datos para comprenderlos, obtener información y brindar soluciones basadas en datos. Coursera ofrece un curso intensivo sobre Matemáticas. Para probabilidad y estadísticas, lo siguiente sería útil: Introducción visual.

Programación: la programación de computadoras es el quid de la ciencia de datos. Se puede usar uno de los siguientes lenguajes: R, Python, SAS, MATLAB, SPSS, MySQL y Java, para escribir un código / programa que lo ayudará a trabajar en los datos. Ahora aquí, hay mucho debate = sobre cuál de los dos, Python y R, es el más adecuado para la tarea. Ambos idiomas tienen sus propios pros y contras. R fue construido por estadísticos y Python fue construido por programadores. Personalmente, recomendaría Python ya que es un lenguaje multipropósito general y tiene muchas bibliotecas de visualización como Bokeh, Seaborn y Pygal. Python tiene un increíble poder de scripting que ayuda en el manejo de miles de archivos, raspando sitios web, solicitando diferentes API. Esto debería ayudarlo a comenzar con Python. Introducción a Python

Vaya avanzado: hay ciertas habilidades que simplemente no puede aprender haciendo algunos cursos en línea, siempre se recomienda asistir a un programa en un modelo de aula con una persona experimentada. Y, por lo tanto, para el próximo conjunto de aprendizaje en Data Science, recomendaría a los aspirantes que asistan a un programa que

está basado en el aula, dirigido por un instructor y muy orientado a la práctica. Asegúrese de que el énfasis de su curso esté más en la práctica y no solo en la teoría.

Esto debería ayudarlo a comenzar su viaje, ¡buena suerte!

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa emblemático altamente selectivo de Gray Atom tiene como objetivo ser mentor de los profesionales que trabajan y novatos en el inicio de su carrera en Data Science. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Antes de comenzar con la ciencia de datos, debe saber preguntar solo una cosa.

POR QUÉ ?

Si puede responderlo satisfactoriamente y no lo está haciendo solo porque alguien lo llamó “el trabajo más sexy del siglo XXI” o le pagará bien, entonces definitivamente está aquí por el deseo de hacerlo.

Esto significa que definitivamente tiene un interés genuino en este campo y ahora es el momento para que primero desarrolle aún más su mentalidad, lo que hace que la ciencia de datos sea divertida y emocionante para usted, y también desarrolle habilidades, ya sea idiomas, participar en competiciones, etc.

La mayoría de las personas generalmente tienen esta noción de que la ciencia de datos se trata de usar algoritmos poderosos, aprender un idioma, ejecutarlo en datos y obtener resultados, pero eso es lo que haces, pero no es todo cómo lo haces.

La ciencia de datos se trata de usar sus instintos, habilidades de exploración para analizar datos, tomar tiempo, desarrollar características, tener esa curiosidad por construir modelos predictivos que no solo den resultado, sino que se puedan interpretar fácilmente para muchas personas en términos simples.

Es importante tener una mentalidad científica que le permita verificarse a sí mismo escribiendo a veces una línea de código incorrecta y verificando los errores por los que salió mal, aprendiendo de ellos y aprendiendo enfoques de un problema del código de otros de mejor desempeño y viendo las cosas de manera diferente.

Nota : después de leer el enunciado del problema, no salte directamente a la visualización de datos, tome un papel y piense qué características o variables debe tener o podría crear y luego intente abrir los datos de entrenamiento y ver las características dadas

Prácticas como las anteriores perfeccionan tus habilidades para convertirte en un científico de datos superior.

Puede mirar a los mejores científicos de datos y una cosa que puede observar es que no están allí porque tienen un alto coeficiente intelectual, sino por su amor por el análisis, la curiosidad por los datos, esa habilidad para pensar en un problema durante horas continuamente.

Comenzar es realmente bastante simple, pero si tiene un objetivo final en mente (es decir, una carrera versus solo por diversión) determinará cómo debe hacerlo.

La forma más fácil de comenzar, y la forma en que comencé, era comenzar con cursos gratuitos en línea. La especialización en ciencia de datos de Coursera es un buen lugar para comenzar, y puede tomar todos los cursos de forma gratuita como una auditoría.

Recopilé una lista de cursos de ciencia de datos en mi sitio si está interesado en comparar diferentes plataformas, pero he encontrado que la pista de Coursera es una forma realmente fácil de ingresar a la ciencia de datos con bastante rapidez.

No esperes saltar a un proyecto real, incluso si es pequeño. Poner sus habilidades a trabajar en algo que le interese de inmediato solidificará su nuevo conocimiento y obtendrá algunos ejemplos de proyectos en su haber.

Kaggle es un buen lugar para encontrar proyectos interesantes donde puede ganar dinero para soluciones, e incluso tienen algunas competencias de práctica en las que puede trabajar para ver cómo es trabajar en un proyecto de ciencia de datos y dónde están sus brechas de conocimiento.

Por lo tanto, suponiendo que ya tiene los conocimientos matemáticos y de programación necesarios, debería poder saltar directamente al aprendizaje de habilidades de análisis de datos y comenzar un proyecto con bastante rapidez.

Hay una gran demanda de científicos de datos. Comenzar con la ciencia de datos no es difícil. Cuando una persona que comienza a aprender ciencia de datos surge una pregunta común: cómo y dónde puedo comenzar. Con una lista de libros podemos aprender más cosas. La ciencia es un campo amplio y algo difícil de aprender. Si un principiante comienza a aprender Data Science, entonces se necesitan los conceptos básicos de matemática y estadística. Hay muchos roles en la industria de la ciencia de datos como el experto en visualización de datos, un experto en aprendizaje automático, un científico de datos, ingeniero de datos, etc.

Después de decidir un rol, debe comprender ese rol en particular. Un científico de datos tiene una gran demanda. Se necesita un control final sobre cada tema en la ciencia de datos. Aprender sobre redes neuronales, reconocimiento de imágenes y otras técnicas de vanguardia es importante. Una técnica para iniciar proyectos es encontrar un conjunto de datos que le guste.

Aquí hay algunos buenos lugares para encontrar conjuntos de datos para comenzar:

  • 18 lugares para encontrar conjuntos de datos
  • Conjunto de datos subreddit
  • Depósito de aprendizaje automático UCI

La elección de la herramienta ayudará a aprender rápidamente. Algunos consejos para aprender ciencia de datos

  • Asegúrese de hacer todos los ejercicios y tareas para comprender las aplicaciones.
  • Trabaje en algunos conjuntos de datos abiertos y aplique su aprendizaje. Incluso si inicialmente no comprende las matemáticas detrás de una técnica, comprenda los supuestos, lo que hace y cómo interpretar los resultados. Siempre puede desarrollar una comprensión más profunda en una etapa posterior.
  • Eche un vistazo a las soluciones de las personas que han trabajado en el campo. Podrían identificarlo con el enfoque correcto más rápido

Para obtener más información: BEPEC | ¿Por qué ciencia de datos? Bangalore

Big Data, Data Science, Machine Learning son el futuro. El futuro es la automatización y tienes que seguir cambiando tus habilidades con la tecnología. Es bueno saber que has elegido aprender ciencia de datos. Para comenzar a aprender ciencia de datos, debe conocer varias habilidades como estadísticas, matemáticas básicas, buenas habilidades de programación.

Ya he respondido algunas preguntas antes sobre quora. Léalo, sabrá más sobre cómo iniciar la ciencia de datos en detalles.

La respuesta de Sukesh Kumar Ranjan a ¿Cuál es la forma ideal de convertirse en un científico de datos?

La respuesta de Sukesh Kumar Ranjan a ¿Es difícil convertirse en un científico de datos a través del autoaprendizaje?

Simplemente comience a jugar con los datos que le interesan. Se pueden hacer muchas cosas en una hoja de cálculo. Puede que tenga que cortar los datos para que quepan, pero funciona. Puedes jugar con Python, R o Julia y un conjunto de datos. Si el conjunto de datos es realmente grande y usted es útil en la línea de comandos de Unix, puede hacer todo tipo de análisis allí (mi primera opción normal dado el tamaño de los conjuntos de datos con los que normalmente trato).

Responda preguntas, examine pequeños subconjuntos, construya las estadísticas de las características que encuentre. ¿Crees que es interesante que veas mucha gente zurda en Idaho? Filtre los datos hacia Idaho y cuente cuántas personas diestras y zurdas hay en el conjunto de datos. ¿Es un sesgo en su observación o muestra, o encontró algo interesante? Repita el uno para el otro estado si lo hizo. Realmente, solo comienza a ensuciarte las manos.

Los recuentos crudos de cosas son un excelente punto de partida. A partir de ahí, puede desarrollar muchas otras medidas estadísticas. Los histogramas son recuentos para cada tipo de valor y una forma increíble de describir los datos que acaba de conocer. A medida que se familiarice con un conjunto de datos, deseará utilizar técnicas más avanzadas, pero es bueno probarlas con datos que conoce y tiene que simplemente leer sobre ellos.

Sigue ensuciándote las manos y encontrando nuevas técnicas para aplicar.

Sugeriría simplemente trabajar en un proyecto. La experiencia práctica es la mejor manera de aprender big data. Hay muchas bases de datos públicas de datos interesantes por ahí. Por ejemplo, el atlas del genoma del cáncer (TCGA) o el proyecto de 1000 genomas (tiene mucho más que miles) en las ciencias biomédicas, o hapmap. Puede probar su enfoque de aprendizaje automático favorito en él. Si necesita más orientación que eso, comuníquese con un profesor de una universidad (como yo), en ciencias de la información, especialmente los docentes no tienen suficientes aprendices para hacer todos los proyectos para los que tienen ideas y tratar de establecer una colaboración. Pueden refinar sus preguntas o formular mejor su problema o sus técnicas. Obtener una publicación, incluso una pequeña, puede aumentar sus credenciales bastante.

¿Qué es lo que hay que hacer?

  • Siga los blogs y los mejores científicos de datos.
  • Asistir a reuniones de ciencia de datos.
  • Descubre más sobre la vida de un científico de datos

Hora de elegir su especificación de análisis de datos

Principalmente, tiene cuatro opciones para aprender análisis de datos:

  • Aprendizaje de análisis de datos usando python
  • Análisis de datos usando R
  • Usando SAS
  • Análisis de datos usando Excel

Aprender de manera práctica y resolver proyectos de datos en realidad lo ayudaría a obtener una carrera mejor y prometedora con el Curso de análisis de datos de Digital Vidya.

Me gustaría compartir uno de los mejores cursos de análisis de datos en línea diseñados por vidya digital, donde aprenderá de los mejores expertos de la industria.

  • Si bien este curso le presenta Excel, Python, R y SAS , le ofrece la flexibilidad de dominar cualquiera de las 4 rutas más populares: Python, R o SAS, Excel

Leer más: ¿Qué es mejor para el análisis de datos: R o Python?

¿Cuál es la demanda actual de científicos de datos?

Implemente su aprendizaje prácticamente

Proyecto en el que trabajarás en este curso:

  • Proyecto 1: Proyecto de manipulación de datos (5 días): corte y corte en cuadritos el conjunto de datos relacionado con el fraude de tarjetas de crédito para extraer información valiosa
  • Proyecto 2: Proyecto de visualización de datos (5 días) – Tableau a “Python”
  • Proyecto 3: Proyecto de minería de datos (5 días): utilice la técnica de minería de datos para realizar análisis predictivos en un conjunto de datos hipotecarios.

Leer más: ¿Cómo aprendo Ciencia de datos al “hacerlo”?

¿Quieres saber más sobre análisis de datos? Asista a una sesión de demostración gratuita conducido por mí en la carrera de análisis de datos donde compartiría todo el proceso paso a paso para comenzar su carrera en esta industria.

Espero verte en el seminario web.

Los mejores veredictos son siempre valiosos

Dado que la ciencia de datos siempre da respuestas demasiado precisas, por lo que confiar en sus resultados en la decisión perfecta se podrían tomar las responsabilidades comerciales. Las resoluciones hechas sobre la base correcta y la orientación siempre son correctas. Aquí vienen las consecuencias de DataScience en el mundo de la tecnología. Para tomar las decisiones, las empresas ya no requieren a esos viejos empleados. Los propios trabajadores de la ciencia de datos descubren los datos y calculan el resultado, por lo tanto, llegan a una decisión final. Además, la ciencia de datos da la idea de la tecnología futura. Por lo tanto, las compañías que usan la ciencia de datos se mantienen dos pasos adelante que la tecnología actualizada en sí. Por lo tanto, lo lleva a la competencia tecnológica y, en caso de que, si se practica bien, esta ciencia lo lleve a ser el ganador final.

Porque su negocio necesita la mejor tecnología

Si desea hacer crecer su negocio, siempre tiene que depender de las últimas marcas de tecnología, y Big Data es una de ellas. Dado que siempre dan verdaderas consecuencias, usarlo para aumentar el tráfico de clientes siempre compromete el resultado lucrativo.

La analítica ha llegado a un punto en el que los analistas de negocios pueden rastrear cada paso de sus clientes o clientes objetivo. Cada paso de los clientes incluye lo que hacen, lo que compran, qué tipo de productos buscan, cuáles son sus requisitos básicos, qué productos desean pero no pueden comprar debido al alto precio. La analítica de la ciencia de datos proporciona resultados correctos en un 99,9 por ciento en el hospital, como conclusión de que los datos del cliente que las empresas que usan la ciencia de datos son correctos en lo esencial.

Para empezar, hay muchos recursos en Internet para empezar. Si bien la ciencia de datos no es realmente un campo en sí misma, consta de una serie de subcampos diferentes que la componen. Puede inscribirse en un curso intensivo en línea hoy simplemente buscándolo en Google o puede buscar aprender cada subcampo en este orden

  1. Fundamentos estadísticos
  2. Álgebra lineal
  3. Programación (sugeriría Python, si recién está comenzando)
  4. Programación científica (por ejemplo, familiarizarse con Pandas o Scikit-learn en Python)
  5. Aprendizaje automático (técnicas analíticas específicas para tomar datos transformados y extraer información)

¡Espero que esto ayude!

Más allá de tomar cursos de programación y estadísticas, los aspirantes pueden hacer todo lo posible para ensuciarse las manos y trabajar con datos reales. Regístrese para participar en hackathons u ofrezca ayudar a una startup local abordando un problema de datos que tengan. Los cursos y libros son excelentes para desarrollar habilidades técnicas fundamentales, pero muchas habilidades de ciencia de datos no se pueden desarrollar adecuadamente en un aula donde los conjuntos de datos están bien preparados.

Hay una serie de empresas para quienes sus datos (o su plataforma de análisis de datos) son su producto. En este caso, el análisis de datos o el aprendizaje automático pueden ser bastante intensos. Esta es probablemente la situación ideal para alguien que tiene una formación formal en matemática, estadística o física y espera continuar por un camino más académico.

Al menos un conocimiento básico de estadística, cálculo multivariable, álgebra lineal, visualización y comunicación de datos es vital como científico de datos.

Atentamente !

Menciono lo que no se ha dicho en esta publicación. Adarsh, Sukesh y Jatinpal en esta publicación han proporcionado detalles bien requeridos.

Principalmente Data Science es un área de gran pasión.

Para empezar:

  1. Debe seleccionar un mínimo de un área de conocimiento de experiencia. Ese será su objetivo y su carrera, por ejemplo, informática de la cosmología, informática de la física cuántica, informática química, bioinformática, gestión de la cadena de suministro, investigación de mercado con análisis de datos, gestión de la cartera, climatología, muchos, muchos, muchos más.
  2. Debes entrenar para ser excelente con los métodos estadísticos para el procesamiento de datos, el análisis y la previsibilidad.
  3. Realice un excelente programa de capacitación en ciencia de datos, preferiblemente una clase diaria de 1 hora con al menos 3 a 7 horas de práctica para asegurarse de mantener el ritmo de su pasión. Un mínimo total de 150 horas de sesiones en la sala de clase y de 500 a 750 horas de práctica pueden hacer que sea competente para asistir a las entrevistas.

Finalmente, SOLO las personas que tienen absoluta pasión y capacidad para procesar números para el análisis de datos y la capacidad de inventar / improvisar métodos para procesar datos necesitan ingresar a esta área.

Esta es un área altamente no técnica en términos de informática y programación. Será un gran error identificar esto con una carrera en programación.

Esta es una muy buena trayectoria profesional para las personas que se dedican al análisis empresarial (gestión de la cadena de suministro, investigación de mercado que incluye análisis de datos, gestión de cartera, etc.) o análisis técnico (informática cosmética, informática de física cuántica, informática química, bioinformática, etc. )

Las personas que ya son analistas de negocios, expertos en la materia, expertos en dominios o analistas técnicos, esta ciencia de datos puede ser el paso natural hacia una carrera ilimitada con los mejores paquetes de pago.

Termine.

Como ha llegado a cuestionar cuál es la mejor manera de aprender Data Science, esto significa que en este punto ha decidido aprender Data Science. Ahora navegará por Internet y buscará información básica sobre Data Science. Gran cantidad de material gratuito está disponible en Internet. Le dará una visión general de la ciencia de datos. Algunos sitios web ofrecen una muy buena explicación detallada sobre Data Science. Primero hablaremos sobre el material gratuito disponible en Internet. Obtendrá material gratuito, pero para ello tendrá que visitar muchos sitios web que contienen diferentes tipos de material. Tomará un poco de tiempo y puede confundirse a qué referirse. A medida que obtiene mucho material gratuito, no es posible evaluar la calidad del material, ya que es nuevo en Data Science. Para referirse a dicho material, debe tener una idea clara sobre Data Science. Cada vez no está seguro de que obtendrá el material adecuado que lo capacitará para ser un experto en Data Science.

La otra forma es comprar libros de Data Science y comenzar a aprender. Pero, ¿cómo va a decidir qué libro es mejor y fácil de entender? Tendrá que referir numerosos libros para esto y deberá seleccionar el libro que encuentre mejor. Mientras revisa dichos libros, obtendrá consultas y éstas deberán resolverse de inmediato. A menos que resuelva las consultas, no podrá continuar. Eso significa que nuevamente estás atascado con consultas.

Entonces, si planea hacer una carrera en Data Science, no tendrá que perder el tiempo buscando en Internet o seleccionando el mejor libro y comience a aprender. Necesitará una persona que pueda enseñarle y guiarlo, que ya esté capacitado y tenga una experiencia en tiempo real en Data Science. Al capacitarse con dicha persona, podrá aprender más rápido y resolver sus consultas de inmediato con la ayuda del entrenador.

Entonces, ¿dónde obtendrás ese entrenador? Te sugiero que vayas a RStraining el mejor instituto para la ciencia de datos en Hyderabad. Tienen un entrenador en tiempo real que ya está trabajando en conocimiento de Data Science. No solo enseñarán la parte de la teoría y aclararán sus conceptos, sino que también compartirán su conocimiento de la experiencia laboral en vivo. RStraining ofrece capacitación en el aula, capacitación en línea, capacitación corporativa. Puede ir a la capacitación en el aula si está en Hyderabad o planea visitar Hyderabad para recibir capacitación. Además, puede ir a la capacitación en línea de Data Science desde cualquier parte del mundo. Obtendrá pleno apoyo y una formación fantástica del instituto RStraining. Puede contactar a RStraining en los detalles de la siguiente mención

Contacto

Llamada: +91 9052 699 906

Correo electrónico: [email protected]

RStraining

Hola,

Nos complace que esté eligiendo una de las carreras en demanda en Data Science.

Hacer que las carreras exitosas en Data Science sean de un entorno tecnológico junto con un conjunto de habilidades específicas como, por ejemplo,

1. Comprender las estadísticas

2. Programación estadística, y

3. Conocimiento profundo de las herramientas de análisis.

En Imarticus ayudamos a aspirantes como usted a actualizarse y comenzar una carrera como analista de datos. Amplios proyectos, estudios de casos y tutoría son algunos de los aspectos más destacados de nuestros cursos, ya que creemos en “Aprender haciendo”, que nos ha ganado varios reconocidos premios en la industria.

Si desea sobresalir en una carrera en Data Science, puede considerar uno de nuestros cursos en colaboración con Genpact, como Knowledge Partner.

Ofrecemos el Data Science Prodegree que lo ayuda a comprender en profundidad el análisis de datos y las estadísticas, junto con las perspectivas comerciales y las prácticas de vanguardia que utilizan SAS, R, Python, Hive, Spark y Tableau.

Además de esto, el programa también proporciona asistencia de colocación del 100% para guiar y ayudar a navegar por amplias opciones de carrera y prepararlo para el trabajo desde el día 1.

Para saber más sobre nuestros programas, visite nuestro sitio web . O bien, visite nuestro centro con sede en Mumbai, Pune, Hyderabad, Chennai, Coimbatore, Bangalore y Delhi.

Podemos comenzar a llevarte al camino correcto este 2018.

Espero que esto te ayude en tu proceso de toma de decisiones.

Todo lo mejor..:)

Si está interesado principalmente en la ciencia de datos solo para desarrollar su conocimiento, hay muchos recursos gratuitos disponibles en línea. Sin embargo, si desea comenzar con la ciencia de datos con el objetivo final de desarrollar una carrera en ella, le sugiero que comience a mejorar sus habilidades y luego se inscriba en un curso adecuado de ciencia de datos.

Para convertirse en un científico de datos exitoso, necesitará estar bien versado en lenguajes de programación, principalmente Hadoop, R, SQL, Python y Tableau. El conocimiento estadístico también es esencial para los profesionales de la ciencia de datos. Además, también necesitará tener excelentes habilidades de visualización de datos y habilidades para resolver problemas.

Hay varios cursos en línea disponibles para desarrollar o mejorar estas habilidades y prepararse para una carrera en ciencia de datos. De lo contrario, podría inscribirse en un curso corto que cubra todas las habilidades necesarias que necesitaría un científico de datos. Al mismo tiempo, estos cursos cortos pueden ser más ideales para profesionales que ya tienen cierto nivel de experiencia en el campo.

Para los principiantes completos, sería mejor comenzar con un curso PG muy completo, como el Diploma PG en Ciencia de Datos de Manipal ProLearn, otorgado por la Academia de Educación Superior Manipal. Este curso lo ayudará a comenzar desde lo básico, como programación para ciencia de datos, sistemas de administración de bases de datos, técnicas estadísticas para ciencia de datos, etc. También cubrirá el desarrollo avanzado de habilidades en aprendizaje automático y tecnologías avanzadas de Big Data, entre otras materias relacionadas.

Data Science es un archivo muy amplio que incluye muchas etapas y el análisis de datos es solo una de ellas.

Para completar su proyecto en ciencia de datos, debe tener una idea sobre estos pasos:

  1. Identifique la fuente de datos, que creo que es la parte más importante, ya que es la base de su análisis. por ejemplo, Facebook, Twitter, datos móviles, datos web, etc.
  2. Almacenamiento de datos, que incluyen soluciones de big data como: soluciones Hadoop o NoSQL como Mongodb o soluciones RDBS como Oracle, MSSQL, etc.
  3. Datos de limpieza: que incluyen eliminar el ruido de los datos
  4. Análisis de datos, que incluyen ML, AI, herramienta de análisis, lenguaje de programación como Python, R, etc.
  5. Le presentamos datos analizados: gestión de proyectos, licenciatura, etc.

Ahora, los primeros 3 están bajo soporte OPS y los últimos 2 están bajo DEV.

¡Comience con nosotros, somos el mejor proveedor de capacitación en el mundo!

Mucho se ha dicho sobre la ciencia de datos y su importancia en el mundo corporativo actual. En el mundo corporativo, casi todas las decisiones se toman en base a un análisis cuidadoso y científico de los datos. Los datos se han generado en petabytes y Exabyte a diario. Los datos solo van a crecer, eso también a un ritmo extremadamente rápido. Entonces, una cosa es segura de que Data Science no es una burbuja que explotará en algún momento, sino que irá mucho más avanzada y más rápida en los próximos días. En este artículo descubrirá qué son estos “datos” y qué es la “ciencia de datos” y qué significa para usted.

La ciencia de datos se puede definir como una combinación de varios métodos, procesos y sistemas científicos para extraer información de los grandes conjuntos de datos (que de otro modo estaría oculto). Desde el surgimiento de Internet, ha habido un aumento constante en el aumento de datos, y la introducción de plataformas de redes sociales como Facebook, Twitter, Instagram, etc., junto con los teléfonos inteligentes avanzados ha contribuido enormemente en la generación de datos. . Independientemente de lo que haga un individuo en las plataformas de redes sociales, comparta una publicación, publique un comentario, como un anuncio, e incluso una simple búsqueda se registra y agrega a la enorme cantidad de datos.

Todo está en línea hoy. De la lista de amigos de las personas, el comportamiento de compra, las imágenes, lo que les gusta y lo que no les gusta, su opinión sobre una cosa o tema en particular, etc. Todos estos detalles (datos) sobre las personas pueden analizarse científicamente y utilizarse para crear un mejor entorno en línea. Desde sugerir los libros, películas y videos que podrían gustarles, o sugerir un artículo que podría estar interesado en comprar.

Un ejemplo incluiría, Netflix, utiliza los datos de millones de usuarios con respecto a las películas y los programas que han visto, los actores que les gustan y el tipo de películas que les gustan. Después de ejecutar un algoritmo avanzado (parte de la ciencia de datos) en estos datos, vienen con la lista de películas o programas que un individuo estará más interesado en ver y comienzan a “sugerirles” estas películas.

Es posible que ya haya notado lo mismo en YouTube, cuando ve pocos videos en YouTube; comienza automáticamente sugiriéndote más videos según lo que viste. Esto puede parecer muy simple, pero hay algoritmos complejos que se ejecutan en segundo plano que lo hacen posible.

Los datos pueden haber recorrido un largo camino, pero la verdad es que apenas ha comenzado. Existe un enorme potencial en el campo de la ciencia de datos y campos relacionados como el aprendizaje automático y la inteligencia artificial.

Para agregar a la respuesta de Feyzi Bagirov, la exploración de datos puede ser incluso cosas simples como tomar la media de una determinada variable en un conjunto de datos o el rango de alguna otra variable. No siempre es necesario encontrar insights utilizando algoritmos de aprendizaje automático difíciles.

Además, aunque creo que las clases en línea como en Udemy o Coursera son incompletas en sí mismas, son buenas para mojarse los pies en esas bibliotecas de ciencias de datos como Numpy, Python, Scikit-learn, etc. Curso de aprendizaje automático de Andrew Ng Machine Learning El | Coursera tiene buena reputación por aprender algunos algoritmos comunes. (No me pagan ni nada para vincular esto)

Nota: Intente leer un libro sobre estadísticas básicas (media, varianza, correlación, distribuciones (gaussian y poisson son algunas de las más importantes), teorema de bayes, intervalos de confianza) para que cuando ingrese a cursos en línea su cabeza no gire .

Hola shobham

En realidad me inspiraste para escribir un blog hoy. Traté de responder esta pregunta en detalle en mi blog. Visite una vez, lea y comente si desea discutir algo en particular.

¿Cómo iniciar su carrera en análisis de datos después de graduarse de la universidad?

¡Gracias!