Necesito aprender ciencia de datos desde cero, ¿por dónde empiezo?

Data Science es un campo relacionado con la limpieza, preparación y análisis de datos. Primero, necesitas tener una base sólida en Matemáticas. Las matemáticas básicas del nivel XII deberían ser suficientes para iniciar su viaje en Data Science.

Para las matemáticas, necesita repasar los siguientes temas:

1. Álgebra lineal y cálculo : puede estudiar en Khan Academy , MIT Open Courseware (MIT OCW) , Udacity (curso de actualización de álgebra lineal) o usar libros de referencia como Advanced Engineering Mathematics de Kreyszig . Pulir sus conceptos sobre álgebra lineal será útil para comprender muchos aspectos del aprendizaje automático, como la optimización de hiperparámetros, las funciones de regularización y el análisis de conglomerados; nombrar unos pocos entre muchos.

2. Cálculo vectorial : para el cálculo vectorial nuevamente, puede seguir los recursos mencionados anteriormente. Y brillante | La matemática y la ciencia bien hechas también es una aplicación muy interactiva para ayudarte a aclarar los conceptos de la misma.

3. Estadísticas : junto con los recursos mencionados anteriormente, puede completar el curso “Introducción a las estadísticas ” en Udacity para proporcionar sus habilidades de análisis estadístico.

En una visión concisa, hay 3 requisitos para un científico de datos:

1. Comprensión de los algoritmos de aprendizaje automático.

2. Implementación de algoritmos utilizando herramientas estadísticas.

3. Comunicar los resultados a través de una narración efectiva.

En la actualidad, las herramientas estadísticas de código abierto más preferidas son ‘R ‘ y ‘Python’.

  • Para R: comience a aprender bibliotecas como dplyr , tidyr, data.table para manipulación de datos y ggplot2 para visualizaciones.
  • Para Python : comience a usar numpy y pandas para manipulación de datos. En general, matplotlib se usa para visualización en python, pero si desea ahorrar tiempo puede usar ggplot2 que tiene la misma sintaxis que en R. De hecho, la visualización en ggplot2 es mucho mejor que la de matplotlib.

Libros recomendados

  • Ciencia de datos desde cero : Explicar algoritmos construyéndolo desde el nivel del suelo en python. Esto puede ayudar a comprender el algoritmo en lugar de usar bibliotecas como una caja negra .
  • Elementos de aprendizaje estadístico : Complementando el curso de aprendizaje estadístico de Stanford, un tratamiento avanzado de todos los algoritmos ampliamente utilizados.
  • R para todos – Este libro está escrito por Jared P. Lander. Cubre todos los aspectos de la ciencia de datos, como la visualización de datos, la manipulación de datos, el modelado predictivo. Puede entender todo fácilmente, ya que cubre una amplia gama de temas.

Cursos Recomendados –

1. Aprendizaje estadístico – Stanford : este curso está diseñado específicamente para explicar los algoritmos sin depender en gran medida de las fórmulas matemáticas y se centra en las implementaciones en R. La lista compilada de videos está disponible junto con una versión gratuita en pdf.

2. Cursos de ciencia de datos | Coursera .

El campo que aún se encuentra en la etapa inicial no tiene cursos fijos a seguir. Pero hay varios blogs analíticos y personales de los principales científicos de datos que serán vitales para aprender nuevos métodos.

Algunos de los blogs famosos son:

1. AnalyticsVidya

2. R-Bloggers

3. Data Science Central

4. KDNuggets

Puede seguir algunos inspiradores científicos de datos en Linkedin de la siguiente manera:

1. DJ Patil es el científico jefe de datos de los Estados Unidos en la Oficina de Política de Ciencia y Tecnología de la Casa Blanca. El escritor de uno de los artículos más citados en los negocios sobre cómo pensar sobre el área emergente de la ciencia de datos.

2. Kirk Borne – Kirk es un veterano analítico, educador, científico espacial y más. Actualmente es el principal científico de datos en Booz Allen y ha enseñado ciencia de datos, estadística, ética de datos y modelado computacional durante más de 12 años en la Universidad de Mason.

Leer más: ¿Quién debe aprender ciencia de datos?

¿Cuál es el mejor curso para comenzar a aprender ciencia de datos?

¿Cómo puedo comenzar a aprender ciencia de datos y convertirme en un maestro en ella?

Espero que esto ayude.

Después de haber trabajado en este campo durante aproximadamente 9 meses, creo que puedo diseñar un camino para que lo sigan los principiantes en las etapas iniciales para evitar dificultades y hacer una transición sin problemas de un novato a un científico de datos. Escribo esta respuesta bajo la presunción de que no tiene experiencia con la programación o que nunca tuvo la costumbre de escribir código después de su primer año de ingeniería. Si eres bueno en alguna de las herramientas ‘R’, ‘Python’, ‘SAS’, ‘Julia’, etc., que se utilizan para el análisis estadístico, puedes omitir la parte inicial de la respuesta.

En una visión concisa, hay 3 requisitos para un científico de datos:

  1. Comprensión de los algoritmos de aprendizaje automático
  2. Implementación de algoritmos utilizando herramientas estadísticas.
  3. Comunicar los resultados a través de una narración efectiva

Herramientas estadísticas

Para lograr los mejores resultados, necesitamos proporcionar los datos correctos a los algoritmos y todo el análisis se realiza utilizando herramientas estadísticas. En la actualidad, las herramientas estadísticas de código abierto más preferidas son ‘R ‘ y ‘Python’.

  • R:
  1. Instalar R-Studio
  2. Eche un vistazo a estos tutoriales que contienen 90 videos cada uno de solo dos minutos. Simultáneamente practíquelos en R-studio. Puede usar sitios web como Datacamp para la práctica interactiva, pero personalmente creo que son solo un nivel básico
  3. Comience a aprender bibliotecas como dplyr, tidyr, data.table para manipulación de datos y ggplot2 para visualizaciones.
  • Pitón:
  1. Instala Anaconda.
  2. IDLE, el spyder se usa como entorno, pero prefiero Ipython Notebook, ya que ayuda a ejecutar el código en bloques, es efectivo en la documentación y también se puede usar para presentaciones.
  3. Para el aprendizaje interactivo, puede usar el curso de codeacademy o estos videos.
  4. Comience a usar numpy y pandas para la manipulación de datos. En general, matplotlib se usa para la visualización en python, pero si desea ahorrar tiempo puede usar ggplot2 que tiene la misma sintaxis que en R. De hecho, la visualización en ggplot2 es mucho mejor que la de matplotlib

Si tuviera que elegir entre R o Python, le recomendaría ir a Python, pero es una ventaja tener experiencia en ambos. Con esto, tendrá la confianza para realizar análisis de datos exploratorios en cualquier conjunto de datos dado, utilizar documentación oficial y sitios web como desbordamiento de pila para cualquier consulta. Dependiendo del requisito, puede aprender otros paquetes importantes. Aconsejo no pasar más tiempo aprendiendo las sintaxis, ya que hay mucha ayuda en la pila y varios blogs que pueden ayudar con el requisito.

Aprendizaje automático:

La parte más importante que consumiría mucho tiempo es comprender los algoritmos. Un enfoque efectivo puede ser seguir un libro o curso, aprender los conceptos básicos de este, buscar varias explicaciones del algoritmo en diferentes blogs e implementar el algoritmo. Puedes elegir uno de los siguientes cursos / libros

Cursos:

  • Aprendizaje automático – Andrew Ng: El curso se considera la biblia para el aprendizaje automático básico. De hecho, hay muchas personas que comenzaron su carrera en ciencia de datos al terminar el curso. La desventaja es que usa octava para la implementación.
  • Aprendizaje estadístico – Stanford: este curso está diseñado específicamente para explicar los algoritmos sin depender en gran medida de las fórmulas matemáticas y las implementaciones están en R. La lista completa de videos está disponible aquí. La versión en pdf del curso está disponible de forma gratuita. Una explicación alternativa del mismo libro se puede encontrar aquí. Implementación de Python de este curso
  • Introducción a Machine Learning-Udacity: este curso utiliza Python para implementar los algoritmos

Libros:

  • Ciencia de datos desde cero: Explicar algoritmos construyéndolo desde el nivel del suelo en python. Esto puede ayudar a comprender el algoritmo en lugar de usar bibliotecas como una caja negra
  • Machine Learning para hackers: utilizando R como herramienta, casos prácticos de uso de aplicaciones de machine learning
  • Elementos de aprendizaje estadístico: Complementando el curso de aprendizaje estadístico de Stanford, un tratamiento avanzado de todos los algoritmos ampliamente utilizados.

Cuadernos:

Puede usar los cuadernos de ipython para una rápida introducción e implementación de estos algoritmos en python

Regresión lineal, máquinas de vectores de soporte, bosque aleatorio, vecinos más cercanos k, modelos de mezcla gaussiana, análisis de componentes principales, k-medias, validación y selección de modelos, XGboost en R, XGboost en python

K aggle:

Este sitio web alberga competencias de ciencia de datos y es una excelente etapa para evaluar sus habilidades. Puedes echar un vistazo a las viejas competiciones y las soluciones ganadoras. Algunas de las competencias de conocimiento son:

  • Predicción de supervivientes del Titanic: solución
  • Mientras el mundo se agita: solución
  • solución ganadora de tradeshift
  • Solución completa: ¿Cómo llegué al Top 11% de la competencia de Kaggle Telstra?
  • Otras competiciones

El campo que aún se encuentra en la etapa inicial no tiene cursos fijos a seguir. Seguir varios blogs analíticos y los personales de los principales científicos de datos será vital para aprender nuevos métodos. Algunos de los blogs famosos son:

  • Validado cruzado
  • R-bloggers
  • Análisis, minería de datos y ciencia de datos
  • Data Science Central
  • Analytics Vidya
  • Ciencia Trello-Data
  • Quora-Datascience
  • bkg6 / awesome-datascience

Perfiles útiles de Github:

  • donnemartin / data-science-ipython-notebooks
  • hadley / ggplot2
  • hadley / dplyr
  • rushter / data-science-blogs

Estaré actualizando si encuentro buenos recursos

Procesamiento de datos con dplyr & tidyr: Tutorial para dplyr & tidyr

Haga una manipulación de datos más rápida utilizando estos paquetes de 7 R

Tabla de datos Cheat Sheet

ggplot2 – documentación: documentación oficial con ejemplos

ggplot2 – tutorial, ggplot2 – Cheatsheet,

10 preguntas R Los usuarios siempre hacen preguntas al usar el paquete ggplot2

Aquí hay un consejo que dio uno de los mejores profesores del Instituto de Estadística de la India: Amitava Bandopadhyay:

Si eres un novato en la ciencia de datos y quieres incorporar tu carrera profesional en Data Analytics y Machine Learning, enfócate en hacer tres cosas:

1.Lea el libro de estadísticas de Freedman.

2.Lea Introducción al aprendizaje estadístico de Trevor y otros.

3. Resuelve problemas en el segundo libro anterior con un ejemplo dado usando R.

Si lo hace arriba, es posible que necesite 2–3 meses para completar (tardé 4 meses), será un mejor analista. Lo suficientemente bueno como para vencer al 95% de otros analistas en el mundo.

He respondido previamente a esta pregunta aquí

[Si te gusta mi respuesta, cuídame. No voy a malgastar tu tiempo. Estoy abierto para trabajos de consultoría y nuevos desafíos en ciencia de datos, comuníquese con mi perfil de Linkedin]

Data Scientist es el trabajo más sexy del siglo XXI. No es muy fácil convertirse en un gran científico de datos, hay que trabajar duro para lograrlo.

Si desea convertirse en un buen científico de datos, primero aprenda qué es la ciencia de datos en profundidad.

Puede referir conjuntos de blogs, libros y también puede aprender de Quora. Puede referir las respuestas de Quora. Hay muchas preguntas en Quora relacionadas con la ciencia de datos y cómo convertirse en un científico de datos.

Puede consultar los libros a continuación para aprender Data Science.

Los mejores libros para la ciencia de datos:

Este libro está escrito por Jared P. Lander. Es un libro decente que cubre todos los aspectos de la ciencia de datos, como la visualización de datos, la manipulación de datos, el modelado predictivo, pero no con tanta profundidad. Puedes entenderlo, ya que cubre una gran cantidad de temas y se pierde detalles de cada uno.

Este libro está escrito por Trevor Hastie, Robert Tibshirani y Jerome Friedman. Esta es la siguiente parte de ‘Introducción al aprendizaje estadístico’. Se compone de temas más avanzados. Este libro es el más adecuado para personas familiarizadas con los conceptos básicos del aprendizaje automático.

Ahora, después de aprender Data Science, comience con las habilidades y responsabilidades necesarias para convertirse en Data Scientist.

Así que veamos las habilidades más valiosas para aprender para un científico de datos

  • Conocimiento profundo de la codificación Python. Es el lenguaje más común, incluido Perl, Ruby, etc.
  • Conocimiento sólido de SAS / R
  • Es necesario que el científico de datos pueda trabajar con datos no estructurados. Ya sea que provenga de videos, redes sociales, etc.
  • Habilidad de sonido en la codificación de bases de datos SQL.
  • Data Scientist debería tener una buena comprensión de varias funciones analíticas. Por ejemplo rango, mediana, etc.
  • Se requiere un conocimiento profundo del aprendizaje automático.
  • Un científico de datos debe estar familiarizado con Hive , mahout, redes bayesianas , etc. En ciencia de datos, el conocimiento de MySQL es como una ventaja adicional.

Ahora veamos las responsabilidades de Data Scientist, de acuerdo con las responsabilidades que puede juzgar usted mismo que puede administrar esos roles o no, y si no, intente agregar esas habilidades en usted mismo.

Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos.
  • Predicción del problema empresarial.
  • Sus roles son dar resultados futuros de ese negocio.
  • Desarrollar modelos de aprendizaje automático y métodos analíticos.
  • Encuentre nuevas preguntas comerciales que luego puedan agregar valor al negocio.
  • Minería de datos utilizando métodos de vanguardia.
  • Presentar resultados de manera clara y hacer el análisis ad-hoc.

Para saber más sobre las habilidades y roles de Data Scientist, consulte el siguiente enlace:

Habilidades necesarias para convertirse en Data Scientis t

Después de aprender las habilidades y responsabilidades de un científico de datos, intente agregar esas habilidades en usted mismo.

Aprender paso a paso significa primero aprender Machine Learning, luego Python, etc. Intenta dominar las habilidades de un científico de datos, entonces solo tú puedes convertirte en un gran científico de datos.

Espero que esto ayude.

Convertirse en un científico de datos requiere que un candidato posea habilidades expertas en varios campos como desarrollo de software, lenguajes de consulta de bases de datos, aprendizaje automático, programación, matemáticas, estadísticas, visualización de datos, etc.

Esto parece mucho, y muchos se desaniman una vez que pasan por esta inmensa lista de habilidades que les dicen que es necesario para convertirse en científicos de datos.

Para comenzar a aprender desde cero. Puede obtener capacitación en algunos institutos de capacitación, o puede aprender de algunos tutoriales.

myTectra es uno de los institutos de capacitación líderes en Bangalore para ciencia de datos y muchos otros cursos de TI.

Ver el currículo del curso:

Comenzando con la ciencia de datos y los sistemas de recomendación

  • Descripción general de la ciencia de datos
  • Razones para usar Data Science
  • Ciclo de vida del proyecto
  • Adquisición de datos
  • Evaluación de datos de entrada
  • Transformando datos
  • Métodos estadísticos y analíticos para trabajar con datos.
  • Conceptos básicos de aprendizaje automático
  • Introducción a los sistemas de recomendación
  • Descripción de Apache Mahout

Razones para usar, ciclo de vida del proyecto

  • ¿Qué es la ciencia de datos?
  • ¿Qué tipo de problemas puedes resolver?
  • Ciclo de vida del proyecto de ciencia de datos
  • Principios básicos de ciencia de datos
  • Adquisición de datos
  • Recopilación de datos
  • Comprensión de los datos: atributos en un dato, diferentes tipos de variables
  • Construir la jerarquía de tipo variable
  • Problema bidimensional
  • Co-relación b / w las Variables – explicar usando Paint Tool
  • Outliers, Outlier Treatment
  • Boxplot, Cómo dibujar un diagrama de caja

>> Ver más >>

Encontré los siguientes sitios web en Quora hace unos meses,

DataCamp – Tutoriales en línea de R y cursos de ciencia de datos.

DataQuest – Aprende ciencia de datos en tu navegador.

DataMonkey : desarrolle sus habilidades analíticas de una manera simple pero divertida.

¡Espero que esto ayude!

¿Qué es la ciencia de datos?

Teorías detrás de la ciencia de datos

Si desea realizar ciencia de datos, hay varias teorías y principios que debe comprender. Y una vez que comprenda estas teorías y principios, le permitirá aprender un cierto conjunto de prácticas y las habilidades paso a paso que hacen los científicos de datos. Si no comprende estas teorías y principios, no podrá comprender las prácticas y habilidades. Así que primero déjame enseñarte algunas teorías y principios que están involucrados, y una vez que entiendas los elementos teóricos, entonces puedo enseñarte un método simple paso a paso para hacer ciencia de datos.

Teoría de la base de datos

Primero hablemos de la teoría de bases de datos. La teoría de la base de datos se trata de organizar los datos y organizarlos de manera que el almacenamiento y la recuperación sean eficientes. Los datos se pueden clasificar en objetos, los objetos se pueden poner en colecciones y los objetos y las colecciones pueden tener relaciones entre sí y entre ellos. Lo único que debe saber sobre esta teoría es que la forma en que organiza sus datos afectará el esfuerzo requerido para obtener respuestas.

Manifiesto Ágil

Ahora hablemos del Manifiesto Ágil. El Manifiesto Ágil es un conjunto de principios que garantiza resultados de alta calidad en entornos sujetos a altos niveles de cambio y ambigüedad. Los métodos ágiles superan los cambios rápidos y la ambigüedad mediante la adopción de un proceso de desarrollo iterativo. Utiliza equipos autogestionados y los apasionados por los avances tecnológicos se sienten atraídos por ellos como los científicos a la teoría del Big Bang. El Manifiesto Ágil busca eliminar todas las barreras culturales entre el desarrollador, el cliente y el usuario final y se enfoca en usar la última tecnología para simplificar las cosas pero no más. Lo único que necesita saber sobre este conjunto de principios es que todo cambia y cuanto más tiempo tome para probar su solución en el entorno en vivo, mayor será el riesgo de falla.

Dinámica Espiral

La última teoría que me gustaría abordar es la teoría de la dinámica espiral. Spiral Dynamics es una teoría del desarrollo y el comportamiento humano y explica por qué los humanos hacen lo que hacemos. Explica la psicología detrás de por qué nos levantamos de la cama por la mañana, por qué nos sentimos obligados a crear cosas y por qué buscamos mejorar y servir mejor a nuestros seres queridos. La teoría habla de dos estados mentales, uno de “hechos” y uno de “valores”. Los hechos son lo que creemos. Nuestras creencias se basan en el conocimiento que tenemos actualmente y el entorno en el que estamos actualmente. Los valores son lo que deseamos. Nuestros deseos son impulsados ​​por nuestras intenciones y / o preocupaciones que también se basan en el conocimiento que tenemos actualmente y el entorno en el que nos encontramos actualmente. Lo único que necesita saber sobre esta teoría es que nuestros hechos y nuestros deseos provienen de qué datos se nos presenta

Científicos de datos

Los científicos de datos realizan ciencia de datos. Utilizan tecnología y habilidades para aumentar la conciencia, la claridad y la dirección de quienes trabajan con datos. El papel del científico de datos está aquí para acomodar los rápidos cambios que ocurren en nuestro entorno moderno y se les asigna la tarea de minimizar la interrupción que la tecnología y los datos están teniendo en la forma en que trabajamos, jugamos y aprendemos. Los científicos de datos no solo presentan datos, los científicos de datos presentan datos con una conciencia de inteligencia de las consecuencias de presentar esos datos.

Cómo hacer ciencia de datos

Los tres componentes involucrados en la ciencia de datos son organizar, empaquetar y entregar datos (la OPD de datos). La organización es donde se planifica y ejecuta la ubicación física y la estructura de los datos. El empaquetado es donde se construyen los prototipos, se realizan las estadísticas y se crea la visualización. Entregar es donde se cuenta la historia y se obtiene el valor. Sin embargo, lo que separa la ciencia de datos de todos los demás roles existentes es que también necesitan tener una conciencia continua de qué, cómo, quién y por qué. Un científico de datos necesita saber cuál será el resultado del proceso de ciencia de datos y tener una visión clara de este resultado. Un científico de datos necesita tener un plan claramente definido sobre cómo se logrará este resultado dentro de las restricciones de los recursos y el tiempo disponibles. Un científico de datos necesita comprender profundamente quiénes son las personas que estarán involucradas en la creación de la salida. Y, sobre todo, el científico de datos debe saber por qué hay una motivación detrás de intentar manifestar la visualización creativa.

El proceso de ciencia de datos OPD de 3 pasos

Paso 1. Organizar datos.
La organización de los datos implica el almacenamiento físico y el formato de los datos e incorpora las mejores prácticas en la gestión de datos.

Paso 2. Datos del paquete.
Empaquetar datos implica manipular lógicamente y unir los datos brutos subyacentes en una nueva representación y paquete.

Paso 3. Entregue los datos.
La entrega de datos implica garantizar que los que necesitan escuchar el mensaje tengan acceso a los datos.

Además, en todos los pasos tenga respuestas a estas preguntas.

  • ¿Qué se está creando?
  • ¿Cómo será creado?
  • ¿Quién participará en su creación?
  • ¿Por qué se va a crear?

El modelo de ciencia de datos

Data Science en acción

La ciencia de datos en acción se trata simplemente de mover personas y / o sistemas entre las tecnologías actuales y nuevas y entre las habilidades de principiante y experto.

Paso 1. Organizando los datos.

Organizar datos implica mover personas y sistemas de actuales a nuevos (de izquierda a derecha) y de principiantes a expertos (de arriba a abajo). El avance de las tecnologías y habilidades es la esencia de la innovación.

Paso 2. Empaquetado de datos.

Empaquetar datos es lo contrario de organizar datos e implica mover personas y sistemas de nuevos a actuales (de derecha a izquierda) y de expertos a principiantes (de abajo hacia arriba). Este es el arte de hacer las cosas simples pero no más simples.

Paso 3. Entrega de datos.

La entrega de datos permite el movimiento de una vista a otra, permitiendo que un principiante se convierta en un experto, permitiendo que la tecnología actual parezca nueva, permitiendo que los principiantes entiendan los datos expertos y permitiendo que la nueva tecnología parezca parte de su vida. desde que naciste Esta es la educación transformadora.

Data Science es un término general que se compone de múltiples dominios como:

  • Análisis estadístico
  • Aprendizaje automático
  • Visualización de datos

y así….

Dado que desea aprender ciencia de datos desde cero, puede comenzar con los conceptos básicos de la minería de datos, tales como:

  • Detección de anomalías
  • Agrupamiento
  • Clasificación
  • Análisis de regresión

para nombrar unos pocos…

Este es un video que cubre de manera integral todos los conceptos de minería de datos, seguido de un estudio de caso con lenguaje de programación R.

  • Una vez que haya terminado con los conceptos de minería de datos, puede aplicar esas habilidades prácticamente en algunos conjuntos de datos.
  • Cuando crees que eres bueno con los conceptos básicos, puedes seguir adelante y comenzar a competir en Kaggle.

¿Qué es lo que hay que hacer?

  • Siga los blogs y los mejores científicos de datos.
  • Asistir a reuniones de ciencia de datos.
  • Descubre más sobre la vida de un científico de datos

El buen aprendizaje viene con entrenamiento práctico . Dado que la ciencia de datos se trata de adquirir habilidades prácticamente, sugeriría elegir un curso en el que pueda aprender prácticamente resolviendo muchos proyectos y tareas.

Data Analytics tiene un amplio conjunto de herramientas y tecnologías que se utilizan en la industria. Nuestros cursos están diseñados de tal manera que permiten a los aspirantes a profesionales comprender todas las habilidades para hacer análisis en profundidad.

¿Cómo elegir la especialización de análisis de datos: Python, R, SAS, Excel o SQL?

Con 2.5 Quintillones de Bytes de datos creados todos los días, ¡es indudablemente cierto que la ciencia de datos crecerá a lo grande!

Pregunta más común : ¿Cómo elegir la especialización de análisis de datos? ¿Qué programación o herramienta debo usar R, SAS, Python, Excel?

Veamos las ofertas de Data Analytics de Digital Vidya:

i) Técnicas analíticas usando Excel, PowerBI

ii) Análisis de datos utilizando SAS

iii) Análisis de datos utilizando R

iv) Análisis de datos usando Python

Implemente su aprendizaje prácticamente

Proyecto en el que trabajarás en este curso:

  • Proyecto 1: Proyecto de manipulación de datos (5 días): separe y divida el conjunto de datos relacionado con el fraude de tarjetas de crédito para extraer información valiosa
  • Proyecto 2: Proyecto de visualización de datos (5 días) – Tableau a “Python”
  • Proyecto 3: Proyecto de minería de datos (5 días): utilice la técnica de minería de datos para realizar análisis predictivos en un conjunto de datos hipotecarios.

Leer más: ¿Cómo aprendo Ciencia de datos al “hacerlo”?

¿Quieres saber más sobre análisis de datos? Asista a una sesión de demostración gratuita sobre la carrera de análisis de datos donde compartiría todo el proceso paso a paso para comenzar su carrera en esta industria.

Espero verte en el seminario web.

La ciencia de datos es uno de los trabajos más buscados del siglo. Los científicos de datos se encuentran entre los profesionales mejor pagados en varios roles. Por lo tanto, debe aprender el tema para obtener una buena carrera.

Debe optar por buenos institutos de capacitación que puedan enseñarle ciencia de datos a fondo. Si aprende de la capacitación en el aula, puede olvidar algunos conceptos a medida que pasa el tiempo. Por lo tanto, debe considerar Intellipaat, que es pionero en la capacitación en línea de ciencia de datos. Brindan capacitación tanto para principiantes como para profesionales avanzados. Entonces puedes comenzar tu aprendizaje desde aquí. Sé con certeza que brindan capacitación a nivel industrial y no solo temas teóricos. Estarás expuesto a la aplicación en el mundo real de los conceptos que se enseñan. Puede encontrar reseñas en Quora de muchos profesionales que han recibido capacitación en diversas tecnologías y lo están haciendo bien. Simplemente pruebe su video de capacitación sobre ciencia de datos y lo sabrá usted mismo:

Puede comenzar a visitar https://www.coursera.org/, hay muchos cursos buenos sobre DataScience con certificaciones (de pago) y también gratuitos.

Puede seguir a personas del campo DataScience en Twitter para obtener actualizaciones periódicas sobre Data Science.

Hola. Cuando dijiste que quieres aprender desde cero, significa que eres un novato completo sobre Data Science. Ahora, antes de decirle dónde puede aprender desde cero, debe saber qué es Data Science. La ciencia de datos es una combinación de algoritmo, inferencia y desarrollo para resolver problemas analíticamente complejos.

El núcleo de la ciencia de datos son los datos que están disponibles en información en bruto, que se transmiten y almacenan en almacenes de datos empresariales. El trabajo del científico de datos es extraerlos para generar valor comercial. Ahora, si está interesado en aprender Ciencia de datos, debería ver este tutorial sobre Ciencia de datos y tendrá una comprensión clara del concepto.

Puede ir a YouTube y buscar videos de introducción de Data Science y allí obtendrá cientos de videos de alta calidad sobre Data Science que lo harán comprender sobre la tecnología y por qué es el trabajo más sexy de este siglo. También obtendrá una idea sobre la tecnología, como cómo comenzar con Data Science y cuáles son los requisitos previos para aprenderlo. Hay personas que le han sugerido que lea libros de ciencia de datos que personalmente no creo que sea una buena idea comenzar con la tecnología, ya que no es algo teórico solo para leer y comprender. Debe comprender a través de imágenes que solo un video puede hacer. Para darle una recomendación, encontré un video sobre Data Science que explicaba el concepto de una manera muy concisa pero cubría todos los aspectos importantes de Data Science que necesita para comprender la tecnología. Aquí está el enlace: – Ciencia de datos explicada en 30 minutos

Recomiendo esta especialización de la universidad de Duke

Este video es solo una introducción a la especialización en Master Statistics con R

Coursera proporciona la plataforma perfecta para estudiar cursos a tu propio ritmo de forma gratuita. El siguiente enlace guía a los diferentes cursos de ciencia de datos. Puedes elegir un curso en particular de acuerdo a tus necesidades e intereses.

Cursos de ciencia de datos | Coursera

nota: hay otros sitios web como edX y Udacity que también ofrecen cursos de ciencia de datos.

Espero eso ayude.

Gracias por A2A.

Si está interesado en aprender Ciencia de datos, puede aprender viendo varios videos en YouTube, ya que hay millones de videos de Ciencia de datos disponibles y esta es la mejor manera de aprender a través de imágenes en lugar de leer textos y artículos o blogs sobre ciencia de datos.

Para darle mis recomendaciones, puede consultar estos tutoriales ya que tiene una cobertura en profundidad sobre el tema con las manos en la programación que conoce bien con la tecnología. Verifique esto: – Conceptos básicos de ciencia de datos

Mira este video. Este es el mejor canal tutorial de ciencia de datos para principiantes. En este video de demostración, aprenderá rápidamente sobre Introducción a la ciencia de datos utilizando R, Minitab, Python, XLMiner for Forecasting. Cosas que aprenderá en este video 1) R 2) Python 3) Tableau 4) Hadoop 5) SAS

Chicos, espero no interrumpir el flujo por aquí, pero ¿están estos pasos también disponibles para personas que no tienen absolutamente ningún conocimiento previo o contexto de trabajo con datos? ¿Ni siquiera se requieren estadísticas u otro tipo de antecedentes para aprender el análisis de datos desde cero? También estoy interesado en hacer eso, así que por eso pregunto.

Este es un excelente recurso: datasciencemasters / go

No es ciencia de datos . Es el procesamiento de datos . Comience por ahí. Esa es la disciplina de gestión empresarial .

Si quieres aprender a programar, es Informática.

¡Buena suerte!

More Interesting

¿Cómo se aplican los grandes datos al comercio minorista?

¿Cuáles son las principales ventajas de big data?

¿Hay algún curso de análisis (en el Reino Unido o en línea) que se especialice en interpretar análisis y datos para darme información comercial significativa?

Necesito una persona de Python Advanced para evaluar a un candidato de Data Science. ¿Puede usted ayudar?

¿Cuáles son algunas buenas técnicas o herramientas de visualización de datos además de Tableau que uno debe aprender para comenzar su carrera en el campo de la visualización?

¿Puedo aprender estructuras de datos y algoritmos sin matemáticas?

¿Qué MOOC, proyecto en línea o curso relacionado con big data \ Hadoop debería agregar a mi currículum como una habilidad adicional, como analista de datos (en ciencia de datos)?

¿Qué estrategias sugiere para resolver este problema de detección de fraude en un negocio minorista y de suministro con minería de datos y análisis de datos?

¿Qué empresas se están transformando para volverse más basadas en datos?

¿Qué clases debo tomar en CMU si quiero ser un científico de datos?

¿Cuáles son las diferentes estrategias de gestión de datos? ¿Sus ventajas y desventajas?

¿Qué son los momentos en las estadísticas? ¿Qué nos proporcionan sobre la distribución de datos?

¿Puedo aprender Big Data después de 6 años?

¿Qué oportunidades de carrera en ciencia de datos y aprendizaje automático existen en Snapchat?

Con más de 50 años, ¿cuáles son mis posibilidades de convertirme en un científico de datos exitoso?