Cómo empezar si quiero aprender ciencia de datos como un nuevo aprendiz

Teniendo en cuenta que la ciencia de datos es un área bastante difícil, es mejor abordarla paso a paso. Comience con lo básico y avance a medida que se sienta cada vez más cómodo con los números y los lenguajes de programación.

Dicho esto, te sugiero que primero te familiarices con lo que esencialmente es la ciencia de datos. Puede parecer un punto trivial, pero mucha gente tiene ciertos conceptos erróneos sobre la ciencia de datos.

La ciencia de datos es mucho más que un simple análisis de grandes conjuntos de datos y sacar conclusiones. Está tomando datos en su conjunto: aprender y comprender cómo y qué los genera, también cómo ese conocimiento y las conclusiones que extrae pueden ayudar a otros y lo que los dos pueden cambiar.

Mire cómo se puede trabajar con datos en la vida real, a menudo en contextos sorprendentes.

Vea las charlas de TED sobre ciencia de datos .

Lea estos dos libros para tener una idea general del campo:

Numsense! Ciencia de datos para el profano: no se agregaron matemáticas

Big Data para Dummies

Con ese conocimiento básico, y después de la verificación si realmente está interesado en la ciencia de datos, puede continuar aprendiendo uno de los siguientes lenguajes de programación junto con el software.

  • Python o lenguaje R (computación estadística)
  • SQL
  • Apache Hadoop
  • Apache Storm (para el procesamiento de datos de flujo)

Algunos buenos cursos para utilizar lo anterior en ciencia de datos:

https://www.coursera.org/learn/s…

https://www.coursera.org/special…

https://www.amazon.com/Hadoop-Be…

Como ya he mencionado, la ciencia de datos es algo extraordinario cuando captas su integridad y luego experimentas con ella. Juega con datos, pero al mismo tiempo deja que tus resultados sean significativos y beneficien a otros o solo a ti, para empezar.

Estoy enamorado de los datos y sus posibilidades. En Aidlab, nuestra misión es compartir ese amor con los demás. Es por eso que lanzamos cursos que permiten a los entusiastas de los datos trabajar con datos generados por sus propios cuerpos y, por ejemplo, aprender a crear aplicaciones IoT con nuestra ayuda.

El mayor beneficio de descubrir la ciencia de datos con Aidlab es que puede aprender a trabajar con datos y aplicarlos a lo que sea que su imaginación produzca, todo basado en varias señales biológicas de su cuerpo.

Todos y cada uno de los lenguajes de programación tienen sus propios giros y bucles de estilo que podrían llevar a cualquiera a temer y uno podría abandonar por completo, pero en su lugar, debe intentar aprender habilidades de análisis de datos.

  • R lo ayuda a aprender las habilidades del análisis de datos debido a que los múltiples usuarios crearon paquetes para facilitar la tarea de análisis de datos. A través de esto, puede visualizar sus datos y cuestionar los datos y resolver los problemas relacionados con los datos. La sintaxis puede variar en los lenguajes de programación, pero el concepto principal y las ideas de los datos nunca cambiarán.
  • Una vez que sepa cómo cargar datos y pueda realizar trabajos básicos en R, puede concentrarse en aprender más sobre manipulación de datos, visualización de datos, aprendizaje automático, etc. Al ver los datos, debe saber cuál es la estructura del conjunto de datos de cómo funcionan las columnas o las tuplas se dividen, cuáles son los buenos datos y cuál es el desperdicio, cómo extraer los datos, estas son las cosas que debe comprender y que le facilitarán el aprendizaje de análisis de datos.
  • Debe aprender a crear ideas a partir de sus datos y tomar datos fructíferos de los datos no estructurados.
  • Debe experimentar con conjuntos de datos que es la mejor manera de aprender datos, los conjuntos de datos están disponibles gratuitamente en Internet.
  • Después de estas habilidades básicas y cuando esté acostumbrado a los tipos de datos, puede aprender el análisis de datos de una manera muy divertida y aprender a fondo sobre esta tecnología, ya que es nueva y podría crecer más en el futuro.

Después de esto, puede optar por algunos libros para aprender a analizar y practicar datos, o puede ir a clases en línea para aprender a analizar datos.

Leer más: ¿Qué hacen los analistas de datos todo el día? El campo suena divertido, pero no quiero sentarme frente a una pantalla y hacer ecuaciones todo el día.

  • ¿Cuál debería ser mi enfoque principal al aprender ciencia de datos?

Algunos de los libros recomendados para estudiantes de análisis de datos:

Espero que esto ayude. No dude en enviarme un mensaje para cualquier consulta adicional. ¡Todo lo mejor!

Dada la inmensidad de Data Science, siempre recomendó formar una base sólida. Por mi parte, creo firmemente en el dicho. “Más profundas las raíces, más altos crecen los árboles”. Matemáticas, estadísticas y programación forman la base de la ciencia de datos. Por lo tanto, a menudo se recomienda conocer estos temas en profundidad para formar una base sólida. Una vez que tenga suficiente experiencia en estos temas, puede ascender a un instituto para aprender ciencia de datos y aprender lo siguiente.

Fundación

  • Python Básico, Intermedio y Avanzado
  • Estadística, probabilidad y álgebra lineal
  • Regresión lineal, series de tiempo y función de costo
  • Análisis exploratorio de datos
  • Tipos de datos
  • Recopilación, extracción, consulta, limpieza y agregación de datos para análisis
  • Fuentes de datos, limpieza y disputas
  • Trabajando con API
  • Raspado web

Avanzado

  • Árboles de decisión, árboles condicionales
  • Técnicas de conjunto
  • Big Data y Hadoop Ecosystem y Spark
  • Arquitectura HDFS
  • Colmena QL
  • Cerdo
  • Contar historias con datos
  • Codificación Visual
  • Cuadro
  • Bayes ingenuos
  • PNL / Agrupación de texto / NLTK
  • PCA y reducción de dimensiones
  • Implementación de productos de Data Science

El objetivo principal de la ciencia de datos es ayudar a resolver problemas comerciales complejos con la ayuda de datos. Para ser precisos, si no trabaja en problemas reales de la industria, no podrá prepararse como un científico de datos exitoso.

Siempre recomendaría a los aspirantes de ciencia de datos que asistan a un programa basado en el aula, dirigido por un instructor y orientado a la práctica.

Te encontrarás con muchas instituciones, cursos y programas que te ayudarán a aprender ciencia de datos. Algunos son muy caros, mientras que otros son razonables. Pero, una cosa muy importante a tener en cuenta mientras se inscribe en dichos cursos es saber su valor en términos de conocimiento y lo que al final del curso está desarrollando dentro de usted mismo.

Algunos puntos a considerar al elegir una institución / curso

  1. El énfasis está más en la práctica y no solo en la teoría.
  2. El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
  3. Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
  4. Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas

Y en mi opinión, las certificaciones son una prueba de que ha completado un curso o un programa y no una prueba de lo que ha hecho. ¡Debes haber leído muchos artículos sobre desempleo educado o incluso haber encontrado algunas experiencias personales en las que muchos estudiantes tienen una maestría pero aún no tienen trabajo!

¿Porque?

Bueno, porque hay una gran brecha de habilidades entre lo que la industria quiere y lo que hay en oferta. El sistema educativo se ha convertido en gran medida en un juego de negocios de solo vender certificados. Por lo tanto, no siempre es necesario confiar en las certificaciones. La información teórica se puede impartir fácilmente. ¡Pero lo que importa es la IMPLEMENTACIÓN!

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Si está interesado en un enfoque técnico para abordar los problemas comerciales utilizando la ciencia de datos, le sugiero que siga la siguiente ruta.

  1. Comience con el lenguaje de programación Python, ya que es fácil de aprender. Ruta recomendada:
  1. Conceptos básicos de Python: sentdex
  2. Python Daily Hands On: HackerRank
  3. Módulos de ciencia de datos (Numpy / Scipy / Pandas): Data School
  4. Tutoriales de complementos: Enthought
  • Aprenda los conceptos de estadística y probabilidad y gane experiencia.
    1. Conceptos básicos: Estadísticas de la Academia Khan – YouTube
    2. Información detallada de todas las estadísticas: Brandon Foltz
  • Aprenda paquetes de visualización en Python: Matplotlib / Seaborn, etc.
  • Explore el paquete Machine Learning en python ( scikit-learn ), varios algoritmos populares en la industria y sus ejemplos / usos prácticos. Data School lo ayudará con lo básico y las sesiones de Enthought scipy para conocer los pasos detallados involucrados en el análisis de datos.
  • Kaggle: su hogar para la ciencia de datos para explorar varios conjuntos de datos y núcleos. Este es el lugar donde obtendrá conocimiento práctico y pasos críticos involucrados en el Análisis de Datos. Comience a escribir sus propios núcleos con un problema fácil y también siga las mejores soluciones cargadas.
  • Según lo solicitado, ¡esto es solo para comenzar su viaje en el campo de la ciencia de datos! Hay muchas otras herramientas / tecnologías que puede explorar en función de su interés.

    Una vez que llegue aquí, ¡probablemente descubrirá qué sigue! 🙂

    ¡Feliz aprendizaje!

    Entonces, eres un novato en la ciencia de datos, bueno, eso no es un problema, porque todos son novatos antes de comenzar algo.

    Puede seguir estos pasos para aprender ciencia de datos:

    • Comience aprendiendo los conceptos básicos de la minería de datos, una vez que sea bueno con los conceptos teóricos, continúe y aplique sus habilidades en un conjunto de datos.

    Puede ver este video, que explica exhaustivamente los conceptos de minería de datos, seguido de un estudio de caso con lenguaje de programación R->

    • Una vez que sea bueno con los conceptos de minería de datos, puede explorar otros subdominios como:
    • Manipulación de datos
    • Análisis estadístico
    • Visualización de datos

    Este video cubre todos los conceptos del paquete “GGPLOT2”, que es un paquete de visualización de datos.

    Una vez que sea bueno con los temas de ciencia de datos y también tenga un buen dominio sobre lenguajes como R y Python, puede comenzar a competir en Kaggle para mejorar su experiencia.

    Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas, análisis y matemáticas.

    Lo que distingue al científico de datos es la perspicacia empresarial fuerte, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Conviértete en un maestro en BIG DATA ¡Haz clic AQUÍ! Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

    El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es inquisitivo, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “.

    Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

    Los científicos de datos son inquisitivos: exploran, hacen preguntas, hacen análisis de “qué pasaría si”, cuestionan los supuestos y procesos existentes

    Los datos se duplican cada dos años, y todos han oído hablar de los números de crecimiento absurdos indicados en los informes. En este contexto, el resultado inevitable es la aparición del Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y proyectar el mapa tecnológico para hacer posible la transición de datos a ideas. El alcance del trabajo de un científico de datos incluye la identificación de las fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

    Por el momento, el papel de un científico de datos lo desempeña una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de esa clase. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que puedan estar más allá del ámbito de los modelos actuales y los problemas comerciales. El analista de negocios trabajaría en los datos que ha recopilado el científico de datos. James Kobielus, un analista senior de Forrester, en su negocio, llega a comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para trabajar con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con el surgimiento de una carrera de pleno derecho, esto pronto cambiará.

    Soy básicamente un ingeniero mecánico y cero ideas sobre codificación, pero ahora soy capaz de comprender y generar codificación.

    Desde mi punto de vista, el interés y la necesidad nos hacen aprender cosas. La forma en que estás aprendiendo es la mejor manera cuando aprendes cosas con un 100% de atención, interés y de manera práctica.

    Me gustaría compartir mi proceso de aprendizaje en ciencia de datos, durante mi capacitación en análisis de negocios no entendí la codificación y los datos después de completar la capacitación intentaron escribir el código con la codificación existente, pero no lo entendí, después de eso comencé a decodificar para comprender, luego comencé a pensar en diferentes puntos de vista sobre los datos dados con la ayuda de mi profesor Rajesh Sir y ahora la ciencia de los datos es fácil de aprender para mí al comprender el proceso, los datos, los conceptos, los tutoriales y el uso de programas existentes como muestra y aún ahora estoy en el inicio del proceso de aprendizaje.

    La mejor manera de aprender ciencia de datos es aprender conceptos, decodificar muestras existentes, aprender algoritmos, pensar de manera innovadora para datos dados y concentrarse en los fundamentos de las herramientas de ciencia de datos.

    La ciencia de datos es un “concepto para unificar estadísticas, análisis de datos y sus métodos relacionados” con el fin de “comprender y analizar fenómenos reales” con datos. Cuando un principiante quiere comenzar a aprender ciencia de datos, lo primero es que el principiante no tiene experiencia previa en datos ciencia o aprendizaje automático. Y no conoce ninguna herramienta analítica o lenguajes como R, SAS o Python.

    Un transeúnte no tiene experiencia previa en ninguna de las herramientas de análisis como R / Python, no conoce los conceptos de Machine Learning, etc. y tiene una experiencia laboral de más de 3 años en una industria que no sea Analytics.

    Un principiante necesita establecer un objetivo y aprender a desarrollar una comprensión básica de los algoritmos de aprendizaje automático y resolver problemas de la vida real a partir de ellos. Probar cosas es una gran ventaja para los nuevos estudiantes. Los científicos de datos deben saber matemáticas y estadísticas, conocimientos básicos sobre R / python, herramientas básicas de aprendizaje automático y lo último es una pasantía que brinda un mejor conocimiento para los principiantes.

    Algunos de los libros para principiantes para aprender ciencia de datos

    Mastering Python for Data Science por Samir Madhavan

    Programando Inteligencia Combinada por Toby Segaran

    Piense en el estado 2 por Allen Doweely

    Para más detalles: BEPEC | ¿Por qué ciencia de datos? Bangalore

    Puede aprender Data Science fácilmente, si aprende con plena concentración.

    Primero, quiero comenzar mi respuesta con lo que es exactamente ciencia de datos.

    • ¿Qué es la ciencia de datos?

    Data Science es un campo que abarca los relacionados con la limpieza, preparación y análisis de datos. La ciencia de datos es un término general en el que se aplican muchos métodos científicos. Por ejemplo, las matemáticas, las estadísticas y muchas otras herramientas que los científicos aplican a los conjuntos de datos.

    El científico aplica las herramientas para extraer conocimiento de los datos. Es una herramienta para abordar Big Data . Y luego extraer información de él. First Data Scientist reúne conjuntos de datos de múltiples disciplinas y los compila. Después de eso, aplique aprendizaje automático , análisis predictivo y sentimental. Luego afílelo hasta un punto donde pueda derivar algo. Finalmente, extrae la información útil de la misma.

    El científico de datos entiende los datos desde un punto de vista comercial. Su trabajo es dar la predicción más precisa. Se encarga de dar sus predicciones. La predicción del científico de datos es muy precisa. Impide que un empresario pierda en el futuro.

    Ahora, para aprender Data Science, debe tener buenos conceptos sobre Machine Learning, Python, etc.

    Así que definitivamente recomendaré referir algunos de los mejores libros para aprender en profundidad.

    Ahora veamos los mejores libros para ciencia de datos.

    • Los mejores libros para la ciencia de datos:

    Este libro está escrito por Jared P. Lander. Es un libro decente que cubre todos los aspectos de la ciencia de datos, como la visualización de datos, la manipulación de datos, el modelado predictivo, pero no con tanta profundidad. Puedes entenderlo, ya que cubre una gran cantidad de temas y se pierde detalles de cada uno.

    Este libro está escrito por Trevor Hastie, Robert Tibshirani y Jerome Friedman. Esta es la siguiente parte de ‘Introducción al aprendizaje estadístico’. Se compone de temas más avanzados. Este libro es el más adecuado para personas familiarizadas con los conceptos básicos del aprendizaje automático.

    Para que pueda comenzar con estos libros.

    Ahora comencemos con el científico de datos. Cómo puede convertirse en un científico de datos.

    El científico de datos entiende los datos desde un punto de vista comercial. Su trabajo es dar la predicción más precisa. Se encarga de dar sus predicciones. La predicción del científico de datos es muy precisa. Impide que un empresario pierda en el futuro.

    El científico de datos es el trabajo más sexy del siglo XXI. Un científico de datos es mejor estadístico que cualquier ingeniero de software y mejor ingeniero en comparación con cualquier estadístico.

    Veamos una infografía a continuación para desmitificar a Data Scientist

    Así que veamos las habilidades más valiosas para aprender para un Científico de Datos.

    • Conocimiento profundo de la codificación Python. Es el lenguaje más común, incluido Perl, Ruby, etc.
    • Conocimiento sólido de SAS / R
    • Es necesario que el científico de datos pueda trabajar con datos no estructurados. Ya sea que provenga de videos, redes sociales, etc.Habilidad sólida en la codificación de bases de datos SQL.
    • Data Scientist debería tener una buena comprensión de varias funciones analíticas. Por ejemplo rango, mediana, etc.
    • Se requiere un conocimiento profundo del aprendizaje automático.
    • Un científico de datos debe estar familiarizado con Hive , mahout, redes bayesianas , etc. En ciencia de datos, el conocimiento de MySQL es como una ventaja adicional.

    Ahora veamos las responsabilidades de Data Scientist, de acuerdo con las responsabilidades que puede juzgar usted mismo que puede administrar esos roles o no, y si no, intente agregar esas habilidades en usted mismo.

    Responsabilidades de un científico de datos

    Limpieza y procesamiento de datos. Predicción del problema comercial. Sus funciones son dar resultados futuros de ese negocio. Desarrollar modelos de aprendizaje automático y métodos analíticos. Encontrar nuevas preguntas comerciales que luego puedan agregar valor al negocio. Minería de datos utilizando el estado de métodos de vanguardia. Presentar resultados de manera clara y hacer el análisis ad-hoc.

    Para saber más sobre las habilidades y roles de Data Scientist, consulte el siguiente enlace:

    Habilidades necesarias para convertirse en Data Scientist

    Hola,

    El científico de datos es conocido como uno de los mejores trabajos en el siglo XXI. Para convertirse en un científico de datos exitoso, necesita un conocimiento de dominio, buenas habilidades de comunicación y debe tener experiencia en tecnología.

    Como este papel implica muchas responsabilidades. En Imarticus, ayudamos a aspirantes como usted a actualizarse y comenzar una carrera como científico de datos.

    Ofrecemos el Data Science Prodegree en colaboración con Genpact como socio de conocimiento. Este programa lo ayuda a comprender en profundidad el análisis de datos y las estadísticas, junto con las perspectivas comerciales y las prácticas de vanguardia que utilizan SAS, R, Python, Hive, Spark y Tableau. Además de esto, el programa también proporciona asistencia de colocación del 100% para guiar y ayudar a navegar por amplias opciones de carrera y prepararlo para el trabajo desde el día 1.

    A través de varios proyectos y estudios de casos, impartimos las habilidades integrales del papel en nuestros estudiantes junto con una amplia capacitación sobre las herramientas y técnicas clave. Ofrecemos una oferta de asistencia de colocación del 100% para este programa.

    Para obtener más información sobre nuestro programa, visite el sitio web oficial de Imarticus Learning O puede llamarnos al 18002677679

    Espero que esto te ayude en tu proceso de toma de decisiones.

    Todo lo mejor..:)

    Ya ha sido respondido varias veces.
    Por favor, vaya a través de los siguientes enlaces:
    1) ¿Cómo puedo convertirme en un científico de datos? (Mire la respuesta de William Chen, es la más completa)
    2) ¿Cuáles son los mejores libros sobre ciencia de datos?
    3) Revisión de los 10 mejores cursos de ciencia de datos en línea
    4) Cursos en línea de ciencia de datos: una lista completa | LearnDataSci

    Solo revise estos enlaces una vez, verá cómo Data Science está en auge en este momento.

    La especialización en ciencia de datos de Coursera es la mejor manera de comenzar.

    Aprenda Python lado a lado, ya que la especialización en ciencia de datos está completamente en R.

    Puedes aprender python de codecademy.

    Necesitas ser bueno en probabilidad y estadísticas. Si no ha tenido un curso de nivel de prueba y estadísticas de ingeniería, sería mejor si puede completarlo como electivo.

    También el conocimiento básico de algunos cursos de computación como sistemas de administración de bases de datos, diseño de compiladores, sistemas operativos lo ayudará a fortalecer sus conceptos básicos.

    Una vez que haya terminado con esto, puede centrarse más en el aprendizaje automático avanzado desde udacity y la ventaja analítica de edX.

    Estoy en segundo año y estoy interesado en aprender sobre análisis de datos. ¿Donde debería empezar?

    Verificaría la respuesta de William Chen a ¿Cuáles son los mejores recursos gratuitos para aprender ciencia de datos?

    En resumen, da una lista de recursos, pero recomienda probar la clase CS109, Data Science, de Harvard, que está disponible gratuitamente en línea. Los requisitos previos para esta clase son un conocimiento básico de programación y estadísticas. Harvard también ofrece CS50 en línea, que le enseñará la programación, y Estadísticas 110 en línea.

    Con estas herramientas, mucha disciplina, una buena disposición para aprender y hacer preguntas, creo que estará en buen camino para aprender ciencia de datos.

    Sugeriré el instituto que tiene un entrenador de experiencia en la industria en Data Science. RStrainings es un nombre bien conocido en la formación de Data Science y Big Data Hadoop en Hyderabad. Tienen entrenadores expertos para Data Science y Big Data Hadoop que ya tienen experiencia laboral en vivo. Así comparte el conocimiento sobre los proyectos realizados.

    Obtenga una demostración gratuita sobre ciencia de datos e interactúe con el entrenador. Esto te ayudará a tener una idea detallada sobre el curso.

    Puede contactarlos en:

    Email

    [correo electrónico protegido]

    ·

    Número de teléfono:

    +91 9052 699 906

    ·

    Sitio web:

    http://www.rstrainings.com

    Te recomiendo que hagas el famoso curso de Introducción al aprendizaje automático en Coursera por Andrew Ng .

    La razón es que, en el curso, te da una idea de cada detalle de los algoritmos de aprendizaje más famosos. Esto se combina con prácticas prácticas en Matlab. Entonces, después del curso, tienes una idea básica de las cosas en Machine Learning. Después de esto, puede buscar otros cursos de su interés para elegir un proyecto que haga uso de este conocimiento.

    Puede comenzar a seguir el curso de Aprendizaje automático de Andrew Ng, desde Coursera o Introducción a Aprendizaje automático de Udacity, y comenzar a aprender Python lado a lado para mejorar sus habilidades de programación.

    Mi opinión personal es que, aparte de los cursos “estándar” (que son muy buenos), tiene que encontrar algún problema del mundo real, que se pueda resolver con data science / ML y trabajar duro durante un tiempo prolongado para resolverlo. En términos de ML: para mejorar sus resultados. Creo que es algo que le dará “instinto” sobre esta área.

    En mi opinión, es como cuando aprendes programación, tienes que saltar del ejercicio de escritura para diseñar tu primer sistema mínimamente útil.

    Regístrese para clases en Coursera o edX. Son gratis. Comience con clases como “Introducción a la ciencia de datos” y similares. Siga y lea blogs en línea para la ciencia de datos. También puede encontrar toneladas de tutoriales y scripts en línea.

    Así empecé yo. Pude cambiar mi carrera y ahora soy un científico de datos en Silicon Valley y no podría estar más feliz.

    La parte importante es la decisión de comenzar. Una vez que haya tomado una decisión y esté listo para comprometerse, el resto simplemente se alinea. Para ser un principiante, necesitará un curso que lleve tiempo para aprender los conceptos básicos antes de enseñar las porciones avanzadas.

    SAS es uno de los cursos de ciencia de datos más conocidos en la India que hace todo esto y más. Enseña a los estudiantes todos los conceptos básicos de Hadoop y SAS, junto con el modelado predictivo, etc. Te entrena a fondo.

    Los esfuerzos propios y la aplicación práctica continua de conceptos, junto con esta capacitación lo establecerán como científico de datos.

    E-Learning es la mejor manera de aprender sobre Data Science. Siga estos enlaces para saber más sobre ciencia de datos.

    Entrenamiento en línea de Hadoop – Entrenamiento en línea de Hadoop | Hub4Tech.com

    Hadoop Classroom Training – Entrenamiento de Hadoop en Noida

    Preguntas de la entrevista de Hadoop – Preguntas y respuestas de la entrevista de Hadoop

    Prueba en línea de Hadoop – Prueba en línea de Hadoop | Prueba en línea | Examen simulado

    Preguntas de la entrevista de Cassandra- Preguntas y respuestas de la entrevista de Cassandra

    Cloudera – Prueba de DataScientist – Examen de prueba en línea de Data Science Essentials Cloudera (DS-200)

    Cloudera – Prueba de administración de Hadoop – Examen de prueba de Hadoop de administrador certificado de Cloudera (CCA-500)

    Cloudera – Prueba de desarrollador de Hadoop – Examen de prueba de desarrollador de Hadoop certificado por Cloudera (CCD-410)