¿Cuáles son los mejores sitios para aprender ciencia de datos?

Al igual que mucha gente piensa en la ciencia de datos en términos de herramientas (R, Python, SQL, etc.), mucha gente piensa en aprender ciencia de datos en términos de recursos .

Sin embargo, lo más importante que debe descubrir antes de aprender ciencia de datos es el proceso , no los recursos. Con el proceso correcto, puede conectar cualquier recurso, pero seguir aprendiendo.

Piénselo de esta manera: a las personas que contratan científicos de datos no les importa los cursos que haya tomado, les importa lo que puede hacer por sus negocios. La clave es ubicarse en una posición en la que pueda contribuir de manera significativa.

Para llegar allí, debes hacer lo siguiente:

  • Aprenda a disfrutar analizando datos y buscando información
  • Comienza a construir proyectos y un portafolio
  • Presente sus ideas a los demás y aprenda a comunicarse
  • Trabaja con conjuntos de datos más grandes y supera tus límites

Este proceso implica automotivación, encontrar lo que le interesa y trabajar en proyectos. Puede leer más aquí, o ver el proceso en acción en Dataquest, donde este es nuestro método de enseñanza.

La clave es descubrir un proceso que lo motive y lo lleve a alcanzar sus objetivos de aprendizaje. Una excelente manera de hacer esto es:

  1. Aprende lo básico para comenzar a trabajar en proyectos
  2. Encuentra conjuntos de datos interesantes para analizar
  3. Comience a analizar conjuntos de datos y muestre sus resultados a otros
  4. Sigue haciendo análisis más complejos

En el camino, aprenderá naturalmente las habilidades que necesita (cuando las necesita para sus proyectos).

Analicemos esto paso a paso:

Aprende lo básico para comenzar a trabajar en proyectos

Esto significa aprender algunas estadísticas y programación básicas. Algunos buenos recursos son:

  • Codecademy: aprenda los conceptos básicos de la programación.
  • Khan Academy: aprende estadísticas y álgebra lineal.
  • OpenIntro Stats: aprenda estadísticas.
  • Dataquest: aprenda conceptos de ciencia de datos, incluidos análisis de datos, programación, trabajo con bases de datos y aprendizaje automático.
  • Automatice las cosas aburridas con Python: aprenda a usar Python de una manera práctica.

No pase demasiado tiempo aprendiendo lo básico: concéntrese en aprender lo suficiente como para comenzar a trabajar en proyectos.

Encuentra conjuntos de datos interesantes para analizar

Puede encontrar conjuntos de datos interesantes para analizar en bastantes lugares:

  • Cinco treinta y ocho
  • data.world
  • Kaggle

Puedes encontrar más recursos aquí. La clave es asegurarse de que esté interesado en los conjuntos de datos. Tienes que ser capaz de motivarte para construir varios proyectos.

Comience a analizar conjuntos de datos y muestre sus resultados a otros

Comience a analizar los conjuntos de datos utilizando herramientas como Jupyter Notebook y publique los resultados en un blog o Github. En Dataquest, le brindamos orientación estructurada mientras desarrolla estos proyectos. También puede intentar replicar las publicaciones de blog de las personas de los blogs aquí.

Intenta encontrar patrones interesantes y haz visualizaciones convincentes. Luego podrá compartir sus resultados, tanto en persona como en línea, en comunidades como:

  • Reunirse
  • / r / datascience
  • DataTau

Sigue haciendo análisis más complejos

Asegúrate de seguir presionándote para hacer un análisis más complejo. Esto puede aumentar el tamaño de los conjuntos de datos, aumentar el número de conjuntos de datos o utilizar técnicas más complejas.

Esto es crítico, ya que garantiza que sigas superando tus límites y aprendiendo.

La línea de fondo

Si sigue el proceso anterior, podrá aprender ciencia de datos y tener una cartera de proyectos sólida. La clave es asegurarse de que está trabajando en cosas que le interesan y de que está motivado a hacerlo.

¡Buena suerte aprendiendo ciencia de datos!

No hay una respuesta para esto. Tendrá que tomar varios cursos porque ser un buen “Científico de datos” significa tener un buen dominio sobre estadísticas, fundamentos de informática, programación, matemáticas (especialmente álgebra lineal) y otros temas relacionados.

Además, algunos cursos en línea cubren ciertos temas mejor que otros, por lo que tomar la mayor cantidad posible asegura que su cobertura del material sea lo más completa posible.

Algunos de los buenos que he visto son:

  1. Aprenda ciencia de datos interactivamente en línea. Comience gratis.
  2. DataCamp: Aprenda R, Python y Data Science en línea
  3. Sin embargo, la Especialización en Ciencia de Datos de la Universidad John Hopkins en Coursera, tenga cuidado con estos cursos. Si bien son populares, se basan en R, que no es el lenguaje más amigable para principiantes. Estos cursos solo se recomiendan para personas con una sólida formación previa en otro idioma, que quieran aprender los métodos de R y RStudio en Data Science.
  4. El curso de aprendizaje automático de Andrew Ng sobre Coursera también es muy popular y se recomienda para obtener una sólida comprensión matemática de los fundamentos de este tema.
  5. El plan de estudios de ciencia de datos de Microsoft no es malo (lo estoy trabajando en este momento), aunque está sesgado hacia el uso de productos de Microsoft, especialmente Azure Machine Learning.
  6. Los cursos de ciencia de datos y aprendizaje automático de Udacity son muy buenos. Su explicación de los árboles de decisión y los bosques aleatorios es probablemente la mejor que he visto en un curso en línea hasta la fecha.
  7. También necesitará conocer bien SQL, y hay numerosos lugares para aprenderlo. Uno de los cursos en el Currículo de ciencia de datos de Microsoft cubre SQL, y hay algunos cursos de SQL en Codecademy.

Creo que hay muchos sitios buenos para comenzar a aprender ciencia de datos, pero su elección final de los mejores sitios para aprender ciencia de datos dependerá de su estilo de aprendizaje.

Reconozco esto y es por eso que hice una infografía que enumera los 8 pasos que debe seguir para aprender ciencia de datos, con referencias a recursos en línea que puede consultar para llegar allí ( consulte la infografía para obtener recursos en línea y más información : Aprenda Ciencia de datos – Infografía).

Una breve descripción aquí:

Paso 1. Sé bueno en estadísticas, matemáticas y aprendizaje automático

Hay algunos sitios realmente sorprendentes que figuran en la infografía, como Khan Academy, OpenIntro, DataCamp: Learn R, Python & Data Science Online y Coursera | Cursos en línea de las mejores universidades. Únete gratis. Hay algunas diferencias entre todos estos sitios (y los que figuran en la infografía), pero realmente puedo recomendar OpenIntro y https://www.khanacademy.org/ .

Paso 2. Aprende a codificar

Esta fue, para mí, la parte más frustrante. Hay muchos sitios que pueden enseñarle cómo codificar, pero casi todos no pudieron mantenerme motivado. Como principiante, es muy desmotivador entender los mensajes de error del código y aquí es donde realmente me ayudaron los comentarios personalizados de DataCamp: Learn R, Python & Data Science Online.

Paso 3. Comprender las bases de datos

Grandes recursos para esto que puedo recomendar son: MongoDB University y DataStax.

Paso 4. Explore el flujo de trabajo de ciencia de datos

Esto también es bastante importante y la forma en que veo este paso es para tener una idea de cómo puede usar las bibliotecas a su favor cuando está haciendo ciencia de datos. En este punto, recomiendo sitios que ofrecen tutoriales gratuitos o cursos abiertos. De esa manera, todavía eres un poco guiado, pero también tienes suficiente libertad. En este punto, podría buscar cursos y tutoriales abiertos: artículos de análisis y ciencia de datos y cursos abiertos | DataCamp. Si ya está seguro, simplemente comience un pequeño proyecto en DrivenData o Your Home for Data Science (Kaggle).

Paso 5. Sube de nivel con Big Data

Principalmente estoy investigando este paso haciendo el curso edX en Spark. Es una recomendación real. Como una ventaja, puede buscar en la programación con Scala (¡que también puedo recomendar!)

Paso 6. Crecer, conectarse y aprender

Básicamente, vuelve a DrivenData o Your Home for Data Science (Kaggle) y se reta a sí mismo. Si necesitabas el tutorial paso a paso para superar los desafíos antes, prueba uno por tu cuenta y mira cómo te va. Además, reúnase con sus compañeros en Somos lo que hacemos | Grupos de Meetup

Paso 7. Sumérgete por completo

Participe en un bootcamp (Galvanize | Learn Code, Analytics, Data Science | Startup Space o Metis), obtenga una pasantía o un trabajo. La inmersión que elijas realmente dependerá de tu nivel y de tu nivel de conocimiento en temas de ciencia de datos.

Paso 8. Comprometerse con la comunidad

Suscríbase a un boletín informativo como el boletín semanal de ciencia de datos | DataScienceWeekly.org, únase a un grupo de Facebook, LinkedIn, Reddit y comience a interactuar. Haga una pregunta que también pueda ayudar a otros, responda a preguntas de otros, comparta material relevante, … También no olvide seguir a las personas clave de la industria de la ciencia de datos, para escuchar un podcast, …

Lo que eventualmente le interesará depende mucho de sus antecedentes y su estilo de aprendizaje. Si desea tener una visión general de algunos recursos más, no olvide consultar la publicación de blog Learn Data Science – Infografía y Learn Data Science – Resources for Python & R.

No creo que haya un “mejor lugar” para aprender ciencia de datos.

Para empezar, la ciencia de datos es un vasto campo intelectual que abarca múltiples áreas: desde la recopilación de datos hasta la visualización de datos.

Además, aprender de una sola fuente conducirá a un conocimiento incompleto y frágil.

Ahora, si está comenzando y desea un recorrido rápido por los diferentes subcampos que constituyen la ciencia de datos, puede echar un vistazo a Dataquest [1]. La mayoría de los cursos están en Python [2] y no son gratuitos, pero valen la pena. Otra buena opción es DataCamp [3] para aquellos que están familiarizados con R [4].

Es un buen lugar para empezar. Una vez que se sienta cómodo con lo básico, sugeriría encontrar un proyecto y trabajar en él. Github [5] es un buen lugar para inspirarse.

La mejor de las suertes.

Asegúrese de seguirme para obtener más respuestas: http://quora.com/profile/Yassine

Notas al pie

[1] Aprenda ciencia de datos interactivamente en línea. Comience gratis.

[2] Bienvenido a Python.org

[3] DataCamp: Aprenda R, Python y Data Science en línea

[4] R (lenguaje de programación) – Wikipedia

[5] Desarrollar mejor el software, juntos

Antes de comenzar a trabajar con datos y entrar en la carrera de ciencia de datos y gestión de datos, debe obtener algunos fundamentos básicos sobre cómo comenzar, qué comenzar y desde dónde comenzar.

Antes de pasar al aspecto técnico de la ciencia de datos, debe reunir el conocimiento de datos, fuentes de datos, limpieza de datos, modelos, regresión y otros conceptos de estadística y matemáticas. Para aquellos que no han recibido su educación en tales disciplinas, puede ser un poco difícil comenzar, pero si aspira a aprender las cosas, le resultará fácil familiarizarse con la ciencia de datos.

Hay varias formas a través de las cuales uno puede aprender la gestión de big data o la ciencia de datos. Los videos de YouTube son la fuente más grande y barata para esto, pero pueden ser de ayuda solo para aquellos que ya conocen los conceptos básicos de la gestión de datos y no necesitan ninguna certificación para eso. O lo otro que se puede hacer es ir a la página de inicio, ingresar ” cursos para ciencia de datos ” en el cuadro de búsqueda para ver lo que se ofrece actualmente. Obtendría varios éxitos en los cursos.

Pero por su conveniencia , menciono algunos sitios web donde puede obtener estos cursos. Algunos de estos son gratuitos y otros son de pago.

· Ibm

· Dataquest

· KDNuggets

· Udacity

· Udemy

· Dataquest

· Edx

· Coursera

· Grupos de LinkedIn

· Academia virtual de Microsoft

· MapR

· Hadoop tutorials.com en línea

· Hortonworks

· DeZyre

· Coreservlets

También puede optar por cursos de Digital Vidya para big data y análisis de datos. Los cursos que ofrecen estos sitios cubren las técnicas exploratorias esenciales para resumir los datos. Y se centra en los conceptos y las herramientas detrás de la presentación de informes de análisis de datos modernos de manera reproducible. Repase todos estos mencionados una vez y obtendrá los cursos deseados.

¡Buena suerte!

Puede contactarnos en Collabera TACT !!

Mucho se ha dicho sobre la ciencia de datos y su importancia en el mundo corporativo actual. En el mundo corporativo, casi todas las decisiones se toman en base a un análisis cuidadoso y científico de los datos. Los datos se han generado en petabytes y Exabyte a diario. Los datos solo van a crecer, eso también a un ritmo extremadamente rápido. Entonces, una cosa es segura de que Data Science no es una burbuja que explotará en algún momento, sino que irá mucho más avanzada y más rápida en los próximos días. En este artículo descubrirá qué son estos “datos” y qué es la “ciencia de datos” y qué significa para usted.

La ciencia de datos se puede definir como una combinación de varios métodos, procesos y sistemas científicos para extraer información de los grandes conjuntos de datos (que de otro modo estaría oculto). Desde el surgimiento de Internet, ha habido un aumento constante en el aumento de datos, y la introducción de plataformas de redes sociales como Facebook, Twitter, Instagram, etc., junto con los teléfonos inteligentes avanzados ha contribuido enormemente en la generación de datos. . Independientemente de lo que haga un individuo en las plataformas de redes sociales, comparta una publicación, publique un comentario, como un anuncio, e incluso una simple búsqueda se registra y agrega a la enorme cantidad de datos.

Todo está en línea hoy. De la lista de amigos de las personas, el comportamiento de compra, las imágenes, lo que les gusta y lo que no les gusta, su opinión sobre una cosa o tema en particular, etc. Todos estos detalles (datos) sobre las personas pueden analizarse científicamente y utilizarse para crear un mejor entorno en línea. Desde sugerir los libros, películas y videos que podrían gustarles, o sugerir un artículo que podría estar interesado en comprar.

Un ejemplo incluiría, Netflix, utiliza los datos de millones de usuarios con respecto a las películas y los programas que han visto, los actores que les gustan y el tipo de películas que les gustan. Después de ejecutar un algoritmo avanzado (parte de la ciencia de datos) en estos datos, vienen con la lista de películas o programas que un individuo estará más interesado en ver y comienzan a “sugerirles” estas películas.

Es posible que ya haya notado lo mismo en YouTube, cuando ve pocos videos en YouTube; comienza automáticamente sugiriéndote más videos según lo que viste. Esto puede parecer muy simple, pero hay algoritmos complejos que se ejecutan en segundo plano que lo hacen posible.

Los datos pueden haber recorrido un largo camino, pero la verdad es que apenas ha comenzado. Existe un enorme potencial en el campo de la ciencia de datos y campos relacionados como el aprendizaje automático y la inteligencia artificial.

La capacitación en ciencia de datos de habilidades de TI se ha estructurado para aquellos que desean desarrollar los conocimientos y habilidades avanzados necesarios para trabajar como científicos de datos. Obtenga su certificación de ciencia de datos y destaque, ya sea que esté buscando cambiar de trabajo, obtener una promoción o mejorar sus habilidades actuales.

Data Science Certificate Training ha sido diseñado para prepararlo para un trabajo en el espacio analítico. El curso de certificación de ciencia de datos lo convertirá en un experto en la comprensión del problema, el diseño del análisis y la aplicación de técnicas de modelado predictivo utilizando R para obtener información comercial de los datos. R es el lenguaje de programación más utilizado hoy en día en el campo de la ciencia de datos y el análisis.

Data Science es la combinación de estadísticas, matemáticas, programación, resolución de problemas, captura de datos de manera creativa, la capacidad de ver las cosas de manera diferente y la actividad de limpiar, preparar y alinear los datos.

En el programa de certificación de ciencia de datos, obtendrá habilidades en gestión de big data, análisis avanzado, aprendizaje automático y visualización de datos, junto con las habilidades de comunicación esenciales que necesitan los científicos de datos de hoy.

¿Quién debe ir para el curso de certificación de ciencia de datos?

  • Profesional de gestión de datos
  • Arquitectos y desarrolladores que desean convertirse en expertos en análisis
  • Analistas de datos que lideran un equipo de analistas
  • Profesionales de TI que buscan un cambio de carrera en el campo de la analítica.
  • Profesionales o estudiantes que desean convertirse en científicos de datos.
  • Profesionales que trabajan en el campo de la analítica de datos y negocios
  • Profesionales de Hadoop que desean aprender técnicas de R y ML
  • Cualquiera que busque una carrera en Big Data

Prerrequisitos para aprender Ciencia de Datos ?????????

Para más detalles
Llámenos + 91–9108460133
http://www.it-skillstraining.com

Data Science se ha convertido en una palabra de moda en la industria de TI. En los últimos años estamos escuchando este término con bastante frecuencia. Si vas hace varios años, esta palabra de ciencia de datos no estaba allí. Por lo tanto, primero debe saber cómo apareció esta palabra.

Si regresa a la historia, hace 30 años , teníamos DBMS , donde los datos se almacenaban en archivos, cada archivo no estaba relacionado con los demás. La dificultad fue que tuvimos que escribir muchos programas para correlacionar los dos archivos.

Luego nos mudamos a RDBMS donde los datos se almacenaron en tablas y las tablas eran lo suficientemente inteligentes como para formar relaciones y nos sentimos cómodos al traer los datos de múltiples tablas y no necesitábamos escribir programas largos y una simple estructura SQL haría el trabajo. Pero el problema era que los diferentes RDBMS no estaban correlacionados cuando tuvimos que traer los informes que no pudimos hacer.

Luego nos mudamos a Data Warehouse donde fusionamos datos de varios RDBMS y pudimos hacer nuestro análisis.

Para el año 2000, cuando ocurrió la penetración de Internet, el tamaño de los datos aumentó a 1000 veces y nuestra forma convencional de manejar los datos no fue capaz de hacer el trabajo, por lo que Big Data entró en escena.

Big Data pudo procesar grandes datos a través de diversas herramientas y técnicas. Pero el problema era que el resultado de una gran cantidad de datos era bastante grande, por lo que la solución para eso era no producir un gran resultado, sino un resumen estadístico, así que así fue como llegó Data Science.

Entonces han entendido de dónde proviene esta ciencia de datos. Ahora te diré todo lo que se requiere para convertirte en un Científico de Datos y de dónde puedes aprender a dominarlo.

Para convertirse en científico de datos, tendrá que dominar un conjunto de habilidades, que van desde el aprendizaje automático hasta el análisis de negocios y big data.

Las principales habilidades que debe tener son: –

  1. Habilidades Fundamentales (Consiste en Programación, Estadística y Probabilidad)
  2. Habilidades técnicas (consiste en recopilación de datos, SQL, visualización de datos y aprendizaje automático)
  3. Habilidades empresariales (comunicación, innovación, análisis, operaciones y estrategia)
  4. Habilidades de procesamiento y análisis (procesamiento del lenguaje, análisis de series de tiempo)
  5. Habilidades de práctica y resolución de problemas

Los mejores sitios web para la formación en ciencia de datos son: –

Intellipaat

edX

Coursera

Udacity

DataCamp

Puede consultar este video tutorial sobre Data Science para tener una idea justa sobre Data Science si está entrando en este dominio. Viaje a la ciencia de datos

Vota amablemente si te resulta útil. Gracias 🙂

Data Science es una de las carreras más buscadas en este momento. Hay una razón por la que existe la exageración en la ciencia de datos. El enfoque fundamental de la ciencia de datos es que ayuda al ser humano a tomar mejores decisiones, decisiones más rápidas. Y no es que esto sea un requisito de solo un puñado de industrias de un segmento en particular. Esto es cierto en todas las industrias, incluso cuando las decisiones están automatizadas, por ejemplo, en compras en línea, venta minorista, etc.

Hay un rápido crecimiento en el campo de la ciencia de datos. Su importancia es directamente proporcional al nivel récord de aumento en la materia prima, es decir, datos estructurados y no estructurados. Hay una serie de otros factores que están agregando importancia a este campo. El número de sensores que acumulan información como Internet, teléfonos, etc., junto con técnicas avanzadas y sofisticadas de aprendizaje automático que ayudan a proporcionar una mejor información con la ayuda de mejores algoritmos de extracción. Todas estas fuerzas están trabajando en una dirección, la dirección para garantizar que las habilidades de utilizar los datos disponibles para extraer información procesable para que las empresas tengan un mejor impacto en la toma de decisiones, lo que a su vez afectará los ingresos de la empresa, llegó para quedarse. Reconociendo esto, la mayoría de los MBA también han introducido Data Science en su plan de estudios de MBA.

¿Qué habilidades aprende uno para convertirse en un Data Scientist efectivo?

Los bits grandes de datos no estructurados no son fáciles de interpretar, uno necesita un conjunto de habilidades único, uno necesita desarrollar habilidades auxiliares útiles, algunos atributos técnicos necesarios para aplicar es la línea superior. Uno necesita crear un equilibrio perfecto de varias habilidades. Modelado predictivo, análisis, habilidades de organización y, sobre todo, habilidades de comunicación.

Además de lo anterior para poder asegurar un trabajo lucrativo en la organización de su elección, uno necesita desarrollar habilidades de codificación excelentes y valiosas. La eficiencia en el sistema de análisis estadístico, lenguaje de programación R, lenguaje de programación Python, etc., ayuda aún más sus habilidades como científico de datos o analista. Le ayuda a pensar lógicamente en términos de algoritmos, lo que a su vez le permite administrar mejor los datos irrelevantes.

Otro conjunto adicional de habilidades que es esencial tener académicamente y a través de la experiencia es la comprensión contextual de cualquier situación dada, habilidades en probabilidad y estadísticas.

Y finalmente, la más importante de todas las habilidades es la capacidad de comunicar, explicar, en el método y el lenguaje de la audiencia, sus hallazgos. Así que las habilidades de narración y presentación se vuelven imprescindibles

¿Por qué Data Science Prodegree en Imarticus Learning?

Para comenzar, el Data Science Prodegree en Imarticus está diseñado en asociación con Genpact como socio de conocimiento. Esencialmente cubre todos los conceptos fundamentales y ofrece aprendizaje práctico de herramientas analíticas líderes como SAS, R, Python, Tableau, etc., y el aprendizaje se integra con estudios de caso y proyectos relevantes de la industria, lo cual es esencial para obtener un problema en profundidad. -Capacidad de resolución.

El curso se divide en cuatro semestres y se centra en garantizar que el candidato no solo obtenga el conocimiento teórico de las herramientas, sino que también aprenda las mejores prácticas de la industria y las perspectivas comerciales a través de la interacción en vivo con los gurús del mundo corporativo a través de conferencias invitadas y la presentación regular de proyectos. . Para garantizar la máxima eficacia del aprendizaje, el curso dura más de 200 horas y se imparte en dos modos, en línea y en el aula.

El curso también ofrece asistencia para la preparación profesional, en Imarticus the Career Assistance Services le brinda asesoramiento personalizado específico de la industria, con asistencia en talleres de creación de currículums y entrevistas simuladas.

Data Science Prodegree es un curso potente respaldado por Genpact, que tiene una cobertura integral ayudada por el aprendizaje basado en proyectos, con una entrega de programas efectiva y eficiente junto con asistencia profesional. Preparándote para aplicar con confianza tus habilidades recién aprendidas y sobresalir en tu puesto desde el primer día, lo que te convierte en un tomador de decisiones impulsado por los datos.

Esta respuesta es para principiantes. Así es como estudio actualmente el aprendizaje automático, la PNL y la minería de datos.
Aprender

  • Pitón
  • R
  • Procesamiento natural del lenguaje
  • Aprendizaje automático
  • k-medias
  • Máquinas de vectores de soporte (SVM)
  • Vecinos k-más cercanos (kNN)
  • Ingenuo Bayes.
  • Racimo

Estos son algoritmos muy útiles utilizados en la minería de datos.

Tool-Ki t

  • Scikit-learn
  • NLTK
  • Weka
  • SAS

Análisis de los datos

  • El proyecto R para computación estadística
  • Pandas – Bibliotecas de Python
  • Julia Language
  • IPython y júpiter

Recursos en línea

  • CS109 Data Science
  • Pensamiento estadístico para ciencia de datos y análisis
  • Introducción a Big Data con Apache Spark
  • Conceptos básicos de ciencia de datos y aprendizaje automático
  • Excel para análisis de datos y visualización
  • Cursos de ciencia de datos: Tutoriales de análisis de R y Python | DataCamp
  • Aprendizaje automático
  • Recursos comunitarios de ciencia de datos curados (2018)

Aprendizaje profundo

Cursos de aprendizaje profundo Cursos de aprendizaje profundo

Hadoop y Spark

  • Página en coursera.org
  • Introducción a Big Data
  • Introducción a Big Data Analytics
  • Aprendizaje automático con Big Data
  • Plataforma Hadoop y marco de aplicaciones
  • Big Data – Proyecto Capstone
  • Analista de HDP: Ciencia de datos – Hortonworks
  • Analista de HDP: Apache HBase Essentials – Hortonworks
  • Tutoriales de Hadoop de Hortonworks: estos tutoriales están diseñados para facilitar su desarrollo con Hadoop.

    Corrígeme si me equivoco. Esta es la jerarquía que estoy siguiendo actualmente.
    Chicos, una cosa que entiendo El aprendizaje automático es un tema muy importante en Data Analyst Big Data y Data Mining.

    Todo lo mejor 🙂

    appliedaicourse.com es un curso en línea que consta de más de 140 horas de contenido que cubre

    Pitón,

    Probabilidades y estadísticas,

    Álgebra lineal,

    La visualización de datos, más de 25 técnicas de aprendizaje automático, las técnicas de aprendizaje profundo más importantes y más de 10 estudios de casos del mundo real resolvieron problemas de resolución de extremo a extremo en empresas como Amazon, Facebook, Quora, Uber, Netflix, etc.

    Este curso está dirigido a estudiantes y profesionales que trabajan y desean seguir carreras en IA / ML. Ayuda a los participantes del curso a crear un portafolio de más de 5 proyectos para mostrar su trabajo a posibles reclutadores.

    Puede encontrar algunos ejemplos de carteras de estudiantes actuales aquí. Este curso es muy útil para los estudiantes que buscan seguir carreras en IA. También brindan un excelente servicio al cliente, orientación profesional y certificación para el curso

    El wiki de respuestas tiene docenas de excelentes recursos, siempre es aconsejable comenzar con los gratuitos. Descubra que le gusta trabajar con ciencia de datos y proyectos de construcción antes de comprometerse con una escuela o un programa intensivo.

    Voy a lanzar un campamento de arranque más en la mezcla allí: el campo de entrenamiento de ciencia de datos flexibles de Thinkful (divulgación: trabajo en Thinkful). A diferencia de los bootcamps en persona, Thinkful está 100% en línea, por lo que puede llevarlo desde cualquier lugar a su propio horario. Los estudiantes trabajan 1-a-1 con un mentor personal, que es un científico de datos profesional . Hay una gran ventaja en eso: no solo no está limitado por los horarios de clase y los viajes diarios tradicionales, sino que también tiene acceso directo a su mentor en lugar de ser solo un estudiante entre filas de escritorios.

    El plan de estudios fue escrito en colaboración por científicos de datos del Instituto Max Planck, Uber y Thinkful. Con un enfoque basado en proyectos, los estudiantes aprenden conceptos, los practican en simulacros y luego construyen proyectos de análisis de datos del mundo real para desglosar información compleja y contar su historia a los lectores. Dado que la ciencia de datos se puede utilizar en muchos campos, el curso le permite especializarse en lo que sea más relevante para usted : bioinformática, aprendizaje automático, periodismo de datos, etc.

    Si ya has experimentado con la ciencia de datos y estás buscando sumergirte en un programa que te preparará para el trabajo en el campo, échale un vistazo.

    • Científico de datos

    Este curso te prepara para el papel de científico de datos haciéndote dominar

    en Estadística, Ciencia de datos, Big Data, Programación R, Python y SAS

    • Sobre el programa

    ¿Cuáles son los objetivos de aprendizaje?

    La capacitación en línea de Bytes lo ayudará a dominar habilidades y herramientas como

    1 estadísticas

    2. Prueba de hipótesis

    3 agrupamiento

    4 árboles de decisión

    5.Liner

    6. Estudio de regresión logística R

    7. Visualización de datos, modelos de regresión, Hadoop, spark, PROC SQL, macros SAS, procedimientos estadísticos, análisis avanzado, Matplotlib, funciones de análisis de Excel Pruebas de hipótesis, Zookeeper, interfaces Kafka. Esta habilidad lo ayudará a prepararse para el papel de científico de datos.

    El programa proporciona acceso a contenido de aprendizaje electrónico de alta calidad, exámenes de simulación, una comunidad moderada por expertos y otros recursos que lo ayudan a seguir el camino óptimo hacia el papel de sus sueños como científico de datos.

    • ¿Por qué ser un científico de datos ?

    El científico de datos es la plataforma exitosa en una organización de análisis. Glassdoor ha clasificado al científico de datos en el primer lugar entre los 25 mejores trabajos para 2016

    2. Los buenos científicos de datos son menos y tienen una gran demanda de datos que necesitará para comprender el problema del negocio, diseñar el análisis, recopilar y formatear los datos requeridos, aplicar algoritmos o técnicas utilizando las herramientas correctas y finalmente hacer recomendaciones respaldadas por datos.

    • ¿Por qué deberías unirte?

    1] Acelere su carrera en ciencia de datos con APDS de IIM C

    2] Obtenga una base firme en herramientas cuantitativas y satánicas avanzadas para ayudar con la toma de decisiones efectiva

    3] Aprenda la aplicación de Techinques de ciencia de datos en varios dominios

    4] Aprenda en cualquier momento en cualquier lugar con clases interactivas en vivo en línea

    • ¿Quién debe unirse?

    1] Trabajando con ambición profesional para convertirse en Data Scientist

    2] Ejecutivo interesado en los campos de análisis y gestión de datos.

    3] Los ejecutivos en el campo de la gestión encuentran un mayor conocimiento de diversas técnicas y habilidades analíticas hábiles.

    • ¿Qué proyectos están incluidos en este programa?

    Este científico de datos domina en más de 17 proyectos reales basados ​​en la industria en diferentes dominios para ayudarlo a dominar conceptos de ciencia de datos como gestión de datos, estadísticas, big data.

    Proyecto 1 : Aprenda cómo la industria líder de atención médica utiliza la ciencia de datos para controlar el crecimiento empresarial.

    Dominio : Atención de salud

    Proyecto 2 : Comprenda cómo los líderes de seguros como Berkshire Hathaway, AIG, AXA, etc. hacen uso de Data Science trabajando en proyectos de la vida real basados ​​en seguros.

    Dominio : Seguros

    Proyecto 3 : vea cómo bancos como Citigroup, Bank of America ICICI, HDFC utilizan la ciencia de datos para mantenerse a la vanguardia de la competencia.

    Dominio : Banca

    Proyecto 4 : Aprenda cómo los mercados de valores como NASDAG, NSE, BSE, se mantienen en Data Science & Analytics para llegar a datos utilizables de conjuntos de datos complejos.

    Dominio : Mercado de valores

    Proyecto 5 : vea cómo se usa la ciencia de datos en el campo de la ingeniería al retomar este estudio de caso de MovieLens Dataset Analysis.

    Dominio : Ingeniería

    Proyecto 6 : Comprenda cómo las empresas líderes como Walmart, Amazon, Target, etc. utilizan Data Science para analizar y optimizar la ubicación de sus productos.

    Dominio : Minorista

    • Herramientas cubiertas

    1] Herramientas de análisis avanzadas

    2] Herramientas de almacenamiento de ampamp de recolección de datos

    3] Herramientas ETL

    4] Sistema de archivos

    5] Herramientas de programación

    • Ruta de aprendizaje

    Curso 1: – Ciencia de datos con formación SAS

    Curso 2: – Capacitación en certificación de ciencia de datos – Programación R

    Curso 3: – Desarrollador Big Data Hadoop & Spark

    Curso 4: – Ciencia de datos con Python

    Curso 5: – Business Analytics con Excel

    Curso 6: – Apache Kafka

    • 40 técnicas de ciencia de datos

    1] Regresión del trazador de líneas

    2] Regresión logística

    3] Regresión de navaja

    4] Estimación de densidad

    5] Intervalo de confianza

    6] Prueba de hipótesis

    7] Reconocimiento de patrones

    8] Agrupación

    9] Aprendizaje supervisado

    10] Series temporales

    11] Decisión Tress

    12] Números aleatorios

    13] Simulación Montecarlo

    14] Estadísticas bayesianas

    15] Bayes ingenuos

    16] Análisis de componentes principales

    17] Conjuntos

    18] Redes neuronales

    19] Máquina de vectores de soporte

    20] Vecinos más cercanos

    21] Indexación / catalogación

    22] Selección de funciones

    23] (Geo) modelado espacial

    24] Motor de recomendación

    25] Motor de búsqueda

    26] Modelado de atributos

    27] Filtrado colaborativo

    28] Sistema de reglas

    29] Análisis de enlace

    30] Reglas de asociación

    31] Motor de puntuación

    32] Segmentación

    33] Modelado predictivo

    34] Gráfico

    35] Aprendizaje profundo

    36] Teoría del juego

    37] Imputación

    38] Análisis de supervivencia

    39] Arbitraje

    40] Modelado de elevación

    41] Optimización del rendimiento

    42] Validación cruzada

    43] Ajuste del modelo

    44] Algoritmo de relevancia

    45] Diseño experimental

    • 8 habilidades de ciencia de datos que lo contratarán

    1] Habilidades de programación

    2] estadísticas

    3] Aprendizaje automático

    4] Cálculos multivariables y álgebra lineal

    5] Disputa de datos

    6] visualización de datos y comunicación

    7] ingeniería de software

    8] Intuición de datos

    • Los 10 mejores algoritmos y métodos utilizados por el científico de datos

    1] Regresión

    2] Agrupación

    3] Árboles de decisión / reglas

    4] Visualización

    5] K-vecinos más cercanos

    6] PCA

    7] Estadísticas

    8] Bosques al azar

    9] Serie temporal / secuencia

    10] Minería de texto

    Para obtener más información, visite: – Descripción general de la ciencia de datos

    Saludos Aspirante!

    Parece que hay una gran cantidad de respuestas a esta consulta; ¡Sin embargo, me gustaría ofrecer mis 2 centavos!

    · La investigación es algo bueno, pero uno no debería confundirse en última instancia

    · La decisión de unirse a un curso debe basarse en la comida para llevar esperada

    · Lo más importante: ¿dónde se encuentra?

    La mayoría de las veces, los buscadores como usted son novatos en el dominio de la ciencia de datos y realmente no saben por dónde empezar. He ilustrado un enfoque paso a paso para lograr su objetivo de convertirse en científicos de datos

    · Comience su investigación con los portales de empleo y comprenda los requisitos de la industria de la ciencia de datos hoy

    · Examine el plan de estudios de los diversos institutos de capacitación y seleccione los mejores que cumplan con sus requisitos

    · Establezca un objetivo para completar el curso y la fecha aproximada para el cambio de trabajo. (Si el tiempo y el dinero no son una limitación muy grande, puede solicitar los programas de un año de una de las principales escuelas de la India)

    · Entre la elección del aprendizaje a su propio ritmo (videos grabados) y las clases en línea en vivo, elija las clases en vivo ya que crea un compromiso de tiempo

    · Asegúrese de asignar la misma cantidad de tiempo, si no más, para el autoestudio para cada cápsula en línea a la que asista

    · Muchos institutos afirman que ofrecen tareas y proyectos Capstone. Exija acceso para aquellos y también complételos diligentemente. Muy a menudo, el proyecto abarcará una gran cantidad de aprendizaje obtenido en el curso

    · Solicite tantos trabajos como sea posible y asista a tantas entrevistas como estas entrevistas sirvan como una gran experiencia de aprendizaje

    Ahora llegando a la pregunta más importante “elección del instituto”; Y como otros han mencionado, no hay una respuesta fácil o directa. Sin embargo, he tratado de enumerar algunos pasos para facilitar la decisión.

    · Nunca evite dar sus detalles al vendedor. Nadie puede obligarlo a unirse a un curso si no desea

    · Hable con los ejecutivos de ventas y también trate de hablar con los entrenadores.

    · Vea algunos de los videos de muestra de la capacitación.

    · Revise las revisiones en línea del instituto

    · Obtenga una estimación del período de tiempo para cuando se complete todo el curso, incluido el proyecto final

    · Explore la posibilidad de sesiones de clase en su ciudad

    · Por último, pero definitivamente no menos importante, tenga en cuenta el factor de costo

    Espero que mi publicación anterior lo ayude a proporcionar algunas ayudas para elegir su curso e instituto de ciencias de datos. Si bien estoy asociado con las soluciones ExcelR e Innodatatics, que son empresas líderes de capacitación y consultoría, respectivamente, he tratado de mantener mi respuesta lo más neutral y “no promocional” posible.

    Sin embargo, si decide considerar la Solución ExcelR, haremos todo lo posible para brindarle la orientación adecuada.

    También puede ver algunas de mis otras publicaciones para su investigación.

    ¡Feliz aprendizaje!

    Si está buscando recursos gratuitos, The Open Data Science Masters tiene muchos de ellos, comenzando con matemáticas y computación, y muchas recomendaciones para cursos de ciencias de datos en Python y R.

    Andrew Ng’s Machine Learning, CalTech’s Learning from Data y John Hopkins Data Science Specialization son algunos de los cursos conocidos que puedo recomendar.

    Si estás interesado en cursos pagos, puedes echar un vistazo a Udemy: José Portilla es bueno enseñando R y Python allí.

    Otra recomendación: trampolín donde estoy trabajando como mentor. Los mentores lo ayudan con los obstáculos de aprendizaje, le brindan retroalimentación sobre su proyecto y pueden brindarle consejos profesionales de primer nivel.

    Uno de los mejores sitios es Edwisor – Home es una startup india que brinda capacitación en ciencia de datos, estas son algunas de las cosas,

    1) 100% de colocación: Sí, si sigue sus instrucciones correctamente, definitivamente obtendrá su trabajo. No hay nada como muchas otras instituciones, que le prometen una colocación del 100% pero nunca escuchan su preocupación después de obtener el dinero. Edwisor valora su palabra, cliente y estudiantes. Escucharán su inquietud de manera más penosa e intentarán resolverlo hasta el final.

    2) Provisión de reembolso: esta es la mejor razón para estar convencido de que el editor entregará lo que dice. Anteriormente pensé que esto era una trampa, pero estaba equivocado. Puedo decir esto porque personalmente me beneficié de ello.

    3) Calidad: la calidad de la enseñanza es la mejor (especialmente en mi caso donde Aditya Sir fue el mentor), así que como asistente de nexbyte.com, me gustaría mencionar algunos puntos más y eso es,

    1) Puedes confiar en la palabra de edWisor | Obtener la habilidad Representante contratado, a diferencia de la mayoría de los institutos en la India.

    2) Creo que la respuesta escrita por el Sr. Raman Deep es suficiente para confiar en edWisor | Obtener habilidades Obtener contratado.

    3) Diría que, después de la inscripción, solo siga las instrucciones y, si tiene algún problema, hable con ellos sin dudarlo. Siga este proceso hasta o hasta que no obtenga su solución.

    https://edwisor.com/career-data-

    puedes contactarme en [correo electrónico protegido] para obtener un descuento adicional de 1000rs.

    Data Scientist es considerado como “El trabajo más sexy del siglo XXI”

    Los científicos de datos son responsables del análisis de datos con el objetivo de descubrir ideas que a su vez pueden proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Su función es analizar datos desde diferentes ángulos, determinar qué significa y luego recomendar formas de aplicar esos datos. Emplean sofisticados programas de análisis, aprendizaje automático y métodos estadísticos para preparar los datos para su uso en modelos predictivos y prescriptivos. También son responsables de comunicar las predicciones y hallazgos a los departamentos de administración y TI a través de visualizaciones e informes efectivos.

    Me alegra mucho saber que está interesado en Data Science y que ya comenzó a hacerlo. Ahora, ser un Científico de Datos no es pan comido, requiere muchas habilidades y prácticas involucradas en el dominio. Para eso se requiere ser entrenado adecuadamente por un experto en la industria con la experiencia adecuada. Debe estar familiarizado y tener experiencia en Estadística, Programación R, Modelado predictivo, Algoritmos de aprendizaje automático y Minería de texto.

    Aparte de eso, le sugiero que haga muchos proyectos y tareas para tener éxito y practicar lo que ha aprendido a lo largo de todo el proceso, y que alguien de la industria lo valide.

    edWisor es una de esas plataformas que proporciona una combinación de capacitación en vivo y en línea de Data Scientist de profesionales con experiencia en la industria.

    ¡Todo lo mejor!

    Gracias.

    Siendo un científico de datos, recomendaría Edureka Proporciona formación en línea sobre certificación de ciencia de datos | Curso de Python para la ciencia de datos | Edureka Además, primero le recomendaría que revise este video introductorio para comprender por qué y cómo debe optar por Data Science y luego usar su sabio sentido del juicio para continuar con el curso pagado.

    Descripción del curso de ciencia de datos

    Edureka Data Science Certification Training ofrece:

    • Conocimiento profundo de la estadística, que es el corazón de la ciencia de datos.
    • Le permite adquirir experiencia en Machine Learning y sus mecanismos.
    • Ahora, dado que la mayoría de las industrias prefieren R y Python para practicar Data Science, Edureka asegura que ganes experiencia en ambos.
    • Por lo tanto, hay dos cursos para Data Science: uno en R Data Science Course | Capacitación en certificación de ciencia de datos | Edureka y el otro en Python Data Science Certification Training | Curso de Python para la ciencia de datos | Edureka
    • Ambos cursos cubren una gran profundidad en Data Science, lo que le permite resolver estudios de casos de la vida real en diferentes dominios: minorista, bienes de consumo, telecomunicaciones, recursos humanos, redes sociales, etc.
    • El curso se enriquece con 34 estudios de caso exhaustivos y 3 proyectos de certificación de extremo a extremo, suficientes para que pueda aterrizar como Científico de Datos .

    Características de Edureka

    Además de todo esto, Eduerka ofrece algunas características excelentes para sus alumnos:

    • Cursos en línea en vivo, clases interactivas con atención individual.
    • 24 * 7 soporte ninjas a sus órdenes
    • Cursos en línea con estudio de caso relevante para la industria
    • Certificación reconocida por la industria
    • Acceso de por vida al material de referencia.
    • Gerente de aprendizaje exclusivo

    Edureka proporciona una buena lista de videos Tutoriales de ciencia de datos. Te recomendaría que pases por esto

    La ciencia de datos es un campo muy rápido, que tiene muchos componentes para aprender. Por lo tanto, depende de sus antecedentes y del subcampo de ciencia de datos sobre el que desea aprender.

    En general, algunas de las habilidades requeridas son álgebra lineal, estadística, probabilidad, codificación, bases de datos, algoritmos, aprendizaje automático y big data. Algunas de las buenas opciones son

    1. Python- MIT cursos 1 y 2 en edx.
    2. Bases de datos, curso de bases de datos SQL-Stanford (un curso obligatorio)
    3. Curso de aprendizaje estadístico de Stanford, siga este curso con el libro ISLR. La ventaja analítica de MIT es una opción similar.
    4. Estadística de Stanford y curso de probabilidad.
    5. Curso de Caltech en aprendizaje automático en edx.
    6. Datacamp: para referencias específicas de ciencia de datos para R y python. Solo la parte de introducción es gratuita para cada curso
    7. Para cálculo, álgebra lineal y probabilidad edx tiene muchas opciones gratuitas.
    8. R-John Hopkins R cursos en coursera. No gratuito

    En resumen, sugeriría que seguir solo cursos gratuitos de Edx, Mit ocw y Stanford en línea sean más que suficientes.

    Si desea una sola fuente, Edx es la mejor fuente porque se pueden auditar los cursos de forma gratuita. Los cursos son de las mejores universidades. En edx intenta seguir universidades como MIT, Berkeley, Harvard. Los cursos que siguen el mismo plan de estudios que para las clases de tiempo completo son difíciles pero vale la pena hacerlo. Puede obtener un certificado pagando la tarifa mínima.

    Para el trabajo de proyecto de aprendizaje automático, comience con kaggle. Los núcleos de Kaggle y las discusiones ayudan mucho.

    Antes de continuar, veremos qué es Data Science.

    La ciencia de datos le permite extraer conocimiento de datos sin procesar, datos sin procesar que no son más que información. Es un campo interdisciplinario; es decir, utiliza técnicas de muchos campos como matemáticas, estadística, ingeniería de datos, visualización, almacenamiento de datos, etc., con el objetivo de extraer conocimiento útil de los datos / información disponibles.

    La ciencia de datos es un campo en crecimiento, y muchas empresas multinacionales lo buscan hoy en día. Debido al menor número de científicos de datos calificados y competentes en comparación con la demanda; Hay un espacio que necesita ser llenado.

    Si posee una licenciatura en Matemáticas, estadística, informática, gestión de la información, economía o finanzas; puede asumir el rol de analista de datos. Teniendo en cuenta que esto no es un ultimátum, debes saber que mucho depende de tu habilidad, experiencia personal y conocimientos técnicos. Pero, tener una maestría o un certificado de posgrado en un campo similar seguramente será útil para avanzar en su carrera.

    Los analistas de datos recopilan, procesan y realizan análisis estadísticos de datos. A diferencia de los científicos de datos, sus habilidades pueden no ser tan avanzadas como para crear nuevos algoritmos, pero los objetivos dentro de la organización son los mismos para comprender cómo se pueden responder las preguntas y resolver los problemas con el uso adecuado de los datos.

    Data Analyst es un buen lugar para comenzar y obtener conocimientos prácticos que son esenciales para seguir avanzando en la escala profesional. Este conocimiento práctico básico y exhaustivo será esencial siempre que se convierta en un científico de datos.

    Hay algunos lugares que yo mismo recomendaría para los cursos de ciencia de datos, pero encontré que el esquema del curso, los entrenadores y los módulos son los más efectivos con GreyCampus. Algunos de mis colegas, obviamente no la señora que me preguntó cuál tiene el mejor futuro, Data Science o Big Data, tomaron sus cursos de ciencia de datos con ellos y quedaron totalmente satisfechos.

    Espero que esto ayude.