Hay varios cursos disponibles sobre ciencia de datos y análisis como Udaicity, Upgrad Imarticus, etc. ¿Cuál es el mejor para unirse?

Contestaré la pregunta según mi proceso. Es posible que tenga una experiencia diferente en función de lo que ya sabe.

Comencé como alguien con una comprensión muy básica (que bordea el 0) del aprendizaje automático y el análisis de datos (era un ingeniero de software con conocimientos de programación). ¡Durante un tiempo fui como un pollo sin cabeza chocando contra todas las paredes posibles!

Para empezar, miré la serie de cursos de John Hopkins sobre ciencia de datos que ofrece Coursera. Rápidamente me aburrí y comencé a buscar otra cosa. El problema que sentí que experimenté con ese curso fue que es un curso muy introductorio y surgió rápidamente.

Trabajé en el curso de aprendizaje automático de Andrew Ng (Machine Learning | Coursera). Esto, en mi opinión, fue una sorprendente introducción al aprendizaje automático. Da una idea sobre qué algoritmos existen y cómo usarlos prácticamente. Con esto comienzas probando los diferentes algoritmos y bibliotecas. Y, francamente, comienzas a tener un poco más de confianza en tu conocimiento todos los días.

¡Ay, también supere eso! Ahora que podía aplicar el conocimiento, quería saber por qué algunos algoritmos funcionan mejor que otros en diferentes tipos de datos.

Me inscribí en el Udacity ML nanodegree (Machine Learning Engineer Nanodegree | Udacity). Este curso es bastante bueno no solo para las conferencias, que francamente son mejores y las enumeraré más adelante. Pero, para los proyectos. Es muy, y no puedo enfatizar lo suficiente lo importante que es que comiences a trabajar en proyectos y subirlos a github. Esto le brinda una buena escala de progreso para usted y sus futuros empleadores.

La mejor parte de comenzar con Udacity fue la retroalimentación que recibí para las evaluaciones de proyectos. Esto me llevó a inscribirme en el nanodegree Udacity Data Analyst también (Data Analyst Nanodegree | Udacity). Pude terminar los dos dentro de un año de registrarme y me devolvieron el 50%, ¡lo cual fue increíble! (no estoy seguro si todavía lo hacen)

Mientras trabajaba en los proyectos, estaba viendo conferencias para entender por qué el aprendizaje funciona. Aquí está la compilación para los profesores que encontré muy útil. Y por favor, comprenda que si bien todos son realmente buenos, se superponen y puede elegir temas para aprender de diferentes profesores:

Aprendizaje automático

Aprendiendo de los datos – Curso en línea (MOOC)

Andrej Karpathy

Nando de Freitas

Inteligencia artificial

Las fuentes anteriores fueron muy útiles para mí. Algunos de ellos son cursos de Deeplearning en caso de que quieras explorar eso y avanzar más.

Un aspecto de la ciencia de datos que no necesariamente entra en juego en ML puro es la visualización para presentar a los demás. Esto se enseña en el curso Udacity Data Analyst junto con ML, por lo que podría ser un buen lugar para comenzar. Otro recurso abierto son los videos del curso de visualización de Harvard que se encuentran aquí: Listado de publicaciones

Hay un certificado ofrecido por la Universidad de Washington sobre visualización, pero no tengo idea de cuán bueno o malo es: Certificado en visualización de datos Espero poder trabajar en esto algún día.

Y sigue trabajando en conjuntos de datos desde aquí:

Depósito de aprendizaje automático de UCI

Su hogar para la ciencia de datos

DrivenData

Conjuntos de datos para análisis y descarga

Sigue trabajando en proyectos y probando nuevos algoritmos. Aprende haciendo, no hay nada más.

En cuanto a la programación, supongo que está familiarizado con la programación, por lo que los lenguajes como Python, R, Spark son bastante útiles para comenzar.

Por favor, comprenda que esto todavía es un material de aprendizaje de principiante a nivel intermedio. Si desea convertirse en un experto, tendrá que leer documentos y publicaciones para verificar las aplicaciones y los algoritmos más nuevos. Una vez que determine en qué área desea ingresar, por ejemplo, PNL, Visión por computadora, Procesamiento de señales, Datos de cambio social, la lista continúa, tendrá que encontrar qué funciona mejor para esas áreas y qué nueva investigación se está llevando a cabo en ese zona.

Además, esto no cubre Big Data con mucho detalle ni cubre Estadísticas. Si lo desea, puedo agregar más información al respecto, pero para empezar es bueno. Puedo dar fe del material que he publicado, y tienes que elegir lo que funciona para ti y casi nunca es una respuesta única, para mí fue una combinación de elegir lo mejor en diferentes lugares.

¡Todo lo mejor! Es un camino empinado pero merece la pena!