¿Cómo convertirse en un experto en ciencia de datos (aprendizaje automático) que tiene una idea básica de la programación C / C ++? ¿Cuáles son algunos cursos o libros disponibles gratis o baratos?

Convertirse en un experto en algo requiere una cantidad infinita de tiempo (teóricamente hablando). Incluso pasar años haciendo un doctorado significa que trabajó en un problema específico más que otros con un pequeño nicho para usted, pero llamarse a sí mismo un experto en tiempo súper limitado es una apuesta difícil.

En primer lugar, ML no es ciencia de datos como sugirió Roman Trusov. DS usa partes de ML y varias otras cosas; En realidad, nadie sabe qué es DS. No obstante, algunas sugerencias pueden ayudar

  • ¿Cuál es la diferencia entre análisis de datos, análisis de datos, minería de datos, ciencia de datos, aprendizaje automático y Big Data?
  • La respuesta de Shehroz Khan a ¿Cómo aprendo el aprendizaje automático?
  • La respuesta de Shehroz Khan a ¿Cuál sería la mejor forma de autoaprendizaje de Machine Learning y Data Science como estudiante? Me gustaría aplicarlo a las predicciones del mercado de valores, la genética u otros campos de la medicina, y analizar y recuperar datos de calidad de la web.
  • 20 preguntas para detectar científicos de datos falsos

Pregunta original: ¿Cómo puedo convertirme en experto en Data Science (Machine Learning) teniendo una idea básica de la programación C / C ++?

Varios conceptos erróneos:

  1. Data science! = Machine learning
  2. No necesitas convertirte en un experto para pasar la entrevista
  3. Las grandes empresas contratan solo a personas que pueden trabajar de forma independiente
  4. 6 meses no son suficientes si necesitas habilidades matemáticas y de programación
  5. C / C ++ será irrelevante para DS y probablemente sea irrelevante para ML si no es un desarrollador principal

Esta pregunta es similar a “¿Cómo puedo convertirme en un atleta profesional en 6 meses si tengo una B en PE?” No es así como funciona.

Los cursos no te harán más empático. Todos tienen un montón de certificados ahora. Concéntrate en hacer cosas. ¿Cómo puedes hacer cosas si no tienes un trabajo relevante? Haz ejercicios. Entonces, esta respuesta será sobre ejercicios. Hace un par de meses escribí una respuesta que le da muchas cosas para comenzar: la respuesta de Roman Trusov a ¿Qué debo aprender en ciencia de datos en 100 horas? Soy libre durante los próximos 10 días y me gustaría aprender todo lo que pueda en los próximos 10 días, y puedo dedicar 10 horas al día. ¿Qué puedo aprender para familiarizarme y comenzar?

Dado que la ciencia de datos tiene que ver con la extracción de conocimiento de los datos en bruto, el uso de motores de búsqueda es una habilidad absolutamente crítica. Afortunadamente, Quora tiene uno y puedes hacer un primer ejercicio como analista: encuentra diez respuestas sobre este tema que tengan al menos 100 votos a favor. En conjunto, probablemente contendrán una cantidad abrumadora de información que no será un cambio de juego para ti. Por lo tanto, puede echarles un vistazo, buscar en Google un par de libros y evaluar sus habilidades en matemáticas y conceptos básicos de programación.

Evalúa tus habilidades.

No puedo enfatizar esto lo suficiente. Fui rechazado un par de veces porque no pude evaluar mis habilidades y, por lo tanto, no pude encontrar agujeros en mi conocimiento hasta que fue demasiado tarde. Esto es muy importante.

Si las cosas van a su manera, le preguntarán sobre el proyecto más interesante que haya realizado o el actual. No importa, porque tendrán que ser lo mismo. El que harás para la entrevista. Reflejará sus capacidades como analista o desarrollador de ML, no importa.

Si quieres ser analista, el enlace que publiqué será un buen comienzo para ti. Hay muchas cosas allí y en 6 meses aprenderás mucho si pasas un tiempo serio. Si quieres ser un desarrollador de ML, bueno, es un fastidio, porque un desarrollador de ML es un ingeniero de software que conoce C ++ y probablemente algo más y también conoce los pormenores de los 15 métodos principales en su subcampo elegido (por ejemplo, todos algoritmos de construcción de árboles de decisión + todas las técnicas de ensamblaje + trucos de rendimiento para que no succione la producción). Y no hay tal cosa como ML Eng Intern, por una buena razón.

Tengo un sesgo contra Coursera y todos los MOOC en general. Puede ser que esté equivocado. Tal vez no sé cómo usarlo correctamente. Pero nunca he visto a una persona que estaba en el nivel inicial y después de un curso resultó mejor de lo que lo haría después de dos semanas sólidas de codificación en un modo pegado a la silla. Además, las preguntas formuladas en lugares decentes para un puesto de analista no tienen nada que ver con el material que se enseña en los MOOC, principalmente porque enseñar a las personas sobre problemas reales realmente no encaja bien en el cronograma, demasiados problemas importantes para resolver de una vez.

Convertirse en un experto no es una tarea fácil y directa. Sería necesario tener paciencia, exposición y experiencia para convertirse en un científico de datos de pleno derecho. Hoy en día, hay muchas tecnologías involucradas, es decir, python, r, Hadoop, scala, spark, azure, computación en la nube, aprendizaje automático, almacenamiento de datos, minería de datos, estadísticas, probabilidad, etc.

La ciencia de datos es un enfoque completamente diferente a la programación.

Comience con Python, luego R.

Después de familiarizarse con los dos idiomas anteriores, vaya a Git / GitHub.

Ahora, concéntrate en Hadoop.

Ahora, se vuelve bastante fácil adquirir todas las habilidades restantes y no tomará mucho tiempo como Spark, Machine learning, Azure, Cloud Computing, etc.

El curso de curso sobre Aprendizaje automático del profesor Andrew Ng es bueno para comenzar su carrera en Aprendizaje automático. Los idiomas preferidos para ML son MATLAB, Octave, R y Python. Incluso puedes codificar en C / C ++. Pero usar uno de los idiomas preferidos es conveniente en el tiempo. En el curso mencionado anteriormente se utilizará Octave.

También se recomienda leer un buen libro sobre Aprendizaje automático mientras se sigue el curso. El aprendizaje automático y el reconocimiento de patrones por Christopher M. Bishop es un libro muy bueno y también puede consultar Introducción al aprendizaje automático por Ethem Alpaydin. Ambos libros están disponibles como libros electrónicos en Internet. Solo googlealo.

Buena suerte !

La ciencia de datos no tiene nada que ver con su lenguaje de programación. Se trata principalmente de conocer los consejos y trucos, no solo conocerlos sino comprenderlos muy bien. Para que sepa qué método o algoritmo aplicar en cada situación. Ningún algoritmo es bueno o malo, es solo la situación, si comprende bien esta parte, es casi experto. Una cosa que también es muy importante es conocer o comprender los datos. Tener conocimiento sobre los datos en los que está trabajando también es muy importante.

Entonces, si conoce estos 2, entonces tiene varios idiomas y una plataforma que le proporcionan bibliotecas para los algo que necesitaría. Así que es un trabajo de 2 minutos aplicando esos algos a menos que descubras algo nuevo.

En ciencia de datos, la comprensión lógica es más que el código. Puede escribir 10 líneas de código que hacen milagros y puede haberle tomado 10 semanas finalizar esas 10 líneas.

Disfruta de la ciencia de datos.

Vea esta pregunta completa donde algunos de los expertos de Data Science en Quora respondieron la pregunta. Encontrará todos los detalles sobre el aprendizaje automático.

¿Cómo aprendo el aprendizaje automático?

Recomiendo encarecidamente que eches un vistazo a Coursera. Hay un curso de Ciencia de Datos impartido por un experto altamente calificado. También proporcionan tareas, foros de discusión y mentores para ayudar a los estudiantes. El curso está bien detallado y dividido en subtemas para una mejor comprensión por parte del usuario. Estoy seguro de que te ayudará …