Cómo hacer frente al aprendizaje de la ciencia de datos

Descargo de responsabilidad: tomé prestado un poco de la respuesta de Karlijn Willems a ¿Cómo obtengo motivación para estudiar ciencia de datos? y soy periodista de ciencia de datos en DataCamp.

Para empezar, creo que Python es un lenguaje de programación perfecto para comenzar considerando su experiencia, ya que realmente no tiene mucha experiencia previa en codificación. Por supuesto, R también es muy poderoso en ciencia de datos y si te sientes motivado para aprender R más que Python, obviamente deberías ir a R 🙂 En cualquier otro caso, ve a Python y aprende R después.

Luego, el desafío diario de la comprensión. Esta es difícil porque puede diferir y diferirá de una persona a otra, pero creo que uno o más de los siguientes consejos pueden ayudarlo a mantenerse motivado:

  • Variedad : aprender ciencia de datos requerirá que seas creativo de vez en cuando, especialmente cuando se trata de recursos de aprendizaje. Hay mucho por hacer, pero el truco es encontrar exactamente lo que se ajusta a su estilo de aprendizaje. ¿Te gusta leer? Descubra cuáles son los mejores libros para comenzar, y luego también considere otros recursos escritos como tutoriales, artículos, … ¿Te gusta mirar y escuchar? Averigüe cuáles son los mejores videos o conferencias del curso y comience desde allí. Después, todavía hay muchas otras opciones, como podcasts, conferencias, …
  • Aprender haciendo . No solo lea y mire / escuche. La mejor manera de llegar a donde necesita estar es practicando lo que ha aprendido y simplemente tomar el obstáculo. Recomiendo que aplique lo que haya aprendido en el código de inmediato o lo más cerca posible de inmediato. Aquí es donde Learn R, Python & Data Science Online | DataCamp viene: es una combinación de video conferencias de expertos de la industria y líderes de opinión, desafíos de codificación interactiva con comentarios personalizados y, a veces, cuestionarios cortos para ver si comprende los conceptos que se han explicado. La plataforma es excelente para que los novatos comiencen de manera práctica porque no asumimos que usted tenga todo el conocimiento todavía, como lo hacen algunas otras plataformas educativas. Y si asumimos cierto conocimiento, encontrará esto claramente en la descripción del curso. Si aún no está totalmente convencido, considere tomar el curso en línea gratuito Learn Data de Python para Data Science – y entenderá de lo que estoy hablando.
  • Sigue tu progreso . Hay personas que se unen en una aventura de codificación de 100 días, hay otras que publican regularmente en un blog sobre cómo están, también hay quienes se unen a un campamento de ciencia de datos o se unen a una pista. Tener un viaje más fijo puede ayudarlo a llegar a donde quiere ir y lograr su objetivo. Tenga en cuenta que los bootcamps están más orientados hacia un objetivo profesional, mientras que otras pistas, como la de DataCamp, también le permiten mejorar en temas específicos, como la visualización de datos o las estadísticas. Echa un vistazo a los principales campos de entrenamiento de ciencia de datos: la guía completa de 2017 y clasificaciones o pistas | DataCamp.
  • Rutina Muy relacionado con el seguimiento de su progreso, debe asegurarse de tener algún tipo de rutina. Ya sea que realice algunos ejercicios cada noche a las 8 pm para leer mientras viaja a su trabajo, ¡solo asegúrese de desarrollar una rutina que pueda mantener y que le permita desarrollar gradualmente su conocimiento! La práctica hace la perfección y la rutina ciertamente puede ayudar en esto.
  • Conéctate a lo que te interesa. Los proyectos de ciencia de datos y los desafíos de codificación pueden ser aburridos cuando trabajas en un tema que no te interesa. Encuentre el material adecuado que cubra sus necesidades educativas y motivadoras. Motívese con ejemplos del aprendizaje automático o el aprendizaje profundo …
  • Proyectos Cuando ya esté más avanzado, consideraría retomar un proyecto para aplicar la mayoría de las cosas que ha aprendido en un estudio de caso particular. La clave aquí también es elegir un conjunto de datos que lo motive e interese. Responda también las preguntas que le parezcan interesantes y verá que desarrollará una intuición sobre qué son buenas preguntas y cuáles no. Al mismo tiempo, estos proyectos le permitirán mantenerse “ocupado” con un tema en particular durante más tiempo, lo que puede funcionar como un motivador.
  • Comunidad . La comunidad puede ser un gran motivador en su viaje de ciencia de datos. Asista a conferencias, únase a grupos de reuniones, conéctese con sus pares en LinkedIn, Facebook, Whatsapp, Slack, … grupos para discutir su progreso y aprender por lo que otros están pasando. ¡Verás que hay muchas similitudes! Tus compañeros pueden y probablemente también te señalarán recursos que los han ayudado, lo cual también es bueno. También asegúrese de que pueda maximizar su participación en todo esto: su compromiso y motivación que obtiene de la comunidad dependen en gran medida de cuán activo sea en la comunidad; Comparta artículos interesantes con sus compañeros, dé un discurso sobre lo que aprendió … Las posibilidades son infinitas, ¡pero asegúrese de que su aporte cuente!

¡Espero que esto ayude!

Mi mantra siempre ha sido “Haz lo que quieras”. Ahora me doy cuenta de que esto puede ser poco práctico, especialmente cuando sus intereses no coinciden con las funciones de trabajo que generan oportunidades para satisfacer deseos o necesidades. Pero si puedo ser sincero, no pareces un “programador natural” y no te preocupes por eso porque hay muchas personas a las que no les gusta. Eso puede estar bien, porque el campo de la ciencia de datos es nuevo y está evolucionando, y le aconsejaría que investigue el campo y encuentre las cosas dentro de la ciencia de datos que le puedan gustar, vea lo que está involucrado en estos temas y échele un vistazo, lea Para obtener más información, vea hacia dónde parece ir en el campo Ciencia de datos.

No soy un experto en DS. Simplemente incursiono en él porque me gusta el análisis de datos como siempre lo he hecho, como una forma de abordar las teorías en Econ y Stats. Pero también estoy interesado en Big Data, así que tengo que prestarme algo de experiencia práctica en DS para no lidiar con grandes problemas de procesamiento o análisis de datos, y puedo llegar al punto de manera más eficiente. Comencé a querer raspar, alguien más puso el script Python con un módulo Beautifulsoup, luego R se convirtió en algo de lo que mucha gente estaba hablando, con respecto a los gráficos interactivos, la visualización. Como rechazo la visualización como una premisa sesgada, comencé a resistirme a la visualización de datos como un campo de tema separado, y ahora soy uno de los pocos economistas que no le gusta ver gráficos ingeniosos de inmediato. Pero yo divago.
Data Science Central [correo electrónico protegido] … Regístrese y le enviarán artículos sobre temas de DS. ¿Qué artículos te interesan más? Luego haga esas cosas, porque generalmente será muy bueno en lo que le interesa; haces mejor lo que más disfrutas. Buena suerte.

Ciertamente es abrumador para la mayoría.

En este momento, la mayor parte del aprendizaje automático aplicado está supervisado. Eso significa que comenzamos con un conjunto de datos.

Por lo tanto, es muy importante que sepa cómo manipular los datos. Eso simplemente significa obtener datos en una hoja de cálculo de Excel como estructura (datos tabulares) y apuntar sus modelos hacia ella.

Python se ha convertido en el lenguaje predeterminado para construir modelos de aprendizaje automático.

Comience a aprender Python y los modelos ML asociados.

Comience aquí: Las 5 mejores bibliotecas de aprendizaje automático en Python – Udemy

Por lo general, eso depende del trabajo nuevamente. Data Scientist generalmente usa herramientas para llevar a cabo las tareas, esas herramientas a veces requieren lenguajes como Python y R. Recomiendo que comience a aprender R.

Puedes tomar el código de Udacity o Coursera.

Estuve en tus zapatos hace un par de años. Mi mejor consejo es aprender Python y comenzar desde allí, ya que es el más simple de todos y menos exigente con muchas bibliotecas relacionadas con la ciencia de datos fácilmente disponibles, y si tiene cursos de análisis, entonces R debería ser una adición a él. Una vez que los aprenda, debería estar listo para trabajar en la mayoría de las cosas relacionadas con la ciencia de datos. Sé que habrá mucha ansiedad, pero repetidamente convencerse a sí mismo de volver al trabajo y tomar las cosas en pequeños trozos y planear construir cosas realmente muy simples. Es posible que pueda comenzar simplemente copiando el código de pegado, luego comprenda el código, luego implemente su propia variación del código y practique con bastante frecuencia. Buena suerte .

More Interesting

Tengo una nube de puntos y necesito hacerla coincidir con un modelo CAD en una base de datos de ~ 500 modelos. ¿Qué algoritmos podría usar?

Data Science, Big Data, Machine Learning, ¿qué certificación debo hacer para cambiar la trayectoria profesional desde un entorno de control de calidad?

¿Cuáles son algunas buenas ideas de proyectos en el área de análisis / predicción del mercado de valores utilizando Bayes ingenuo?

¿Qué es el aprendizaje automático y la IA?

¿Cuál es la diferencia entre la deserción y la normalización de lotes?

¿Qué 2 cursos entre estructuras de datos y algoritmos, diseño de software, introducción a IA, aprendizaje automático y sistemas operativos, debo elegir?

Cómo saber si mi modelo de regresión es heteroscedastic u homoscedastic de mi modelo de residuos

¿Por qué la pila de RBM después de aprender no es una máquina de Boltzmann profunda (DBM)?

¿Existe algún proyecto de datos abiertos que utilice el aprendizaje automático y la ciencia de datos para proporcionar información sobre los datos de incidentes de aplicación de la ley disponibles públicamente?

Si quiero implementar un filtro de spam, ¿cuál es el algoritmo más simple y eficiente que debo usar?

¿Qué matemática debería revisar / aprender si quiero comprender a fondo el modelado de efectos mixtos / modelado de regresión?

¿Cómo entrenar codificadores automáticos dispersos en imágenes?

¿Sigue siendo útil saber HTML hoy?

¿Cuáles son las diferencias entre los algoritmos CHAID y CART para el crecimiento de los árboles de decisión?

¿Cómo se puede aplicar el aprendizaje profundo a los sistemas de recomendación en el mercado de valores?