¿Este sitio está actualizado o debo buscar datos?

Creo que el artículo todavía está actualizado: menciona buenos recursos para comenzar con el aprendizaje automático.

Sin embargo, los dos componentes de su pregunta se superponen: aprender el aprendizaje automático y tomar cursos sobre aprendizaje automático (o temas fundamentales que necesita saber para abordar el aprendizaje automático) van de la mano.

El artículo también incluye cursos para comenzar con el aprendizaje automático y es una especie de guía para comenzar por su cuenta. Tomar cursos definitivamente es parte de ese proceso de aprendizaje, ya que también podrá encontrarlo en otras guías como la que escribí recientemente (How Machines Learn: A Practical Guide – freeCodeCamp) y en la que también menciono los cursos como uno paso en el proceso de aprendizaje, que puede complementar con otros recursos.

Los 7 pasos (con recursos) que enumero son

1. Obtenga los conocimientos básicos necesarios

2. No tengas miedo de invertir en la “teoría” de ML

3. Ponte manos a la obra

4. Practica

5. Proyectos

6. No pares

7. Haz uso de todo el material que está disponible

Entonces, ¿deberías ir a buscar datos? Creo que esa elección depende de usted, pero debe saber que también hay muchas buenas alternativas.

  • Ya hay un par de artículos que clasifican los cursos de aprendizaje automático en Internet (como Todos los cursos de Aprendizaje automático en Internet, clasificados según sus comentarios).
  • También hay otros sitios que ofrecen pistas: no todos cubren las mismas cosas, pero una vez más: los recursos y los cursos están destinados a complementarse entre sí en su aprendizaje.
    • Aprendizaje automático con Python Track | DataCamp
    • Aprendizaje automático con R Track | DataCamp
    • Ingeniero de Aprendizaje Automático Nanodegree | Udacity
    • Aprendizaje automático | Coursera

No creo que esas dos cosas sean mutuamente excluyentes. Creo que el proceso que Matt Mayo describe en el artículo que está preguntando es realmente bueno, y si miro el currículo de Dataquest, se alinea bastante bien con lo que dice este artículo. Diferimos en el orden en que hacemos las cosas, pero eso no es ni aquí ni allá.

(Divulgación: trabajo para Dataquest ).

Voy a ir a través de la sección del artículo y compararlo con el enfoque que tomamos en el camino de Dataquest ‘Data Scientist’ (que se compone de cursos individuales), para que entiendan lo que quiero decir.

Paso 1: Habilidades básicas de Python

Este es sin duda el mejor lugar para comenzar. Si no entiende el lenguaje, ¿cómo se puede esperar que escriba algoritmos de aprendizaje automático utilizando Python? El primer curso en nuestro camino hace exactamente esto.

Programación Python: Principiante.

Paso 2: Habilidades fundamentales de aprendizaje automático

Si bien saltaría directamente de Python Basics a los fundamentos del aprendizaje automático, sin duda es importante cubrirlo. En este paso, Matt aboga por usar el increíble curso de Machine Learning de Andrew Ng, pero omite algunos de los pasos y lo usa como material de referencia. No puedo discutir con esto, pero a veces es bueno tener todo en un solo lugar. En lugar de aprender los fundamentos del aprendizaje automático por separado, adoptamos el enfoque de enseñar esto en el contexto de hacer el aprendizaje automático. Cubrimos esto a continuación (¡vea el paso 4!)

Paso 3: Descripción general de los paquetes científicos de Python

Matt pone esto como el paso 3, lo ponemos como el paso 2, y se abre camino a través de nuestro plan de estudios Dataquest. ¡Definitivamente necesitas conocer a Numpy y Pandas si quieres trabajar con Data en Python, y Matplotlib si quieres trazar algo! Cubrimos estos tres en dos cursos separados:

Análisis de datos con pandas: intermedio (incluye Numpy)
Visualización de datos (casi exclusivamente enseña Matplotlib)

También recomienda aprender scikit-learn, la biblioteca principal de aprendizaje automático para Python. Hacemos esto en el paso 4 a continuación.

Paso 4: Comenzando con Machine Learning en Python

Ahora a la parte divertida! Matt sugiere leer los cuadernos de otras personas para comprender los conceptos básicos del aprendizaje automático. ¡Preferimos que construyas algo tú mismo! El primer curso de nuestra sección de Aprendizaje automático hace exactamente eso. Al enseñarle a usar scikit learn, presentamos regresión lineal, regresión logística, clasificación, validación cruzada y una introducción a la agrupación.

Aprendizaje automático en Python: principiante

Paso 5: Temas de aprendizaje automático con Python

Aquí, Matt sugiere que aprenda Regresión lineal y Regresión logística, que ya hemos cubierto, así como también K-Means Clustering y Decision Trees. Nuestro curso de aprendizaje automático intermedio cubre K-Means (así como también una regresión lineal avanzada). Tenemos un curso separado dedicado solo a los árboles de decisión.

Aprendizaje automático en Python: intermedio
Árboles de decisión

Paso 6: Temas avanzados de aprendizaje automático con Python

Esta es un área que solo cubrimos parcialmente. Matt recomienda Máquinas de vectores de soporte y Reducción de dimensionalidad. No tenemos ninguno de estos en este momento, pero ambos están en nuestra hoja de ruta que se lanzará pronto. También recomienda hacer una competencia de Kaggle y aprender sobre los bosques al azar. Tenemos misiones para cada uno de estos:

Competiciones Kaggle
Introducción a los bosques al azar

Paso 7: aprendizaje profundo en Python

Por último, una de las mayores ‘palabras de moda’ en Data Science es sobre el aprendizaje profundo. No tenemos mucho contenido sobre esto, pero tenemos una misión introductoria en las redes neuronales para que pueda familiarizarse con los conceptos involucrados.

Introducción a las redes neuronales

En conclusión

Como puede ver, ¡no es uno ni el otro! Dataquest sigue un camino muy similar al descrito en el artículo. Te animo a que tomes una decisión por ti mismo: todos los recursos a los que Matt enlaza son gratuitos, ya que Dataquest tiene contenido gratuito pero requiere una suscripción para continuar.

También encontrará que una fuente probablemente nunca cubrirá todo: siempre hay recursos externos que debe usar, pero en Dataquest le brindamos un plan de estudios sólido para comenzar, por lo que al principio no tiene que preocuparse por lo que sigue y puede enfocarse en el aprendizaje.

Al final, la decisión depende de usted: es mejor que comience en cualquier lugar que quedar atrapado en una parálisis de decisión, por lo que le recomiendo que se sumerja y comience. ¡Buena suerte!

Definitivamente ve por Dataquest. Comencé a usar dataquest hace aproximadamente 2 semanas y, aunque estaba familiarizado con la mayoría de los temas en su plan de estudios, me beneficié mucho de su enfoque de aprendizaje basado en proyectos. Creo que dataquest es uno de los mejores recursos disponibles en línea para aprender ciencia de datos y especialmente para principiantes. Es posible que pueda encontrar todo el material de dataquest en línea de forma gratuita, pero no tendrá el mismo enfoque estructurado; sin mencionar que te sentirás abrumado porque hay una gran cantidad de recursos en línea. Los muchachos de dataquest han hecho un gran trabajo al abarcar los componentes básicos de la ciencia de datos y presentarlos en desafíos que tienen como objetivo hacer que aprendan ‘haciendo’ ciencia de datos. Las misiones son realmente geniales, no demasiado difíciles ni demasiado fáciles. Además, sus servicios son asequibles.

¡Espero que esto ayude!

More Interesting

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2013?

¿Cómo soluciona un máximo A posterior el problema de sobreajuste en una estimación de máxima verosimilitud?

¿Pueden las redes neuronales profundas resolver problemas NP-Hard?

¿Cuántas personas en el mundo son expertos en aprendizaje profundo para visión por computadora?

¿De qué fuente será mejor aprender el aprendizaje automático?

¿Los bosques aleatorios son solo un tipo de Monte Carlo?

¿Dónde funcionará bien el aprendizaje automático como servicio? ¿Dónde no lo hará?

¿Cuántos tipos de técnicas utilizan los limpiadores profesionales?

¿Cuál es la diferencia entre la clasificación de vectores de soporte y la regresión? ¿Un regresor de vectores de soporte se comporta como una red neuronal por casualidad?

¿Qué es exactamente la monitorización neuronal remota?

¿Cuál es la mejor manera de combinar filtrado colaborativo y recomendaciones basadas en contenido?

¿Necesita ser un buen ingeniero de software para trabajar en cosas como visión por computadora, reconocimiento de voz, gráficos por computadora, aprendizaje automático?

¿Cómo analizaría programáticamente una oración y decidiría si responde con "eso es lo que dijo"? Resuma un algoritmo que, dada una oración, devuelve verdadero o falso para determinar si la declaración es apropiada.

¿Cuál es la diferencia entre el aprendizaje de refuerzo profundo y el aprendizaje de refuerzo?

Como persona con una maestría en química y un doctorado en ingeniería eléctrica y nanotecnología, a los 26 años sin experiencia en ciencias de la computación, ¿es demasiado tarde o demasiado difícil enseñarme a mí mismo el aprendizaje automático?