Cómo estudiar el aprendizaje automático mientras se construye una cartera

En el espacio de aprendizaje automático, al igual que la ingeniería de software, los reclutadores buscan creatividad y una historia comprobada de éxitos de proyectos pasados. La mejor manera de transmitir ambos es a través de sus propios proyectos.

Kaggle es un gran lugar para comenzar a demostrar que tiene las habilidades básicas, pero a menudo resolver un solo problema prescrito no será suficiente, especialmente porque las mejores soluciones tienden a ser muy similares después de un tiempo (por ejemplo, métodos de conjunto). Sin embargo, si ESTÁ buscando resolver los problemas que otros le han recetado, ciertamente debe documentar sus procesos y pasos de pensamiento a través de una publicación de blog que describa cómo lo pensó en cada paso.

Sin embargo, resolver una competencia aleatoria no muestra el rango completo de tu creatividad. Lo siguiente que querrá hacer es definir su propio proyecto. Por ejemplo, encuentre un conjunto de datos de estadísticas sobre jugadores de la NBA en los últimos 50 años y elabore un modelo que prediga qué jugadores tienen las mejores posibilidades de ganar un campeonato, o prediga la probabilidad de una enfermedad crónica según los datos anónimos de los pacientes. Definir su propio problema Y una solución es la mejor manera de impresionar a los reclutadores, pero nuevamente querrá asegurarse de que esté bien documentado y rastreado para que los reclutadores puedan verlo y comprender cómo estructura su pensamiento.

Independientemente del tipo de proyectos que esté resolviendo, querrá realizar un seguimiento de su trabajo y su progreso para que los reclutadores puedan ver no solo qué código escribió (que realmente no transmite su proceso), sino todas las iteraciones Usted hizo en parámetros, marcos, datos, ingeniería de características, así como el código. Afortunadamente, Datmo proporciona todo eso mediante el seguimiento de las instantáneas de su modelo, y debido a que es una red muy parecida a Github, puede crear su cartera para que los reclutadores puedan acceder a su perfil (https: // datmo / io / ) para examinar todas sus soluciones creativas, ya sea que estén resolviendo un problema en Kaggle o un problema que usted mismo definió.

Espero que esto ayude 🙂

Realmente depende de cuál es exactamente el trabajo para el que se está preparando. El aprendizaje automático se refiere a una amplia gama de habilidades y tecnologías.

¿Va a realizar un análisis de datos, con un enfoque estadístico en lugar de uno de ingeniería de software? En ese caso, necesita repasar sus estadísticas, aprender R y sus paquetes más importantes y practicar la recopilación y el análisis de datos para producir informes con información interesante.

¿Vas a construir modelos de aprendizaje automático listos para la producción? ¿En aplicaciones orientadas al consumidor alojadas en la nube para miles de usuarios? En sistemas embebidos? En sistemas críticos? En ese caso, además de un buen conocimiento de los modelos más comunes, debe comprender cómo administrar los recursos que usan, cómo distribuirlos, aprender a manejar grandes cantidades de datos y cómo interactuar sus modelos con los usuarios y Las otras partes de la aplicación. Una vez más, practique: cree un front-end móvil / web y un backend en algún lugar que maneje modelos de datos y aprendizaje automático, o cualquier cosa que se le ocurra.

Y también tendrá que pensar en el conocimiento específico del dominio. ¿Vas a trabajar en imágenes? Debe estar familiarizado con las técnicas de procesamiento de imágenes, el aprendizaje profundo con redes neuronales convolucionales, así como con los métodos tradicionales. El texto también tiene muchas peculiaridades, ya que debes pensar en los idiomas y la naturaleza secuencial de las oraciones.

Entonces, el “aprendizaje automático de aprendizaje” es un poco vago. Si bien técnicamente puede ser un “ingeniero de aprendizaje automático de pila completa”, hay mucho que saber, y será mejor que se concentre en ingresarlo a través de un área o nivel específico.

Agregaré algunos recursos una vez que esté en mi computadora.

Hay muchas competiciones en línea (por ejemplo, kaggle), tal vez puedas participar en una. O puede contribuir a algún software de código abierto, o crear uno propio y publicarlo.

More Interesting

¿Cuántas imágenes necesito para entrenar una red neuronal convolucional?

¿Es cierto que incluso si podemos modelar a partir de la distribución del modelo [matemática] p (x) [/ matemática], el muestreo de importancia óptima no es [matemática] p (x) [/ matemática]?

¿Las máquinas de vectores de soporte vienen en modelos paramétricos o no paramétricos y por qué?

¿Qué es mejor en CMU: 10-601 o 10-701?

¿Qué clasificador es el más adecuado para clasificar los signos en un video de lenguaje de señas?

¿Cómo se puede aplicar el aprendizaje automático al póker?

¿Cómo podría usar el aprendizaje automático para clasificar los datos 1D?

Cómo implementar el aprendizaje sensible al costo en TensorFlow para penalizar la clasificación errónea en clases minoritarias (los datos tienen un problema de desequilibrio de clase)

¿En qué se diferencia la investigación de Machine Learning en la academia de la investigación en la industria?

RNN para modelado de idiomas en Tensorflow. ¿Cómo puedo rellenar las secuencias si mi entrada está constituida por la incorporación de palabras?

¿Cuáles son algunos modelos matemáticos o técnicas estadísticas que son útiles para los científicos que trabajan con grandes datos?

¿A quién o qué investigación de laboratorio en aprendizaje automático le parece más interesante?

En clasificación, ¿cómo manejas un conjunto de entrenamiento desequilibrado?

¿Cómo empiezo a analizar una base de datos de análisis web?

¿Por qué muchos estudios de investigación afirman que el aprendizaje profundo es una caja negra?