¿Cuáles son los cursos necesarios para aprender la recuperación de información y el aprendizaje automático?

ATA Aquí está mi opinión al respecto.
Yo diría, comience con los conceptos básicos del aprendizaje automático y luego amplíe desde allí. Siempre me califico en una escala 2D. (efectivo, peligroso).
Ser eficaz significa esencialmente tener un mayor nivel de conocimiento en su campo y tener suficientes habilidades para resolver un problema. Eso se traduciría en la capacidad de dominar el curso básico de aprendizaje automático Andrew Ng con algún curso práctico de aprendizaje automático de nivel universitario, competente en python, utilizando Scikits-learn, etc. para resolver algunos problemas. Luego aprenda el modelo de programación de reducción de mapas y haga algunos datos básicos y utilice esas tecnologías.

En algún momento, experimentará un límite en lo que puede hacer con las herramientas existentes que tiene.

Aquí es donde quieres profundizar. Para profundizar, aquí están los cursos que recomendaría:
1) Álgebra Lineal
2) Análisis de sistemas probabilísticos y probabilidad aplicada
3) Cursos avanzados de aprendizaje automático (muchos por ahí, pero el mejor que encontré es Aprendizaje automático 2013, Biblioteca de videos de aprendizaje automático, Introducción al aprendizaje automático)
4) Luego profundice en la Escuela de Ingeniería de Stanford, Coursera, Coursera)
Lo anterior es el plan de estudios que seguí que me hizo apreciar este campo. Es realmente fascinante. Si comprende bien las estadísticas, el álgebra lineal y la optimización, comenzará a descomponer las soluciones “estándar” existentes en otros bloques de construcción y apreciará por qué estas cosas son estándar, pero al mismo tiempo, cómo puede modificarlas si alguna suposición en su conjunto de datos no mantener pero se supone un algoritmo particular (por ejemplo, ¿qué pasa si el ruido en su conjunto de datos no es gaussiano y desea resolver un problema de regresión)

Con respecto a los sistemas distribuidos, diría que simplemente comience a usar una biblioteca de big data existente. Así es como empecé. Comience a usar hadoop o chispa.
Los cursos que recomendaría para sistemas distribuidos son:
1) Página en lintool.github.io (implemente este libro de principio a fin)
2) Algoritmos distribuidos, http://www.ict.kth.se/courses/ID2203
3) Página en stanford.edu

Tuve la suerte de trabajar en un grupo de investigación en mi trabajo anterior (Intel), donde intentaban escalar los algoritmos de aprendizaje automático en sistemas distribuidos y definitivamente, tener personas que entiendan las computadoras desde el silicio es una gran ventaja, pero fue aquí cuando comencé a leer el código fuente de estas tecnologías y luego entendí los detalles del nivel del sistema.
Me he dado cuenta de que no importa si es aprendizaje automático o sistemas distribuidos, siempre es cuando abres el capó, te das cuenta de que la belleza está oculta dentro de la API (ya sea scikit learn o spark). Si admira una biblioteca, comience a contribuir en ella o comience algo.
Todo este proceso, lo califico como “peligroso”.

Tener habilidades en estas dos dimensiones es muy valioso en la industria. Ante un problema, prototipo rápidamente (siendo efectivo) y luego tenga las habilidades para escalar la solución e implementarla en producción …
Espero que ayude y buena suerte.

Mire Aprendizaje automático práctico en Coursera ahora mismo. Además, echa un vistazo a Machine Learning de Andrew Ng en coursera.

Otros cursos que recomiendo este verano:
-Análisis de imagen FMRI (Coursera). Buena explicación de cómo funcionan las máquinas FMRI y el proceso de procesamiento de imágenes.
-Introducción al diseño de sonido digital (Coursera). Buena explicación de las características musicales útiles para la música de computadora.
-Procesamiento de señal digital (EDX). Buena explicación de la teoría de Sistemas de invariantes de tiempo lineal que a menudo es muy complicada pero fundamental para comprender realmente cómo usar bien el procesamiento de señales.

Puedo contarte sobre ML. Obtenga conocimientos básicos de álgebra lineal, cálculo y estadística. Luego aprenda Python o R. Son fáciles de aprender si conoce algún lenguaje de programación. Explore algunas bibliotecas como scikit, pandas, numy en python que lo ayudarán en ML. Y finalmente comience a trabajar en conjuntos de datos. Todo lo mejor

Verifique cs276 y cs246 en Stanford, las diapositivas están disponibles y contienen mucha información.
Los libros utilizados en esos cursos son gratuitos en línea: Introducción a la recuperación de información y Minería de conjuntos de datos masivos.

Si puedes hablar español con fluidez, puedo señalarte mi propio curso 🙂

No sé nada sobre teoría de la información. Sin embargo, para el aprendizaje automático, probablemente sea necesario haber tomado teoría de probabilidad de pregrado y álgebra lineal antes de tomar un curso de aprendizaje automático de posgrado. Además, una clase de algoritmos y una clase de optimización matemática facilitarían las cosas.

More Interesting

¿Algunas funciones de activación son mejores que otras en la red neuronal artificial?

¿Hay algún programa en desarrollo que pueda escuchar un idioma y comenzar a aprenderlo, como en Star Trek?

¿Qué enfoque debo tomar para manejar los datos de desequilibrio para crear un modelo de aprendizaje automático?

Procesamiento del lenguaje natural: ¿Cuáles son algunas ideas de problemas / proyectos sobre la clasificación jerárquica de textos?

¿Cuáles son las condiciones de Dirichlet en una serie de Fourier? ¿Son necesarias las condiciones de Dirichlet?

¿Cuál es la diferencia entre aplicar la descomposición del tren Tensor y agregar más capas a la red donde cada una tiene un tamaño reducido?

¿Qué tan importante es entender el cerebro para el aprendizaje profundo y viceversa?

¿Por qué es tan popular Tensorflow?

¿Cuáles son algunos ejemplos de código de modelos de aprendizaje automático humanos en el circuito? Me ha resultado difícil encontrar tutoriales / documentos que discutan este tema.

¿Cómo se puede utilizar el aprendizaje automático para construir un sistema de predicción del comportamiento del cliente?

¿Cuáles son los criterios principales para la inicialización de los pesos en el aprendizaje profundo? Si quiero diseñar un algoritmo para la inicialización del peso, ¿qué factores debo tener en cuenta?

¿Keras admitirá PyTorch como backend en el futuro?

¿Qué tecnologías existen actualmente para hacer matemáticas en grandes conjuntos de datos?

¿Es útil entrenar a AlphaGo jugando contra sí mismo?

¿Cuáles son las características del texto en la minería de datos?