¿Qué es un buen texto introductorio de aprendizaje automático?

Gracias por A2A: Mi favorito personal es el libro de Chris Bishop sobre reconocimiento de patrones y aprendizaje automático: Christopher M. Bishop | PRML

Si bien hay muchos libros excelentes sobre aprendizaje automático, el que recomendaría a cualquiera que esté comenzando de nuevo en este campo, sería este libro. Si alguna vez se preguntó por qué K-Means se hace de la manera en que se hace O por qué la regresión logística se llama modelo lineal O por qué las redes neuronales no son lineales O cuáles son esos misteriosos pasos ‘E’ y ‘M’ de un algoritmo EM y cómo K-means es una manifestación de EM O cuáles son esos diagramas de placa en modelos gráficos O cuáles son esos núcleos de los que la gente habla en referencia a SVM O qué se entiende por muestreo y convergencia y ley de grandes números, etc.… entonces este es el libro que usted puede querer leer. Simple y completo.

Tengo tanto respeto por este libro que no puedo pensar en usarlo para subir el monitor de mi computadora 🙂

Para libros más teóricos, recomendaría Mohri, Rostamizadeh y Talwalkar, así como Shalev-Shwartz y Ben-David. Ambos han salido desde que esta pregunta se hizo originalmente y son mejores tratamientos de la teoría actual que la mayoría de los anteriores.

Quizás comience con el libro Programming Collective Intelligence – http://oreilly.com/catalog/97805 … – es muy práctico y práctico, pero ofrece una buena comprensión general que es útil cuando se profundiza más en el aprendizaje teórico de máquinas

Luego continúe leyendo el libro de Mitchell Machine Learning – http://www.cs.cmu.edu/~tom/mlboo … o las notas del borrador del libro en línea de Nilsson – http://ai.stanford.edu/people/ni … – ellos ambos son relativamente similares y ofrecen una introducción amplia pero más teórica al aprendizaje automático. Tenga en cuenta que ambos están un poco anticuados (1996/97), pero siguen siendo válidos.

Para obtener más teoría, continúe con el Reconocimiento de patrones http://cgi.di.uoa.gr/~stpatrec/w … y también es útil aprender teoría sobre métodos empíricos relacionados con el aprendizaje automático (AI) con el libro Métodos empíricos para Inteligencia artificial – http://mitpress.mit.edu/catalog/

Para la teoría y los algoritmos de aprendizaje automático de última generación, puede ser útil continuar con las principales revistas y actas de conferencias, en particular Journal of Machine Learning – http://jmlr.csail.mit.edu/ y International Conference on Machine Learning – http : //www.icml2010.org/

More Interesting

¿Puede el aprendizaje automático ayudar con la ciencia del clima?

¿Podemos nombrar funciones de funciones en CRF como funciones de kernel como para SMV?

Entre la agrupación y la clasificación, ¿cuál requiere más experiencia?

Cómo interpretar la salida de una red neuronal

¿El submuestreo de un entrenamiento desequilibrado es una buena idea cuando los datos del mundo real, usaré mi clasificador, también estarán desequilibrados?

Cuál debería ser mi próximo paso, después de cubrir las estadísticas básicas de las estadísticas principales, un curso básico de análisis de datos (preparación de datos, exploración, clasificación, minería de reglas de asociación, agrupación, regresión) y un proyecto en un conjunto de datos SSLC (puede encontrarlo en mi único blog en Quora) usando R?

¿Por qué no es una práctica estándar publicar pesos de modelos entrenados junto con el código fuente para trabajos de investigación de aprendizaje profundo?

¿Qué recomendarías, Machine Learning o DevOps?

¿Cuáles son los algoritmos para el resumen automático? ¿Alguien puede explicar los pasos en el resumen automático?

¿Por qué se usan capas completamente conectadas en el "extremo" [lado de salida] de las NN convolucionales? ¿Por qué no antes?

Cómo cuantificar la cantidad de ruido en un conjunto de datos

¿Existe un puntaje general de 'utilidad' para el rendimiento de recuperación de información?

¿Dónde puedo encontrar excelentes bibliotecas de aprendizaje automático para Java?

¿Qué tema es importante para la ingeniería integrada, las redes neuronales o la automoción moderna?

¿Cómo soluciona un bosque aleatorio los problemas de regresión (no normalidad, heterocedasticidad, multicolinealidad, valores atípicos, valores faltantes y variables categóricas)?