¿Cuáles son los proyectos prácticos de aprendizaje automático que muestran soluciones paso a paso para que pueda seguir y comprender cada paso en detalle?

He estado disfrutando de una Guía del programador para la minería de datos como una forma rápida de adquirir habilidades prácticas de aplicación de Machine Learning en Python.
Tengo un GitHub del material en el que estoy trabajando aquí: irJERAD / A-guide-to-datos-prácticos-minería-inteligencia-colectiva-y-construcción-sistemas-de-recomendaciones

Planeo actualizar y solicitar el ya mencionado http://datasciencemasters.org/ con algunos recursos nuevos, incluido el trabajo en la clase gratuita de Stanford a partir de mañana: aprendizaje estadístico que enseña el autor del increíblemente instructivo libro Introducción a la estadística Aprendizaje con aplicaciones en R: Introducción al aprendizaje estadístico

Una mejor pregunta que debe hacerse es qué tipo de experiencia de Machine Learning está buscando.
ambos técnicamente: clasificación, árbol de decisión, GRM, etc.
y Prácticamente: optimizar la tasa de clics, comprender las variables correlacionadas o interpretar la inferencia estadística de un conjunto de datos, o incluso diagnosticar sistemas comprometidos basados ​​en análisis de comportamiento y técnicos de redes para una empresa de seguridad, etc., etc.

Hay tantas combinaciones útiles y completamente aplicables de Teoría, Práctica y Mundo Real que definir eso lo ayudará mejor a encontrar el recurso de Aprendizaje / Práctica más ventajoso.

Espero que ayude. Si desea obtener más información sobre los recursos, tengo mucho que compartir, pero preferiría ser más preciso con la forma en que lo ayudo a lograr algo más que documentos y ejercicios sobre la lluvia.

No dudes en contactarme en GitHub o en mi sitio personal Actividades e intereses,
Jerad Acosta

Visite este sitio web: The Open Source Data Science Masters. Contiene referencias a varias fuentes, y muchas de ellas son tutoriales (textuales e incluso algunos videos) o recursos similares. Sin embargo, para comprender cada paso en detalle, es posible que desee leer un libro serio sobre aprendizaje automático, como Introducción al aprendizaje estadístico o, si desea un libro aún más serio, Los elementos del aprendizaje estadístico.

Dudo que encuentre mucho material que sea tan detallado, y las razones son claras: la mayoría de los algoritmos se publican primero como documentos de investigación, y los documentos de investigación tienen un límite de tamaño; Además, los lectores de esos documentos no requieren todos los detalles en la mayoría de los casos.

Por lo tanto, lo mejor en mi opinión es encontrar algunos artículos recientes muy citados y hojearlos. Eso debería darle una idea de lo que están construyendo. Luego lea sobre los conceptos básicos de los conceptos que utiliza el trabajo de investigación y vuelva a leerlo. Y, por supuesto, puede hacer preguntas específicas sobre Quora, ya que hay muchos expertos en aprendizaje automático.

Esto puede ser tangencialmente útil aquí: la respuesta de Prashant Sharma a ¿Cómo puedo motivarme para leer los documentos relacionados con mi trabajo con más frecuencia?

1) Los ganadores de la competencia de Kaggle a menudo escriben libros blancos sobre sus estrategias ganadoras. 2) Los trabajos académicos se centran en teorías la mayor parte del tiempo. 3) Puede o no ser factible para los profesionales de la industria revelar sus soluciones integrales debido a problemas de propiedad intelectual y privacidad de la empresa.

Lo que encontré más útil para comenzar es probar conjuntos de problemas en los cursos en línea, por lo general se proporcionan recorridos detallados. Y aprendes practicando (en lugar de imitar completamente a los demás). También visite datatau.com, hay una gran cantidad de contenido interesante y fácil de seguir.

Consulte el ejemplo de recomendación de Movielens utilizado en el tutorial de Amazon EMR y Apache Mahout.