¿Cuáles son algunos proyectos paralelos de Machine Learning que puedo implementar en mi tiempo libre?

Intente implementar un modelo de lenguaje de aprendizaje profundo por su cuenta, primero como RNN y luego como LSTM o GRU (sería útil comprender cómo construir de manera abstracta este código para admitir las tres posibilidades).

Puede consultar la gran introducción de Andrej (La efectividad irracional de las redes neuronales recurrentes) para obtener motivación, datos de muestra y una implementación de referencia. Pero es útil pasar por todas las matemáticas para la propagación hacia atrás, primero de un RNN (en realidad primero para un NN avanzado si aún no lo ha hecho), luego el LSTM y GRU más complejos.

Puede codificarlo en un lenguaje simple como Python (con Numpy), para evitar tener que pensar en las GPU. Pero en algún momento eso se convertirá en un cuello de botella de velocidad, por lo que en algún momento puede hacer la transición para usar un kit de herramientas o API como Theano / Torch.

Juegue con él por muchos problemas simples, como lo hizo Andrej, y trate de tener una idea de lo que puede y no puede hacer. Es muy fascinante.

Aquí hay una lista de aprendizaje profundo para proyectos de visión por computadora, todo hecho para un curso de un semestre en Stanford:

Curso Proyectos Invierno 2015

El material para el curso también está disponible en línea.

Bueno, yo no diría que este es un proyecto simple porque puede llevar algún tiempo completarlo. Me gusta trabajar en proyectos a largo plazo realmente difíciles que creo que son geniales, pero pueden no ser realmente geniales, pero si son geniales para mí, está bien.

He intentado hacer un proyecto de interpretación del lenguaje de señas durante un tiempo, pero todavía no lo he comenzado. Quizás el uso de una combinación de redes neuronales profundas recurrentes LSTM y algoritmos ConvNets pueda lograr buenos resultados. Podría ser genial apuntar un teléfono con cámara a alguien que habla lenguaje de señas y obtener voz o texto como salida.

Por lo tanto, el proyecto consiste en asignar gestos de lenguaje de señas a voz o texto, no es fácil pero es posible con los algoritmos actuales de aprendizaje profundo. El problema también puede ser con la recopilación de datos, dudo que haya un buen conjunto de datos de video en lenguaje de señas. El otro desafío es que el aprendizaje debe realizarse en conjuntos de capacitación en video, no en imágenes fijas, esto es complejo pero factible.

Siempre he soñado con cerrar la brecha de comunicación entre los humanos, sería realmente genial desarrollar un proyecto de este tipo. Si a alguien le gustaría colaborar, no tengo ningún problema, podemos trabajar en este proyecto como un proyecto de código abierto, ¿qué le parece?

Espero que esto ayude.

Creo que sería genial escribir algo que pudiera vencer a uno de los juegos de teléfonos móviles más populares y adictivos como Flappy Birds, Crossy Road, Candy Crush, etc.

Necesita aprender mucho: https://www.bing.com/search?q=Ma