Cómo llegar a un problema de aprendizaje automático para un proyecto personal

Tuve un dilema similar cuando me preocupaba en qué involucrarme para mi proyecto de último año. No se pudo decidir en qué aplicación trabajar, cómo proceder y el proyecto con el que pensaba continuar, ya estaba implementado de una forma u otra. La idea de hacer un trabajo novedoso por mi cuenta me molestó mucho para evitar las aplicaciones ya implementadas.

Un día me encontré con esta pregunta sobre Quora: ¿Cuáles son algunas aplicaciones del aprendizaje automático en el deporte profesional? ¿Especialmente en fútbol (soccer)? Soy un gran aficionado al fútbol, ​​y sigo regularmente los principales sitios web de fútbol, ​​como Goal.com, Bleacher Report, etc. Cuando leo un artículo, más a menudo que no, me recomiendan un artículo de otro deporte (no en Goal , en otros sitios) en los que no estoy interesado en absoluto. Entonces, pensé en diseñar un sistema de recomendación de artículos que, en lugar de usar el modelo convencional de bolsa de palabras, use el algoritmo word2vec. Incorpora el uso de espaciado vectorial inteligente con la ayuda de redes neuronales y funciona mejor que el modelo de bolsa de palabras.

La conclusión es: trate de involucrarse en algo que realmente le interese. Trabajar en lo que está trabajando la mitad de la comunidad de ML en este momento puede hacer maravillas por usted, pero solo si realmente está interesado en ello. Prefiero sugerir que participe en algo que afecta su vida a diario. De esta manera, en la búsqueda de la finalización del proyecto, verá que su trabajo impacta su vida (Bueno, no al instante, pero al menos podrá prever qué tipo de impacto podría tener si se implementara a gran escala ) Comenzará a preocuparse por el proyecto y lo mantendrá motivado durante los momentos en que se sentirá atrapado. El apego emocional a algo es la mejor motivación que uno puede tener para lograr el objetivo.

  • Interesado en las finanzas? Trabajar en el análisis del mercado de valores.
  • ¿Interesado en las redes sociales? Lea sobre el análisis de sentimientos y trabaje en eso.
  • ¿Interesado en aplicaciones medicinales de ML? Intenta trabajar en el análisis de células cancerosas.

Y la lista continúa. Una cosa a tener en cuenta aquí es que no dude en trabajar en algún proyecto que se ha implementado o si se ha publicado algún documento al respecto. Intenta replicar el papel. A veces, te llevará a tener una visión aguda del trabajo de investigación y, si tienes suerte, es mejor que obtengas mejores resultados que el trabajo base.


En cuanto a qué algoritmos / modelos usar una vez que tenga una idea, creo que sabrá la respuesta a esto una vez que tenga al menos los fundamentos básicos de los algoritmos principales en su haber. A menos que esté trabajando en un proyecto / aplicación muy grande, creo que emplear solo uno de los algoritmos, a saber, Regresión logística, Máquinas de vectores de soporte, Retropropagación, Regresión lineal, Bayes ingenuos, etc. será suficiente. De lo contrario, es posible que necesite un conjunto de un par de algoritmos. En cualquier caso, debe tener una sólida comprensión de los principales algoritmos subyacentes antes de comenzar un proyecto.


Espero que esto ayude.

Algunos de los proyectos comunes en los que puedo pensar son:

1> Predicción de cambios en el mercado de valores (datos gratuitos disponibles en http://quandl.com )

2> Análisis de sentimientos en los datos de Twitter

3> Análisis de supervivencia

4> Detección automática de dígitos escritos a mano

Hay tantas ideas por ahí. Te sugiero que vayas a diferentes sitios web que organizan concursos para ver qué hay ahí fuera. Algunos buenos lugares para comenzar son:

http://kaggle.com , http://crowdanalytix.com etc.

More Interesting

¿Cuál es el lenguaje más utilizado para el aprendizaje automático en la industria?

¿Cuáles son las 8 principales cosas para las que las startups utilizan el aprendizaje automático?

¿Cuál es una buena forma de buscar artículos en visión artificial y aprendizaje automático?

Cómo saber si mi modelo de regresión es heteroscedastic u homoscedastic de mi modelo de residuos

¿Cuáles son los algoritmos de aprendizaje profundo que pueden corregir los errores de reconocimiento óptico de caracteres (OCR)?

Con referencia a AdaBoost, ¿qué se entiende exactamente por 'ponderado' cuando se dice que entrena a un clasificador débil dada una distribución ponderada?

¿Por qué se utiliza un descenso gradiente iterativo para redes neuronales y no inmediato?

¿Por qué las arquitecturas de aprendizaje profundo como CNN, Faster R-CNN o SSD están abiertas a todos? ¿Por qué estas personas no pueden patentar estas arquitecturas?

¿Por qué las arquitecturas profundas aprenden representaciones de características cada vez más altas?

¿Cuáles son los libros de texto clásicos y de lectura obligatoria en las estadísticas?

¿Por qué es tan difícil la IA? ¿Por qué todavía no hemos construido una máquina de IA?

¿El apilamiento de modelos en el aprendizaje automático hace una gran diferencia en los resultados?

¿Cuál es el flujo de trabajo típico para usar el aprendizaje profundo para resolver un problema?

¿Cuál es el mejor algoritmo de agrupamiento adaptativo k-means (que k se elige automáticamente)?

¿Cuáles son buenos recursos para aprender sobre la ejecución distribuida en redes neuronales profundas (MPI, allreduce, etc.)?