Depende totalmente de tu interés. Hay miles de proyectos para elegir. Investigue un poco y descubra dónde reside realmente su interés. Dedique un tiempo a Github y Kaggle para comprender qué es tendencia y qué está haciendo la mayoría.
Algunos de los proyectos en los que creo que son excelentes para trabajar o contribuir, antes de dirigirse a su propio proyecto: (Independientemente de sus antecedentes y perfil)
- IEPY
IEPY es una herramienta de código abierto para la extracción de información centrada en la extracción de relaciones
Está dirigido a usuarios que necesitan realizar Extracción de información en un gran conjunto de datos. científicos que desean experimentar con nuevos algoritmos de IE. Enlace: iepy
- ¿Cuáles son las buenas bibliotecas de código abierto en Python o R para los métodos de Tensor? ¿Su equipo mantiene alguna?
- Cómo medir la calidad de un proyecto de ciencia de datos
- ¿Debo ir a UC Davis o UC Berkeley para estudiar Estadística?
- ¿Cuáles son los conceptos erróneos comunes sobre la ciencia de datos?
- ¿Cuál es el equivalente R de los ** kwargs de Python?
- LECHE
Milk es un kit de herramientas de aprendizaje automático en Python. Se centra en la clasificación supervisada con varios clasificadores disponibles: SVM, k-NN, bosques aleatorios, árboles de decisión. También realiza la selección de funciones. Estos clasificadores se pueden combinar de muchas maneras para formar diferentes sistemas de clasificación. Enlace: leche
- Pylearn2
Pylearn2 es una biblioteca diseñada para facilitar la investigación del aprendizaje automático. Es una biblioteca basada en Theano. Enlace: pylearn2
- NuPIC
La Plataforma Numenta para Computación Inteligente (NuPIC) es una plataforma de inteligencia de máquina que implementa los algoritmos de aprendizaje HTM. HTM es una teoría computacional detallada de la neocorteza. En el núcleo de HTM se encuentran los algoritmos de aprendizaje continuo basados en el tiempo que almacenan y recuerdan patrones espaciales y temporales. NuPIC es adecuado para una variedad de problemas, en particular la detección de anomalías y la predicción de fuentes de transmisión de datos.
Enlace: nupic
- Modelo
Pattern es un módulo de minería web para Python. Cuenta con herramientas para minería de datos, procesamiento de lenguaje natural, análisis de redes y aprendizaje automático. Es compatible con el modelo de espacio vectorial, agrupamiento, clasificación utilizando KNN, SVM, Perceptron. Enlace: patrón
Consejo: Consulte las páginas de documentación de estos proyectos para obtener instrucciones. Debes practicar los algoritmos de regresión, clasificación y agrupamiento.
Para empezar, hay muchos proyectos divertidos de aprendizaje automático. Por ejemplo, podrías intentar …
- Apuestas deportivas … Predecir los puntajes del cuadro dados los datos disponibles en el momento justo antes de cada nuevo juego.
- Exploración de talentos … Utilice las estadísticas de la universidad para predecir qué jugadores tendrían las mejores carreras profesionales.
- Gestión general … Crea grupos de jugadores basados en sus fortalezas para construir un equipo completo.
Espero que esta gran cantidad de información sea útil.