Andrew Ng: ¿Qué proyectos personales mejorarían la empleabilidad de un estudiante de ML / Data Science (suponiendo que no haya antecedentes en CS / STEM)? La tecnología cambia la vida futura

Depende totalmente de tu interés. Hay miles de proyectos para elegir. Investigue un poco y descubra dónde reside realmente su interés. Dedique un tiempo a Github y Kaggle para comprender qué es tendencia y qué está haciendo la mayoría.

Algunos de los proyectos en los que creo que son excelentes para trabajar o contribuir, antes de dirigirse a su propio proyecto: (Independientemente de sus antecedentes y perfil)

IEPY

IEPY es una herramienta de código abierto para la extracción de información centrada en la extracción de relaciones
Está dirigido a usuarios que necesitan realizar Extracción de información en un gran conjunto de datos. científicos que desean experimentar con nuevos algoritmos de IE. Enlace: iepy

LECHE

Milk es un kit de herramientas de aprendizaje automático en Python. Se centra en la clasificación supervisada con varios clasificadores disponibles: SVM, k-NN, bosques aleatorios, árboles de decisión. También realiza la selección de funciones. Estos clasificadores se pueden combinar de muchas maneras para formar diferentes sistemas de clasificación. Enlace: leche

Pylearn2

Pylearn2 es una biblioteca diseñada para facilitar la investigación del aprendizaje automático. Es una biblioteca basada en Theano. Enlace: pylearn2

NuPIC

La Plataforma Numenta para Computación Inteligente (NuPIC) es una plataforma de inteligencia de máquina que implementa los algoritmos de aprendizaje HTM. HTM es una teoría computacional detallada de la neocorteza. En el núcleo de HTM se encuentran los algoritmos de aprendizaje continuo basados en el tiempo que almacenan y recuerdan patrones espaciales y temporales. NuPIC es adecuado para una variedad de problemas, en particular la detección de anomalías y la predicción de fuentes de transmisión de datos.

Enlace: nupic

Modelo

Pattern es un módulo de minería web para Python. Cuenta con herramientas para minería de datos, procesamiento de lenguaje natural, análisis de redes y aprendizaje automático. Es compatible con el modelo de espacio vectorial, agrupamiento, clasificación utilizando KNN, SVM, Perceptron. Enlace: patrón

Consejo: Consulte las páginas de documentación de estos proyectos para obtener instrucciones. Debes practicar los algoritmos de regresión, clasificación y agrupamiento.

Para empezar, hay muchos proyectos divertidos de aprendizaje automático. Por ejemplo, podrías intentar …

Apuestas deportivas … Predecir los puntajes del cuadro dados los datos disponibles en el momento justo antes de cada nuevo juego.
Exploración de talentos … Utilice las estadísticas de la universidad para predecir qué jugadores tendrían las mejores carreras profesionales.
Gestión general … Crea grupos de jugadores basados en sus fortalezas para construir un equipo completo.

Espero que esta gran cantidad de información sea útil.