¿Cuáles son algunas ideas o proyectos en Machine Learning o análisis de big data en un hackathon?

30 increíbles proyectos de aprendizaje automático

No 1

FastText: Biblioteca para una rápida representación y clasificación de texto. [11786 estrellas en Github] . Cortesía de Facebook Research.

No 2

Transferencia de estilo de foto profunda: Código y datos para el papel “Transferencia de estilo de foto profunda” [9747 estrellas en Github] . Cortesía de Fujun Luan, Ph.D. en la universidad de Cornell

Numero 3

La API de reconocimiento facial más simple del mundo para Python y la línea de comando [8672 estrellas en Github] . Cortesía de Adam Geitgey.

No. 4

Magenta: generación de música y arte con inteligencia artificial [8113 estrellas en Github] .

Numero 5

Soneto: biblioteca de red neuronal basada en TensorFlow [5731 estrellas en Github] . Cortesía de Malcolm Reynolds en Deepmind.

No 6

deeplearn.js: una biblioteca de inteligencia de máquina acelerada por hardware para la web [5462 estrellas en Github] . Cortesía de Nikhil Thorat en Google Brain

No 7

Transferencia de estilo rápida en TensorFlow [4843 estrellas en Github] . Cortesía de Logan Engstrom en MIT

No 8

Pysc2: StarCraft II Learning Environment [3683 estrellas en Github] . Cortesía de Timo Ewalds en DeepMind


No 9

AirSim: simulador de código abierto basado en Unreal Engine para vehículos autónomos de Microsoft AI & Research [3861 estrellas en Github] . Cortesía de Shital Shah en Microsoft


No 10

Facetas: visualizaciones para datasets de aprendizaje automático [3371 estrellas en Github] . Cortesía de Google Brain.


No 11

Style2Paints: coloración AI de imágenes [3310 estrellas en Github] .


No 12

Tensor2Tensor: una biblioteca para modelos de secuencia a secuencia generalizados – Google Research [3087 estrellas en Github] . Cortesía de Ryan Sepassi en Google Brain


No 13

Traducción de imagen a imagen en PyTorch (por ejemplo, horse2zebra, edge2cats y más) [2847 estrellas en Github] . Cortesía de Jun-Yan Zhu, Ph.D en Berkeley


No 14

Faiss: una biblioteca para búsqueda eficiente de similitud y agrupamiento de vectores densos. [2629 estrellas en Github] . Cortesía de Facebook Research.


No 15

Fashion-mnist: una base de datos de productos de moda similar a MNIST [2780 estrellas en Github] . Cortesía de Han Xiao, científico investigador Zalando Tech.


No 16

ParlAI: Un marco para entrenar y evaluar modelos de IA en una variedad de conjuntos de datos de diálogo disponibles abiertamente [2578 estrellas en Github] . Cortesía de Alexander Miller en Facebook Research.


No 17

Fairseq: Facebook AI Research Sequence-to-Sequence Toolkit [2571 estrellas en Github] .


No 18

Pyro: programación probabilística universal profunda con Python y PyTorch [2387 estrellas en Github] . Cortesía de Uber AI Labs.


No 19

iGAN: Generación interactiva de imágenes con tecnología GAN [2369 estrellas en Github] .


No 20

Deep-image-before: Restauración de imágenes con redes neuronales pero sin aprendizaje [2188 estrellas en Github] . Cortesía de Dmitry Ulyanov, Ph.D. en Skoltech.


No 21

Face_classification: detección de rostros en tiempo real y clasificación de emociones / género utilizando conjuntos de datos fer2013 / imdb con un modelo keras CNN y openCV. [1967 estrellas en Github] .


No 22

Speech-to-Text-WaveNet: reconocimiento de voz en inglés de nivel de oración de extremo a extremo utilizando WaveNet de DeepMind y tensorflow [1961 estrellas en Github] . Cortesía de Namju Kim en Kakao Brain


No 23

StarGAN: Redes Adversarias Generativas Unificadas para la Traducción de Imagen a Imagen de Dominios Múltiples [1954 estrellas en Github] . Cortesía de Yunjey Choi en la Universidad de Corea.


No 24

Ml-agents: Unity Machine Learning Agents [1658 estrellas en Github] . Cortesía de Arthur Juliani, Deep Learning en Unity3D


No 25

DeepVideoAnalytics: una plataforma distribuida de búsqueda visual y análisis de datos visuales [1494 estrellas en Github] . Cortesía de Akshay Bhat, Ph.D. en la Universidad de Cornell.


No 26

OpenNMT: Traducción automática neuronal de código abierto en la antorcha [1490 estrellas en Github] .


No 27

Pix2pixHD: Sintetizar y manipular imágenes de 2048 × 1024 con GAN condicionales [1283 estrellas en Github] . Cortesía de Ming-Yu Liu de AI Research Scientist en Nvidia


No 28

Horovod: marco de entrenamiento distribuido para TensorFlow. [1188 estrellas en Github] . Cortesía de Uber Engineering.


No 29

Bloques AI: una interfaz WYSIWYG potente e intuitiva que permite a cualquiera crear modelos de Machine Learning [899 estrellas en Github] .


No 30

Redes neuronales profundas para la conversión de voz (transferencia de estilo de voz) en Tensorflow [845 estrellas en Github] . Cortesía de Dabi Ahn, AI Research en Kakao Brain

Los proyectos de código abierto pueden ser útiles para los científicos de datos. Puede aprender leyendo el código fuente y construir algo sobre los proyectos existentes. Dedique mucho tiempo a jugar con los proyectos de Machine Learning que puede haberse perdido durante el año pasado.

El problema fundamental con los hackatones es el tiempo. La limpieza de datos, las disputas, el entrenamiento del modelo, la evaluación del modelo, el ajuste del modelo requieren una cantidad significativa de tiempo. Si es alojado por una empresa como Google, puede haber acceso sin restricciones a su plataforma en la nube.

Las restricciones de recursos aparte de los hackatones son más una oportunidad para descubrir oportunidades.

El proyecto que emprenda no responderá una pregunta, pero explorará preguntas que vale la pena formular.

Por lo tanto, es mejor trabajar en algo que inspire curiosidad entre los participantes.

More Interesting

¿Es muy difícil sobresalir en ciencia de datos? ¿Qué instituto debería considerar para los cursos de ciencia de datos en Pune?

¿Cuál es su opinión sobre el repentino interés de las personas en la ciencia de datos y análisis?

¿Qué núcleos recomienda para aprender la ciencia de datos de Python?

¿Cuáles son los requisitos previos para aprender Hadoop y big data en master of science para nosotros?

¿Cuáles son las perspectivas de trabajo después de hacer una maestría en ciencia de datos / análisis de datos en Irlanda?

Deep Learning se implementa principalmente en big data. ¿Qué piensa sobre usarlo en datos con muestras limitadas pero de altas dimensiones como fMRI?

¿Qué oportunidades de carrera en ciencia de datos y aprendizaje automático existen en la NASA?

¿Cómo es la ciencia de datos diferente del análisis de Big Data?

¿Qué se entiende por aprendizaje automático y el futuro de la ciencia de datos en la India?

Cómo solicitar una pasantía de Data Science en Amazon

¿Cuáles son las áreas básicas de conocimiento matemático y estadístico con las que un científico debería sentirse muy cómodo y cómo las aprende?

¿Hay alguna capacitación en el aula dirigida por un instructor en Pune para el aprendizaje automático y la ciencia de datos para un principiante completo?

¿Cuáles son los proyectos prácticos de aprendizaje automático que muestran soluciones paso a paso para que pueda seguir y comprender cada paso en detalle?

¿Cuáles son las habilidades necesarias para la ciencia de datos?

¿Qué estudios serían los más útiles para nuevas empresas durante las próximas décadas, informática o ciencia de datos?