¿Existen pequeños proyectos significativos en el aprendizaje automático?

El problema con los proyectos de aprendizaje automático, a pequeña o gran escala, es que los datos casi nunca están disponibles. Recolectar, limpiar y formatear es un trabajo muy duro que nadie hace a menos que haya una clara necesidad.

¿Existen pequeños proyectos significativos en el aprendizaje automático?

Si, absolutamente. Hay muchos proyectos pequeños significativos y emocionantes en ML, incluso mejor, algunas personas están listos para pagarlos. La mayoría de esos proyectos se pueden hacer en una computadora portátil. Pero en esos casos, alguien ya ha preparado el conjunto de datos. Si no trabaja como científico de datos, tendrá que hacerlo usted mismo.

Si trabajar como científico de datos no es una opción para usted ahora, aún puede hacer un trabajo significativo:

  • Contribuciones de código abierto
    Implemente nuevas funciones y corrija errores en los marcos de ML existentes. Este es un trabajo muy impactante y facilitará muchas vidas.
  • Investigación de datos abiertos
    Trabajar en datos abiertos del gobierno puede ayudar a las organizaciones gubernamentales y sin fines de lucro en sus trabajos. Hacen que esos conjuntos de datos estén disponibles públicamente y encajan perfectamente en la categoría de “datos pequeños”
  • Periodismo
    Una gran narrativa y hacer infografías pueden ayudar a las personas a tomar decisiones informadas. Esto es más un trabajo de analista, pero aún puede ser útil.

Para un investigador de ML, el mejor curso de acción sería utilizar AWS para construir los modelos. Los servidores en alquiler no cuestan mucho y esencialmente solo paga por lo que usa. A menos que necesite un clúster de GPU gigante durante un mes, probablemente esté bien.

Como pensamiento secundario, hay comunidades abiertas de investigación de ML e IA (como OpenAI Slack) donde puede unirse a un equipo existente (también pueden tener algunos recursos computacionales) y usar sus habilidades en un proyecto interesante.

Sí. Hay muchos proyectos significativos en el campo del aprendizaje automático.

La palabra pequeña indica: 1) Fácil y breve. 2) Pequeño conjunto de datos para tratar.

Puede comenzar con Kaggle: contiene muchas pequeñas competiciones y conjuntos de datos en los que puede comenzar, esto le dará una idea sobre el significado que puede tener un proyecto. Para empezar, comience con el conjunto de datos de supervivencia Titanic, que es pequeño y fácil de entender.

Puede implementar algún proyecto de predicción de negociación de acciones, hay muchos tutoriales disponibles en línea.

Algunas referencias para comenzar:

Aprendizaje automático para el comercio | Udacity

http://cs229.stanford.edu/proj20

Si está buscando practicar y aprender, vea las respuestas a Soy principiante en Análisis de datos. Intermedio en Programación R, Machine Learning y Python. Dar algunas ideas para el proyecto de análisis de datos?

Además, es posible que desee probar y codificar su propio algoritmo de aprendizaje automático, no necesariamente novedoso. Por ejemplo, tal vez en R o Python o incluso Microsoft Excel, use el código para calcular una regresión múltiple en un pequeño conjunto de datos. Es decir, implemente los cálculos utilizando fórmulas, no paquetes o asistentes. Luego, tal vez eche un vistazo a cada paso de su implementación y vea si hay mejoras que hacer. Si bien es posible que no desee probar y reproducir todos los algoritmos de ML con código o fórmulas, es una excelente manera de pensar en ellos.

Hay muchos proyectos en el aprendizaje automático que van desde pequeños hasta el manejo de terabytes de datos.

Por favor, consulte su casa para la ciencia de datos para sus requisitos de coincidencia en un ‘pequeño proyecto’ … ¡Todo lo mejor!

Sí…

He enumerado 40 proyectos divertidos interesantes para principiantes aquí. Revisa.

More Interesting

¿Qué cosas, como civilización, hemos estado haciendo mal todo este tiempo?

¿Los científicos informáticos se consideran ingenieros?

Usando la potencia de procesamiento de todas las supercomputadoras más potentes del mundo, ¿cuánto tiempo y energía se necesitaría para renderizar cada imagen posible dentro de un lienzo de 500 × 500 píxeles con una profundidad de color de 8 bits?

¿Cuál es la diferencia entre seguridad de red, seguridad de la información y seguridad informática?

¿Qué es un buen proyecto de aprendizaje automático que involucra interfaces cerebro-computadora?

¿Qué pasaría si casi cualquier persona pudiera escribir software de alta calidad?

¿Qué reputación tienen los graduados de Rose-Hulman CSSE entre los graduados de computación de primer nivel?

Tengo que imprimir esta secuencia para 3 procesos: P, Q, R. PQQRR usando solo semáforo. ¿Cómo hago esto?

Andrew Ng: ¿La ira del aprendizaje automático está causando una fuga de cerebros de otros campos igualmente importantes y atractivos, pero menos glamorosos?

Si programas como Hack Reactor son legítimos, ¿por qué la gente se molesta con los títulos en informática de las universidades tradicionales? ¿Alguien tiene experiencia con un programa como Hack Reactor y pueden dar fe de su éxito en comparación con la universidad normal?

Para comenzar una empresa de tecnología en aprendizaje automático e inteligencia artificial, ¿es mejor exponerse al campo en la industria o en un entorno posdoctoral?

¿Es correcto que XNOR y XOR se comporten igual si tienen un número impar de entradas y se complementan si tienen un número par de entradas?

¿Cuáles son sus experiencias como consultor en ciencia de datos?

¿Cómo se utilizan los modelos de aprendizaje automático en datos con una escala media como 10 a 15 GB? ¿Alguien puede compartir el recurso para eso?

¿Qué universidad entre UCSB, USC y UIUC es una mejor opción para un título universitario en física y ciencias de la computación?