Lamentablemente, no hay una respuesta fácil. Por lo general, aprende a lidiar con todos estos problemas mientras obtiene un doctorado. Solo confío en decir que aprende todas estas habilidades en lugares como CMU y MIT, en otras universidades, su kilometraje puede diferir.
(1) ¿Cómo aborda todos estos problemas en su investigación de manera eficiente y confiable?
Básicamente, debes ser miembro de un grupo de investigación durante varios años para aprender un poco sobre todos estos temas. Si está en un laboratorio que se enfoca en la detección de objetos, habrá muchos estudiantes a su alrededor que luchan con los mismos problemas, y hablar con otros estudiantes en medio de la noche es la única forma en que sé que puede obtener la experiencia que necesita. preguntar sobre.
(2) ¿Cómo depura el código y ajusta los parámetros de manera eficiente?
Las mejores prácticas para la depuración se adquirirán al mirar por encima de los hombros de los estudiantes más avanzados. Debe sentirse cómodo con la depuración en general antes de comenzar a depurar algoritmos de aprendizaje automático. La depuración de algoritmos de aprendizaje automático no es como la depuración de la clasificación rápida. Si corrige todos los errores, es posible que su algoritmo aún no funcione debido a otros problemas, como la falta de datos, la complejidad demasiado baja del modelo, etc. Para ser franco, depurar algoritmos de visión / aprendizaje es más como arte que ciencia.
- ¿Cuáles son las consecuencias y desventajas de usar datos agregados? ¿Cómo podemos combatirlos si no hay datos de nivel granular?
- ¿Cómo utiliza Facebook feed el aprendizaje profundo?
- ¿Cómo podemos saber si una heurística es mejor que otra sin ejecutarla?
- ¿Cuáles son los algoritmos disponibles para diseñar un detector de actividad de habla hablada cercana?
- ¿Cómo funcionan las representaciones distribuidas de escasez fija defendidas e implementadas por Numenta?
Ajustar los parámetros de un algoritmo o biblioteca de software que no escribió nunca es fácil. Debe aprender a usar los datos de validación correctamente, tener una buena idea de cómo se necesita para ejecutar el proceso completo de capacitación / evaluación y estar listo para usar un grupo de computadoras para la validación cruzada.
(3) ¿Cómo implementa un problema a gran escala con una PC personal? (Para el análisis de imagen / video, puede haber un gran volumen de datos más allá de su RAM, ¿cómo tratarlo?)
En general, no implementa un problema a gran escala en una sola PC. Una de las habilidades más valiosas que aprendí en la escuela de posgrado es cómo paralelizar los cálculos en un clúster. Desafortunadamente, esta es una de esas habilidades para hacerla o romperla. Si bien no es imposible, es difícil para las universidades / laboratorios sin grupos competir con universidades con grupos de tamaño mediano a grande. Esta es también una de las razones por las que tantos profesores se están uniendo a organizaciones como Google y Facebook: tienen los datos y los recursos computacionales para permitir que los investigadores principales trabajen en problemas a gran escala cada vez más ambiciosos.
Si no puede obtener acceso a un grupo grande, le recomendaría solicitar una pasantía en un lugar como Google. Aprenderás mucho (al menos yo lo hice) mientras estés allí. Si bien no podrá traer a casa ningún código que escriba allí, aprenderá muchas lecciones de escala que impactarán su vida como estudiante.
Si tiene que trabajar en una sola máquina, tendrá que cortar el conjunto de datos en fragmentos más pequeños y cargarlos gradualmente en la memoria.