¿Cómo puede llevar a cabo experimentos y compararlos con otros algoritmos en la investigación de la visión por computadora (detección de objetos, reconocimiento, seguimiento, etc.)?

Lamentablemente, no hay una respuesta fácil. Por lo general, aprende a lidiar con todos estos problemas mientras obtiene un doctorado. Solo confío en decir que aprende todas estas habilidades en lugares como CMU y MIT, en otras universidades, su kilometraje puede diferir.

(1) ¿Cómo aborda todos estos problemas en su investigación de manera eficiente y confiable?
Básicamente, debes ser miembro de un grupo de investigación durante varios años para aprender un poco sobre todos estos temas. Si está en un laboratorio que se enfoca en la detección de objetos, habrá muchos estudiantes a su alrededor que luchan con los mismos problemas, y hablar con otros estudiantes en medio de la noche es la única forma en que sé que puede obtener la experiencia que necesita. preguntar sobre.

(2) ¿Cómo depura el código y ajusta los parámetros de manera eficiente?
Las mejores prácticas para la depuración se adquirirán al mirar por encima de los hombros de los estudiantes más avanzados. Debe sentirse cómodo con la depuración en general antes de comenzar a depurar algoritmos de aprendizaje automático. La depuración de algoritmos de aprendizaje automático no es como la depuración de la clasificación rápida. Si corrige todos los errores, es posible que su algoritmo aún no funcione debido a otros problemas, como la falta de datos, la complejidad demasiado baja del modelo, etc. Para ser franco, depurar algoritmos de visión / aprendizaje es más como arte que ciencia.

Ajustar los parámetros de un algoritmo o biblioteca de software que no escribió nunca es fácil. Debe aprender a usar los datos de validación correctamente, tener una buena idea de cómo se necesita para ejecutar el proceso completo de capacitación / evaluación y estar listo para usar un grupo de computadoras para la validación cruzada.

(3) ¿Cómo implementa un problema a gran escala con una PC personal? (Para el análisis de imagen / video, puede haber un gran volumen de datos más allá de su RAM, ¿cómo tratarlo?)
En general, no implementa un problema a gran escala en una sola PC. Una de las habilidades más valiosas que aprendí en la escuela de posgrado es cómo paralelizar los cálculos en un clúster. Desafortunadamente, esta es una de esas habilidades para hacerla o romperla. Si bien no es imposible, es difícil para las universidades / laboratorios sin grupos competir con universidades con grupos de tamaño mediano a grande. Esta es también una de las razones por las que tantos profesores se están uniendo a organizaciones como Google y Facebook: tienen los datos y los recursos computacionales para permitir que los investigadores principales trabajen en problemas a gran escala cada vez más ambiciosos.

Si no puede obtener acceso a un grupo grande, le recomendaría solicitar una pasantía en un lugar como Google. Aprenderás mucho (al menos yo lo hice) mientras estés allí. Si bien no podrá traer a casa ningún código que escriba allí, aprenderá muchas lecciones de escala que impactarán su vida como estudiante.

Si tiene que trabajar en una sola máquina, tendrá que cortar el conjunto de datos en fragmentos más pequeños y cargarlos gradualmente en la memoria.

Si necesita comparar el rendimiento de su algoritmo con otros, puede echar un vistazo a
Punto de referencia de detección de peatones de Caltech
Esto es para la detección de peatones. Esto podría darte una mejor idea.
Hay evaluaciones comparativas similares disponibles para otras áreas de aplicación.

More Interesting

¿Se puede entrenar la imagen usando la función de activación?

¿Por qué hay una disminución en el rendimiento de los modelos pre-entrenados?

¿Cuál es la forma de generar / Ver resultados intermedios o parciales para la recomendación basada en el usuario en mahout, mientras que el mismo está disponible cuando se hace una recomendación basada en elementos en un modelo distribuido (Hadoop)?

¿Qué son las máquinas complejas?

Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

El entrenamiento de redes neuronales profundas utilizando la propagación inversa tiene el problema de un gradiente de error que desaparece y que establece un límite sobre cuántas capas se pueden entrenar efectivamente, entonces, ¿por qué no usar un algoritmo genético para entrenar redes profundas, eliminando la propagación de errores?

¿Es Cortana de Microsoft una copia flagrante de Siri de Apple?

¿Por qué tantos geeks de datos se unen a compañías web en lugar de resolver problemas de datos a gran escala en biología?

¿Cuál es una metodología sólida para abordar un problema de regresión?

¿Puedo aprender ML por mi cuenta?

¿Qué papel juegan las redes neuronales y el aprendizaje automático en la atención médica?

¿Qué versión de Python debería usar en 2016 en Machine Learning y Data Science, Python 2.7 o Python 3.0+?

¿Cuál es el papel de la informática en el aprendizaje automático?

¿Cuál es el plan de estudios de maestría de Stanford en AI / ML?

¿Cuáles son las cosas divertidas que encontró en el procesamiento del lenguaje natural (PNL)?