Para empezar, debe tener los elementos básicos ordenados, como el procesamiento de imágenes, las matemáticas y la programación.
Las matemáticas necesarias para la visión por computadora en realidad no son tan avanzadas. Es lo mismo que el aprendizaje automático (ML).
- Álgebra lineal
- Matrices
- Vectores
- Descomposición de valores singulares (SVD)
- Optimización numérica (no lineal)
- Métodos de optimización de primer orden
- Métodos de optimización de segundo orden.
- Estadísticas y probabilidad
- Teorema de Bayes
- Variables aleatorias
- Funciones de distribución de probabilidad
- Programación
- Pitón
- Java
- C ++
- Además, con la visión por computadora, necesita saber al menos un poco sobre los modelos de visión de la neurociencia.
- La hipótesis de las dos corrientes
- Y algunos otros modelos interesantes, pero no profundice demasiado en la neurociencia, puede perderse fácilmente.
Debe poder comprender cómo funciona una operación de convolución.
- ¿Qué es el hamming-incrustado? ¿Cómo mejora el modelo BoF?
- ¿Cuáles son los teoremas / deducciones más ingeniosos en la teoría de grafos?
- Soy un estudiante de ciencias de la computación en el segundo año y estoy obteniendo buenas calificaciones, pero aún no estoy satisfecho. Quiero ser parte de grandes organizaciones y quiero utilizar mi tiempo, pero no sé cómo hacerlo. ¿Cómo puedo utilizar mi tiempo en proyectos beneficiosos?
- ¿Cuáles son las empresas / instituciones académicas que trabajan en compiladores?
- ¿Ha habido algún progreso en la arquitectura de subsunción desde que se introdujo?
También debe comprender el producto escalar y lo útil que es.
Una gran cantidad de algoritmos de visión por computadora se basan en productos de punto para la detección de coincidencias o características. Cuanto mayor sea el valor del producto interno entre dos vectores, más similares son. Tal medida básica de similitud está presente en sistemas de visión muy avanzados.
De hecho, la correlación cruzada es solo un algoritmo de producto de punto deslizante que se utiliza en redes neuronales convolucionales (CNN) para la detección de características.
El algoritmo clásico de ventana deslizante también es solo correlación cruzada.
Los nodos en la red neuronal también implementan un producto de puntos.
Conozca y comprenda el producto básico de puntos, que está en el corazón de muchos sistemas avanzados de visión por computadora.
Sin embargo, solo entender el producto punto no es suficiente.
Para ser competente en CV, debe comenzar proyectos reales de CV en la vida real.
Construir proyectos de CV reales es lo que lo hará competente en CV y lleva mucho tiempo.
Espero que esto ayude.