¿Dónde se puede usar la visión computacional en el aprendizaje profundo?

  • Estás haciendo la pregunta mal. La forma de hacer la pregunta es: ¿Cómo se puede utilizar el Aprendizaje profundo en la Visión por computadora? La respuesta es generalmente reconocer cosas basadas en un conjunto de entrenamiento. Y las cosas son muy muy amplias. Bajo los viejos paradigmas de técnicas como la correlación normalizada, el reconocimiento de cosas se redujo a reconocer cosas estáticas como una cara o una cabeza o fiduciales en un entorno industrial. Pero con el aprendizaje profundo las cosas pueden ser mucho más dinámicas, por ejemplo, más allá de la cara, puedes reconocer feliz, triste o perplejo. Esto habría sido mucho más desafiante bajo los viejos paradigmas.
  • Apéndice. He pensado más en su respuesta y me gustaría decir lo siguiente. Si bien el aprendizaje profundo se considera un tipo avanzado de visión por computadora, sin duda se podría concebir un sistema en el que la visión por computadora se utilizara como un front-end para el aprendizaje profundo. Por ejemplo, la visión por computadora podría usarse para ayudar a clasificar el conjunto de entrenamiento o para mejorar de manera automática la calidad de imagen del conjunto de entrenamiento, por ejemplo, con eliminación de ruido dinámico o algún tipo de ecualización de histograma automático que fue lo suficientemente inteligente como para mejorar la imagen pero no distorsionarlo hasta el punto de ser menos efectivo para el aprendizaje profundo. En el extremo frontal de la parte de reconocimiento, lo mismo es cierto, el mismo frente y debe usarse para la fase de aprendizaje y la fase de reconocimiento o clasificación si es posible para que se convierta en parte del clasificador.

El aprendizaje profundo se puede usar en Computer Vision 😉

More Interesting

Necesito analizar resúmenes de texto en lenguaje humano e identificar los temas mencionados en ellos. ¿Esto cae bajo el reconocimiento de la entidad nombrada?

Cómo medir el rendimiento de aprendizaje en Q-Learning

Entre JavaScript y la ciencia de datos, ¿qué debo hacer? Tengo que aprender a los dos desde cero.

Tengo un conjunto de datos con una combinación de datos cualitativos y cuantitativos, ¿cómo puedo inferir una relación o sensibilidad entre las columnas?

¿Qué es una explicación intuitiva de los coeficientes de regresión logística?

¿Qué hace que una computadora sea única? ¿Es el HDD? Si es así, ¿eliminarlo y ponerlo en otra máquina hace que esa máquina sea la misma que la original?

¿Por qué tenemos que convertir el valor categórico en factor (en R) o variables ficticias antes de aplicar algoritmos de aprendizaje automático (especialmente regresión lineal)? ¿Afecta nuestros resultados?

En forma de estudios de caso, ¿cómo utilizan las empresas financieras el aprendizaje automático?

¿Cuáles son las ventajas y desventajas de la traducción automática estadística y basada en reglas?

¿Todavía es necesario aprender LDA (distribución de Dirichlet latente)?

¿Cuál es la diferencia entre una cadena de Markov recurrente y una cadena de Markov absorbente?

¿Por qué las arquitecturas de aprendizaje profundo como CNN, Faster R-CNN o SSD están abiertas a todos? ¿Por qué estas personas no pueden patentar estas arquitecturas?

¿Hay algún hallazgo reciente que indique que la ascendencia cerebral ocurre como un esquema de error de propagación inversa?

¿Qué es un componente principal y por qué se llama así?

Aprendizaje automático: ¿qué significa 'Los bosques aleatorios requieren casi ninguna preparación de entrada'?