¿Cuáles son algunas de las tareas más desalentadoras en Computer Vision?

Hay muchas formas de clasificar la dificultad de una tarea de visión por computadora:

  1. ¿Qué tan grande es el conjunto de datos que estamos ejecutando o el algoritmo de Computer Vision?
  2. ¿Cuán abstracto o nebuloso es el resultado de nuestra meta? (La visión por computadora funciona bien con tareas matemáticas muy bien definidas en lugar de generalizaciones)
  3. ¿Qué tan difícil es implementar la intuición humana en nuestro programa para obtener un resultado útil?

Probablemente la más grande en escala y alcance es la indexación e identificación inteligente de los resultados de búsqueda de imágenes. Identificar lo que hay en una imagen no solo es extremadamente difícil para las computadoras sin la toma de decisiones humanas como referencia, es difícil encontrar el resultado etiquetado correctamente en una búsqueda. Digamos, por ejemplo, que buscas en Google imágenes para una “persona”, el resultado podría mostrar todo, desde pinturas del Renacimiento italiano hasta imágenes de sirenas en películas (que el usuario que busca no siempre las considera “personas”). Este proceso de etiquetado y búsqueda debe hacerse en cada imagen en la web (que es una gran cantidad de datos) y luego ordenarse y priorizarse de manera útil.

More Interesting

¿Qué áreas de la informática son las más relevantes para el aprendizaje automático?

¿Cuáles son las áreas fascinantes de la informática? ¿Cuáles son algunas de las áreas más avanzadas técnicamente de la informática?

¿Cuál es el alcance de la investigación en aprendizaje automático?

Visión por computadora: ¿cuáles de los temas son necesarios antes de hacer un proyecto en opencv?

¿Qué son las arquitecturas CISC y RISC? ¿Cómo se diferencian entre sí?

¿Hay algún algoritmo (o aplicación) que pueda distinguir entre música, habla o galimatías al azar?

¿Qué problemas informáticos difíciles o sin resolver tienen más probabilidades de ser ignorados por aquellos nuevos en la programación?

¿Ha habido nuevos algoritmos brillantes de informática en los últimos 10 años?

¿Cuál es el mejor lenguaje de programación para hacer investigaciones y locuras?

¿Por qué debería aprender C #?

¿Qué tan común es que un proyecto de investigación falle en informática?

¿Los procesadores se ralentizan con la edad?

¿Cómo calificaría el Instituto Nacional de Investigación en Informática y Control en términos de calidad de la investigación y otros parámetros importantes en comparación con otros institutos mundiales como el MIT, Stanford, etc.?

¿Qué campo de la informática es menos explorado?

¿Cuáles son algunos avances recientes en la teoría de grafos? Tomé un curso de posgrado en teoría de grafos, pero los resultados que uso de la teoría de grafos (espectrales y aleatorios) tienen más de 50 años. ¿Qué hay de nuevo y cuáles son los grandes avances recientes?