¿Cuál es la diferencia entre la visión médica por computadora y la visión general por computadora?

Actualmente estoy trabajando en una aplicación de visión artificial en medicina. Tengo que explicar esto casi todos los días.

Si considera lo que sucede en la visión por computadora, ahora se trata básicamente del reconocimiento de funciones. Comenzando con OCR. Entonces, ¿de qué es esta foto? ¿Hay caras en la foto? Rostros de personas que conozco? ¿Es similar a otras fotos?

No se trata de manipular imágenes (hemos podido hacerlo fácilmente durante 30 años), se trata de extraer información de ellas, lo que significa reconocimiento de características.

Considere el caso especial de OCR y CAPTCHA: comandos de Wikipedia. Ninguna parte del reconocimiento de características de imagen ha sido objeto de una investigación tan intensa como OCR. Y es un conjunto bastante limitado de características: 26 letras minúsculas, 26 mayúsculas y 10 números. Sin embargo, ni siquiera pueden extraer las características correctas de los códigos Captcha.

Casi todos los días, algún médico me mostrará un jpeg de una cosa cancerosa u otra, y me preguntará si puedo escribir un programa para encontrar estas características en las imágenes. Digo cómo sabes que es una cosa u otra cancerosa, y dicen que parece una. Y luego señalan que también pueden verse completamente diferentes a cómo se ve en esa imagen. Les digo que solo les parece una cosa u otra cancerosa porque fueron a Uni durante 7 años para aprender cómo se ven, y no es razonable esperar que mi programa pueda hacer esto.

Luego señalo esta caricatura colgando sobre mi espacio de trabajo exactamente por esta razón:

More Interesting

¿Hay alguna idea en criptografía inspirada en la biología?

¿Puede un estudiante universitario llevar a cabo una 'investigación' en computación cuántica de forma independiente?

¿Cuáles son algunas de las grandes ideas de proyectos para un estudiante de informática?

¿Qué es el algoritmo de relleno inferior izquierdo (BLF)?

¿Cuáles son algunos de los temas que combinarían temas de informática y biología?

¿Se puede resolver el problema de 3SUM en tiempo subcuadrático?

¿Qué país europeo es el mejor para hacer un doctorado en visión artificial y vivir allí después de la graduación?

¿Cuáles son las ventajas y desventajas de los lenguajes de programación visual en comparación con los lenguajes de programación normales?

En su POE, si un solicitante de doctorado de CS enumera grandes errores en un documento de investigación de su posible asesor de doctorado, ¿eso impresionaría al comité de admisiones?

¿Cuáles son los problemas en la visión por computadora en imágenes médicas?

Cómo comenzar la investigación en informática teórica

¿Qué tipo de trabajo de investigación se realiza en informática en la Universidad Nacional de Singapur (NUS)?

¿Qué habilidades prácticas debe aprender un aspirante a investigador de aprendizaje automático (Linux, computación paralela, GPU, etc.)?

¿Cuál es el mejor tema para una demostración en informática para un profesor?

Informática teórica: ¿Cuál es la diferencia entre un algoritmo de aproximación y un heurístico?