¿Cuál es el futuro del aprendizaje profundo para la segmentación de imágenes médicas?

Permítanme contribuir con un ladrillo más para algunos expertos en dominios para construir una visión más integral hacia el futuro.

No soy un experto en aplicaciones médicas, permítanme abordar esta pregunta desde el punto de vista estadístico / aprendizaje automático.

En mi opinión, uno de los problemas más críticos que deben manejarse son los “factores de confusión”. Hay varias características que diferencian la segmentación de imágenes médicas del reconocimiento de dígitos con MNIST, o el reconocimiento de imágenes con ImageNet, o en general la mayoría de otros problemas de aprendizaje automático:

  1. los datos se recopilan en el mundo real, de un par de fuentes de datos (es decir, hospitales o más). Estas fuentes de datos pueden usar dispositivos fabricados de manera diferente, por lo tanto, las cualidades de estas imágenes de diferentes dispositivos serán diferentes y estas diferencias sirven como factores de confusión sutiles.
  2. La aplicación médica generalmente necesita responder la pregunta sobre el mecanismo subyacente, en lugar de solo predecir una respuesta para la etiqueta. Por lo tanto, la corrección de los factores de confusión es más crítica que otras aplicaciones de aprendizaje automático.

He hablado con el organizador del desafío BRATS, y él está de acuerdo con este punto. También he hablado con el equipo líder del desafío BRATS (DeepMedic) para verificar mis entendimientos y él está de acuerdo. Sin embargo, dijo que cree que el factor de confusión es un problema crítico de la segmentación de fMRI, pero que no es tan importante para la segmentación por tomografía computarizada. (Como dije, no soy un experto en estas aplicaciones, por lo que no estoy seguro).

La razón por la que estoy muy interesado en estos problemas es que he desarrollado un método de aprendizaje profundo para corregir los factores de confusión, llamado aprendizaje selectivo aditivo, y estoy ansioso por aplicarlo en el área médica. Sin embargo, no tengo tiempo suficiente para aprender el conocimiento del dominio. Si esta idea le parece interesante, tómala. O bien, contácteme para que podamos impulsar esto más juntos. 🙂

Como segundo punto, también he hablado con Ruslan sobre estos problemas, y él piensa que se trata de recopilar más datos. Bueno, esto no tiene sentido en mi opinión, ya que la razón por la que trabajamos en modelos más potentes es que no tenemos suficientes datos. Si tenemos un poder infinito para recopilar datos, el aprendizaje automático ya no es un problema.