¡Qué bueno escucharlo hacer esta pregunta!
Durante el verano del año pasado decidí trabajar en un proyecto que combinara mis intereses de Machine Learning e Historia Militar.
Mi proyecto fue Aplicar el aprendizaje automático para detectar áreas con explosivos no detonados , bueno, más o menos.
- ¿Por qué la mayoría de las competencias recientes se centran en el aprendizaje profundo / redes neuronales? ¿No crea esto un desequilibrio en los tipos de problemas que se ofrecen?
- Cómo crear un conjunto de datos a partir de imágenes
- Cómo obtener líneas de regresión y encontrar coeficientes de correlación a partir de datos
- Cómo extender una red neuronal profunda que se capacitó en la inclusión de palabras en inglés como entrada en una tarea de clasificación a multilingüe
- ¿Cuál es la forma correcta de verificar si mi fórmula de gradiente es correcta o no?
Durante la Segunda Guerra Mundial, los países arrojaron cargas de bombas entre sí. Desafortunadamente hasta el día de hoy se encuentran bombas constantemente en países como el Reino Unido. Afortunadamente durante la guerra, la RAF hizo grandes esfuerzos para recopilar imágenes de las posiciones bombardeadas para evaluar sus daños y también para recopilar información sobre la región. Entonces, aquí es donde entra el aprendizaje automático. Si podemos usar la fotografía aérea para identificar las áreas con la mayoría de las bombas, podemos ahorrar tiempo al no forzar o esperar que explote una bomba.
Remoción de una bomba encontrada en Alemania
Ejemplo de fotografía aérea RAF que utilicé
Intentar resolver los filtros de imagen para el Algoritmo de Hough fue un desafío absoluto para reconocer los pequeños cráteres. ¡Así que aprendí bastante sobre los filtros gaussianos haciendo el procesamiento de datos! ¡Si alguien puede vincularme con algunas lecturas sobre los detalles de diferentes filtros de imagen, sería increíble!
¡Tantos cráteres de diferentes tamaños!
Usando los filtros, apliqué el algoritmo de detección de círculo para extraer imágenes como las anteriores para entrenar mi algoritmo. ¡Básicamente etiqueté a mano todos los datos e hice mi propio conjunto de datos de cráteres de bombas! Me llevó más de 3 días de trabajo agotador de clasificación. Me enseñó una gran lección sobre los desafíos que los científicos de datos / ingenieros de datos deben enfrentar.
Entonces, después del agotador trabajo, utilicé mis datos etiquetados a mano para entrenar el algoritmo XGBoost. Entonces, para extraer las características de las imágenes, convertí la imagen en una matriz 2D y la aplané a 1D (sé que esta es una muy mala manera, pero ese fue el único enfoque ingenuo que se me ocurrió). Utilicé la validación cruzada para verificar mis resultados:
Diagramas de fantasía: sé que lo intento
¡Con el algoritmo entrenado hice una distribución de probabilidad en un mapa de calor!
Lamentablemente, el proyecto no ganó un boleto a ISEF para mi competencia nacional de ciencias (pero estaba a un paso de un premio nacional). La razón obvia es que necesitaba más comparaciones de rendimiento y probablemente mejores métodos de procesamiento para obtener características de la imagen.
Tal vez el proceso se pueda aplicar a fotografías aéreas de la Primera Guerra Mundial e incluso a otras guerras; me alegra saber si alguien trabaja en algo similar 🙂 ¡Puedes hacer cosas increíbles cuando combinas tu pasión con el aprendizaje automático!