¿Alguien ha trabajado en un algoritmo para predecir la corrupción de los funcionarios del gobierno público utilizando la minería de datos y el análisis predictivo?

Soy consciente de un par de intentos de hacer este tipo de búsqueda utilizando la teoría de gráficos y las redes sociales. El artista Mark Lombardi usó técnicas de teoría de grafos para encontrar el fraude para un conjunto específico de entradas (no arbitrario). El análisis de redes sociales es una técnica que utiliza modelos de enfermedades para encontrar fraudes o personas en riesgo de asesinato. Ha habido cierta experiencia ejecutando esto a la inversa para evitar asesinatos con Gary Slutkin.

Esto probablemente sea similar a encontrar el topo entre un conjunto de espías. La mayoría de la gente se enfoca en que el espía haga algo inusual, pero un buen espionaje elimina estos avisos y lo vemos con el lavado de dinero y la evasión de impuestos. Hay un conjunto obvio de estructuras que las personas crean y la policía toma medidas de aplicación contra ellas. La predicción y la prohibición tienen que depender de que alguien haga algo habitual de una manera inusual o en un momento inusual.

Mark Lombardi
Revelado: la red capitalista que dirige el mundo
Análisis de redes sociales
En Chicago, tu red social podría matarte
Los interruptores
Índice de percepción de corrupción mundial

Me sorprende que nadie haya mencionado la ley de Benford. La verdad es que cada vez que alguien comete fraude, necesita construir una cadena de evidencia falsa para alejar a los investigadores, por ejemplo, completar informes de gastos falsos, reclamar servicios prestados que no se realizaron, etc. Resulta que cuando las personas inventan números falsos que piensan que son “aleatorios”, no lo son tanto. Esto significa que a menudo puede identificar números reales que de hecho son aleatorios o cercanos a los falsos inventados por funcionarios corruptos que intentan ocultar sus huellas. Uno de mis vecinos aquí en CalTech, Jean Ensminger, ha realizado un gran trabajo estadístico para identificar y rastrear los registros falsos de esta manera en la corrupción asociada con la ayuda a los países pobres de África y otros lugares. Por ejemplo: el fin de semana audité el mundo

Este tipo de métodos pueden indicarle la dirección de la corrupción en otros tipos de sistemas de contabilidad, etc. Entiendo que el IRS también utiliza métodos estadísticos como estos para marcar declaraciones de impuestos fraudulentas.

Este no es un algoritmo para predecir la corrupción, sino para analizar los “datos pasados ​​(?)”

Un reciente proyecto brasileño llamado “Serenata de Amor”, está trabajando con colaboradores internacionales, están haciendo un gran progreso al analizar no solo la corrupción, sino también el mal uso del dinero público (como tener 12 almuerzos en un día o comprar cerveza con dinero público) )

Usted puede leer más aquí:

Operação Serenata de Amor

Y aquí

Brigada de ciencia de datos

Y aquí

Operação Serenata de Amor

Están tratando de usar el inglés como idioma predeterminado, de modo que más personas puedan ayudarlo / usarlo en su propio país

Gracias y buena “caza”

No sería difícil diseñar un algoritmo de este tipo, ya que estoy bastante seguro de que podría obtener una precisión bastante buena con algunas características. El problema es: ¿existe un conjunto de datos existente que pueda ayudar a capacitar a ese modelo? No sé nada de eso y creo que sería muy difícil conseguirlo con una fiabilidad razonable. Quizás un buen lugar para comenzar sería buscar “funcionarios condenados”, pero creo que aún sería difícil de encontrar en muchos países, particularmente en los que están más corruptos.

El Grupo Wynard (una empresa de tecnología con sede en Nueva Zelanda) ha trabajado (o está trabajando) para lograrlo. Mira aquí. Además, consulte su sección de Tecnología avanzada de análisis de delitos.