¿Alguien ha trabajado en un algoritmo para predecir la corrupción de los funcionarios del gobierno público utilizando la minería de datos y el análisis predictivo?

Soy consciente de un par de intentos de hacer este tipo de búsqueda utilizando la teoría de gráficos y las redes sociales. El artista Mark Lombardi usó técnicas de teoría de grafos para encontrar el fraude para un conjunto específico de entradas (no arbitrario). El análisis de redes sociales es una técnica que utiliza modelos de enfermedades para encontrar fraudes o personas en riesgo de asesinato. Ha habido cierta experiencia ejecutando esto a la inversa para evitar asesinatos con Gary Slutkin.

Esto probablemente sea similar a encontrar el topo entre un conjunto de espías. La mayoría de la gente se enfoca en que el espía haga algo inusual, pero un buen espionaje elimina estos avisos y lo vemos con el lavado de dinero y la evasión de impuestos. Hay un conjunto obvio de estructuras que las personas crean y la policía toma medidas de aplicación contra ellas. La predicción y la prohibición tienen que depender de que alguien haga algo habitual de una manera inusual o en un momento inusual.

Mark Lombardi
Revelado: la red capitalista que dirige el mundo
Análisis de redes sociales
En Chicago, tu red social podría matarte
Los interruptores
Índice de percepción de corrupción mundial

Si una computadora toma el control total del control del tráfico aéreo, ¿cómo será el algoritmo? ¿Cómo manejará los aterrizajes de emergencia y cómo manejará una pista paralela?

¿Qué tan buena es la calidad de los problemas de HackerRank en comparación con los problemas de Topcoder, Codeforces, Codechef?

¿Cómo funciona este algoritmo para encontrar los bordes del corte mínimo de un gráfico?

¿Debo aprender el concepto profundo del aprendizaje automático como el curso de Andrew Ng o es suficiente para saber qué algoritmo se utiliza cuando?

¿Existe alguna desventaja en el uso de programas de seguridad gratuitos?

¿Deberíamos permitir patentes sobre algoritmos?

Me sorprende que nadie haya mencionado la ley de Benford. La verdad es que cada vez que alguien comete fraude, necesita construir una cadena de evidencia falsa para alejar a los investigadores, por ejemplo, completar informes de gastos falsos, reclamar servicios prestados que no se realizaron, etc. Resulta que cuando las personas inventan números falsos que piensan que son “aleatorios”, no lo son tanto. Esto significa que a menudo puede identificar números reales que de hecho son aleatorios o cercanos a los falsos inventados por funcionarios corruptos que intentan ocultar sus huellas. Uno de mis vecinos aquí en CalTech, Jean Ensminger, ha realizado un gran trabajo estadístico para identificar y rastrear los registros falsos de esta manera en la corrupción asociada con la ayuda a los países pobres de África y otros lugares. Por ejemplo: el fin de semana audité el mundo

Este tipo de métodos pueden indicarle la dirección de la corrupción en otros tipos de sistemas de contabilidad, etc. Entiendo que el IRS también utiliza métodos estadísticos como estos para marcar declaraciones de impuestos fraudulentas.

Ryan Batterman

Este no es un algoritmo para predecir la corrupción, sino para analizar los “datos pasados (?)”

Un reciente proyecto brasileño llamado “Serenata de Amor”, está trabajando con colaboradores internacionales, están haciendo un gran progreso al analizar no solo la corrupción, sino también el mal uso del dinero público (como tener 12 almuerzos en un día o comprar cerveza con dinero público) )

Usted puede leer más aquí:

Operação Serenata de Amor

Y aquí

Brigada de ciencia de datos

Y aquí

Operação Serenata de Amor

Están tratando de usar el inglés como idioma predeterminado, de modo que más personas puedan ayudarlo / usarlo en su propio país

Gracias y buena “caza”

Xavier Amatriain

No sería difícil diseñar un algoritmo de este tipo, ya que estoy bastante seguro de que podría obtener una precisión bastante buena con algunas características. El problema es: ¿existe un conjunto de datos existente que pueda ayudar a capacitar a ese modelo? No sé nada de eso y creo que sería muy difícil conseguirlo con una fiabilidad razonable. Quizás un buen lugar para comenzar sería buscar “funcionarios condenados”, pero creo que aún sería difícil de encontrar en muchos países, particularmente en los que están más corruptos.

Xavier Amatriain

El Grupo Wynard (una empresa de tecnología con sede en Nueva Zelanda) ha trabajado (o está trabajando) para lograrlo. Mira aquí. Además, consulte su sección de Tecnología avanzada de análisis de delitos.

Xavier Amatriain

More Interesting

¿Cuáles son las características de los árboles de coníferas y cuáles son algunas plantas / árboles con aspectos similares?

Cómo resolver el problema 144C en Codeforces

¿Qué hago después cuando logré un programa de aprendizaje automático (supervisado) con un 97% de precisión y buen ajuste?

¿Cuál es el algoritmo de esta pregunta de Hacker-Rank?

¿Es posible "escribir un programa o algoritmo" para encontrar la complejidad de tiempo de cualquier programa dado como entrada?

¿Cuáles son los mejores algoritmos híbridos para el filtrado colaborativo y basado en contenido?

¿Es posible implementar algoritmos de aprendizaje automático en lenguaje ensamblador?

¿Cómo se puede incorporar un algoritmo adaptativo en un sistema operativo?

¿Cuáles son las ventajas de un árbol de búsqueda binaria sobre un árbol rojo-negro?

Si uso un algoritmo de cifrado no tan bueno que inventé dentro de uno real, ¿cuánto más seguros están juntos?