¿Debería Facebook usar el aprendizaje automático para identificar a los usuarios con potencial de convertirse en un asesino en masa?

Busque el problema del desequilibrio de clase en la clasificación binaria. La tasa base de “asesinos en masa” entre la población de todos los usuarios de las redes sociales es un problema ridículamente pequeño. Cualquier clasificador que arroje positivos a cualquier velocidad que valga la pena generará muchos órdenes de magnitud más falsos positivos que verdaderos. Además, si realmente está tratando de predecir de antemano que alguien será un asesino en masa para tomar medidas contra ellos, identificarlos y detenerlos antes de que cometan el delito, por supuesto, significa que nunca se convertirán en un asesino en masa, por lo que es difícil vea cómo incluso evaluaría la precisión de su clasificador. La única forma de demostrar que estabas en lo correcto sería dejar que lo hagan.

Este es, por supuesto, un problema para la aplicación preventiva de la ley en general. Es difícil demostrar que detuvo un delito, pero al menos para las clases de delitos que tienen una tasa base alta, puede comparar las tasas previas y posteriores a la intervención para ver si hay una diferencia significativa más probable que se explique por su intervención que por casualidad. Cuando la tasa base es estadísticamente indistinguible de cero para empezar, no puede hacer eso.

Supongamos que se encuentra un algoritmo que tiene una tasa de precisión del 99.9% de predicción de asesinatos en masa, de alguna manera, de lo que la gente publica en Facebook (????).

Dados los 1.6 billones de usuarios activos mensuales de Facebook, eso significa que 1.6 millones de personas serán pronosticadas como posiblemente asesinas en masa. Tal vez 1 o 2 de esas personas realmente se convertirán en una.

Entonces, ¿qué vas a hacer ahora?

Tienes 1,6 millones de asesinos en masa “potenciales” que no han hecho nada malo. ¿Qué acción quieres tomar contra ellos? ¿Quieres contratar a 100.000 personas para investigarlos a todos? ¿Por qué los investigarían? ¿Qué harás con las 1,599,998 personas que sienten que su privacidad fue violada injustamente?

Esto sería un “perfil” bien intencionado sin evidencia de ningún delito.

More Interesting

¿Qué ofrecen los chips Loihi de Intel con 'autoaprendizaje', 'núcleos neuromórficos' y 'cómputo de aumento asíncrono'?

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?

¿El sobreajuste es un problema en el aprendizaje de refuerzo profundo?

Cómo configurar datos de entrenamiento para una red neuronal para generar valores de joystick basados ​​en una entrada de imagen

¿Cuál es el significado del espacio latente?

¿Qué enfoques utilizaron los participantes en Quora ML CodeSprint 2013?

¿Cómo puedo comenzar a usar métodos de "generalización apilada" en Python para las competencias de Kaggle?

Cómo entrenar un modelo de Keras con un gran conjunto de datos y luego ajustarlo con un conjunto de datos más pequeño de interés

¿Hay alguna API (y documentación) disponible para crear arquitecturas de red neuronal personalizadas usando Deeplearning4j?

¿Qué métodos de aprendizaje automático lo llevarán al top 10 de las competencias de kaggle?

Cómo aprender a crear un sistema óptico de reconocimiento de caracteres utilizando redes neuronales artificiales como mi mini proyecto

Cómo guardar los pesos de los datos de entrenamiento de las pruebas MNIST en Tensorflow para uso futuro

Durante la limpieza de datos cuando tiene un número decimal que representa el número de personas, ¿debe redondear hacia arriba o hacia abajo? Además, ¿qué sucede si el número total de todos los números redondeados no coincide con el número total de personas, es un error?

Entre JavaScript y la ciencia de datos, ¿qué debo hacer? Tengo que aprender a los dos desde cero.

¿Cuáles son algunos de los beneficios y desventajas de los modelos discriminativos y generativos?