¿Por qué el aprendizaje automático a menudo perpetúa el sesgo? La tecnología cambia la vida futura

¿Por qué el aprendizaje automático a menudo perpetúa el sesgo?

Hay 2 formas de hacer que el software produzca comportamiento; 1) enfoques tradicionales basados en reglas y 2) aprendizaje automático. El enfoque tradicional se basa en nuestro cableado de directivas en el software con salidas que se conocen por adelantado (por ejemplo, cuando el usuario inicia sesión, llévelas a esta página). Este tipo de software es fácil de probar, ya que podemos especificar fácilmente las desviaciones de los resultados deseados (el usuario fue a la página incorrecta = mala). Si bien la construcción de software rígido cuyo comportamiento se basa completamente en reglas tiene sus ventajas, se está convirtiendo rápidamente en una forma ingenua de construir productos de software. Esto se debe a que el software rígido es incapaz de adaptarse a su entorno, lo que obliga a los equipos de productos a lanzar modificaciones con frecuencias increíblemente altas (uf … ¿otra actualización ???). Incluso con actualizaciones rápidas, las características del producto basadas en reglas siempre sufrirán una gran distancia entre las características y las necesidades (el usuario realmente no quiere ordenar una lista (basada en reglas) sino que quiere que se ordene por ellos (aprendizaje automático) )

Entonces, ¿qué tiene que ver todo esto con el sesgo? Como los productos de aprendizaje automático no obtienen su comportamiento de las reglas escritas por humanos, deben obtenerlos de los modelos; modelos que han aprendido a producir su comportamiento al encontrar patrones dentro de los datos. Si proporciona los datos de un algoritmo de aprendizaje apropiado, creará un modelo de lo que ve. Entonces, lo que mostramos en el aprendizaje automático es lo que obtenemos como resultado. No hay nada en el aprendizaje automático o en las estadísticas que aborde directamente el tema del sesgo humano (del sabor del prejuicio) ya que nuestras pruebas y validación se basan en medidas internas si el éxito (qué tan bien representamos lo que está en los datos). No existe una brújula moral o un estándar guía por el cual los profesionales se responsabilicen de algo más allá del poder predictivo y explicativo de los modelos. Entonces, si mostramos datos prejuiciosos de aprendizaje automático, generará de manera confiable un comportamiento prejuicioso, pasando todas las pruebas estadísticas de análisis válido.

A medida que ingresamos en esta nueva era de desarrollo de productos, entrenando máquinas en lugar de programarlas, necesitaremos introducir un nuevo tipo de prueba. Los datos de muestreo no solo deben ser “representativos” de la población si la población tiene un prejuicio que queremos eliminar. Necesitamos hacer un esfuerzo activo para asegurarnos de mostrarle al aprendizaje automático la innovación que queremos ver. Solo entonces nuestros productos tendrán un estándar más alto, en línea con una visión más clara de lo que significa predecir bien.

Aprendizaje automático