¿Por qué el aprendizaje automático a menudo perpetúa el sesgo?

Hay 2 formas de hacer que el software produzca comportamiento; 1) enfoques tradicionales basados ​​en reglas y 2) aprendizaje automático. El enfoque tradicional se basa en nuestro cableado de directivas en el software con salidas que se conocen por adelantado (por ejemplo, cuando el usuario inicia sesión, llévelas a esta página). Este tipo de software es fácil de probar, ya que podemos especificar fácilmente las desviaciones de los resultados deseados (el usuario fue a la página incorrecta = mala). Si bien la construcción de software rígido cuyo comportamiento se basa completamente en reglas tiene sus ventajas, se está convirtiendo rápidamente en una forma ingenua de construir productos de software. Esto se debe a que el software rígido es incapaz de adaptarse a su entorno, lo que obliga a los equipos de productos a lanzar modificaciones con frecuencias increíblemente altas (uf … ¿otra actualización ???). Incluso con actualizaciones rápidas, las características del producto basadas en reglas siempre sufrirán una gran distancia entre las características y las necesidades (el usuario realmente no quiere ordenar una lista (basada en reglas) sino que quiere que se ordene por ellos (aprendizaje automático) )

Entonces, ¿qué tiene que ver todo esto con el sesgo? Como los productos de aprendizaje automático no obtienen su comportamiento de las reglas escritas por humanos, deben obtenerlos de los modelos; modelos que han aprendido a producir su comportamiento al encontrar patrones dentro de los datos. Si proporciona los datos de un algoritmo de aprendizaje apropiado, creará un modelo de lo que ve. Entonces, lo que mostramos en el aprendizaje automático es lo que obtenemos como resultado. No hay nada en el aprendizaje automático o en las estadísticas que aborde directamente el tema del sesgo humano (del sabor del prejuicio) ya que nuestras pruebas y validación se basan en medidas internas si el éxito (qué tan bien representamos lo que está en los datos). No existe una brújula moral o un estándar guía por el cual los profesionales se responsabilicen de algo más allá del poder predictivo y explicativo de los modelos. Entonces, si mostramos datos prejuiciosos de aprendizaje automático, generará de manera confiable un comportamiento prejuicioso, pasando todas las pruebas estadísticas de análisis válido.

A medida que ingresamos en esta nueva era de desarrollo de productos, entrenando máquinas en lugar de programarlas, necesitaremos introducir un nuevo tipo de prueba. Los datos de muestreo no solo deben ser “representativos” de la población si la población tiene un prejuicio que queremos eliminar. Necesitamos hacer un esfuerzo activo para asegurarnos de mostrarle al aprendizaje automático la innovación que queremos ver. Solo entonces nuestros productos tendrán un estándar más alto, en línea con una visión más clara de lo que significa predecir bien.

Nota: estoy escribiendo esto bajo el supuesto de que se refiere al sesgo en las predicciones (por ejemplo, una persona negra identificada como criminal por un modelo predictivo porque muchos delincuentes en los datos de entrenamiento eran negros), y no el sesgo de la varianza de sesgo compensación:

Respuesta: … porque un modelo de aprendizaje automático es tan bueno como sus datos de entrenamiento. Si existe algún tipo de sesgo en los datos, independientemente del modelo que construya, es probable que el modelo tenga ese sesgo. No conozco ningún método de aprendizaje automático que pueda manejar esto automáticamente, pero leí algunos trabajos recientes sobre el apoyo a la equidad en la construcción de modelos.

Trabajo en procesamiento de lenguaje natural, y este es el informe del que hablo:

Creación de mejores herramientas de código abierto para apoyar la equidad en la puntuación automatizada: http://www.ethicsinnlp.org/works

También lanzaron su herramienta en línea.

Cuando se usa Machine Learning, existe un sesgo inherente ya que cada algoritmo usa un posible conjunto de modelos. Solo se puede aprender un modelo en ese conjunto.

Algunos algoritmos tienen conjuntos de modelos mucho más complejos que otros, pero sigue siendo un conjunto muy restringido.

More Interesting

Cómo implementar un algoritmo de fijación de precios dinámico en Hadoop

¿Cómo afecta su área de investigación de maestría (CS) a su carrera? ¿Y cuáles son las áreas más lucrativas?

¿Qué es mejor para la dirección de investigación de visión por computadora, redes neuronales o modelos gráficos probabilísticos?

¿Cómo genera el modelo generativo muestras de ruidos?

¿Cuál es la diferencia entre CNN y RNN?

¿Qué significa el aprendizaje automático?

¿Qué es el 'aprendizaje automático de crowdsourcing'?

¿Cuál debería ser el plan adecuado para aprender el aprendizaje automático desde cero para un estudiante del tercer semestre?

¿Cómo funcionan las representaciones distribuidas de escasez fija defendidas e implementadas por Numenta?

¿Puedo tomar el curso de aprendizaje automático de Andrew Ng siendo un estudiante de secundaria con algo de experiencia en programación y sin conocimientos avanzados de matemáticas?

¿Quiénes son los mejores expertos en Machine Learning en el Área de la Bahía?

¿Puedo entrenar una red neuronal convolucional (CNN) con imágenes de fondo diferente en blanco y negro?

¿Qué técnicas de aprendizaje automático debo usar para estratificar y spofing?

¿Cuál es la diferencia entre máquinas de vectores de soporte y aprendizaje profundo?

Mi campo de interés para el doctorado es la visión por computadora, el aprendizaje automático y el procesamiento de imágenes. ¿Qué recursos hay para principiantes con respecto a estos temas? Yo sé Java; ¿Debo aprender otros idiomas primero o puedo comenzar los cursos de inmediato?