¿Cuáles son las relaciones entre diversidad y precisión en los enfoques de conjunto? La tecnología cambia la vida futura

Puedes pensar en los conjuntos como un grupo de personas que tienen una reunión para tomar una decisión. Todos dan su propia opinión. Después de eso, las opiniones se ponderan o promedian para tomar la decisión final sobre el asunto en cuestión.

Veamos dos escenarios:

En el primer escenario, imagine que cada persona proviene de la misma ciudad, de la misma escuela, tiene las mismas calificaciones, tomó las mismas clases, tiene una experiencia de vida similar … En ese caso, las opiniones de esas personas estarían altamente correlacionadas si no fueran iguales. Como no hay diversidad, es fácil convencer a todos los demás de que tiene razón. Aquí el promedio no ayuda mucho.
Aquí presentamos cierta diversidad en nuestro comité, por ejemplo, al tener personas de diferentes campos, diferentes ciudades y / o con diferentes experiencias de vida, entonces la decisión resultante mejorará ya que se presentan múltiples percepciones y todos deben estar convencidos de que un punto de vista es lo que es correcto.

Entonces, ¿qué es la precisión y dónde aparece? Cuando hablamos de conjuntos, generalmente encontramos dos términos importantes: sesgo y varianza. Esos términos son en realidad algo que generalmente llamamos falta de precisión y falta de precisión , respectivamente. Los conjuntos están diseñados para abordar el problema de la precisión manteniendo la precisión igual.

En el primer escenario, tanto la precisión como la precisión permanecen igual, ya que si uno tiene razón, probablemente tomarán la decisión correcta. Pero si uno está equivocado, todos los demás probablemente estarán equivocados, por lo que la influencia de un factor tiene un alto impacto en la decisión, por lo que la precisión de todo el comité es similar a la precisión de un individuo.

En el segundo escenario, la precisión permanece igual pero la precisión aumenta. Sabemos eso porque si uno está equivocado, los votos de los demás pueden ser mayores que su voto. Como uno no influye mucho en la decisión final, podemos decir que nuestro comité aumentó su precisión. La precisión promedio se mantiene igual.

Para mostrar esto formalmente, se procedería definiendo [math] B \ in \ mathbb {N} [/ math] diferentes clasificadores [math] f_1 (x), f_2 (x), \ dots f_B (x), [/ math ] con cada clasificador que tiene su propio sesgo y varianza. Entonces uno podría calcular el sesgo y la varianza con respecto a las salidas verdaderas [matemáticas] y [/ matemáticas], y proceder a mostrar lo que he dicho anteriormente: que el sesgo promedio (precisión) permanece igual, pero la varianza disminuye por el factor de [math] B [/ math] en caso de que los clasificadores no estén correlacionados (diversos). En consecuencia, la precisión aumenta en un factor de [matemáticas] B. [/ matemáticas]

Una nota al margen. En el segundo escenario, si miramos a un comité de personas similares con una fuente de diversidad proveniente, por ejemplo, de diferentes cursos o diferentes experiencias de vida fuera del campo, y si simplemente promediamos sus opiniones, obtenemos algo que se llama Bagging.

Si, por otro lado, tenemos personas provenientes de diferentes campos, es mejor si las opiniones están ponderadas. Si el asunto en cuestión es sobre la ley, la opinión de un abogado debería tener un impacto mayor que la opinión de un ingeniero. Este procedimiento es lo que llamamos impulso.