¿Cuáles son las relaciones entre diversidad y precisión en los enfoques de conjunto?

Puedes pensar en los conjuntos como un grupo de personas que tienen una reunión para tomar una decisión. Todos dan su propia opinión. Después de eso, las opiniones se ponderan o promedian para tomar la decisión final sobre el asunto en cuestión.

Veamos dos escenarios:

  1. En el primer escenario, imagine que cada persona proviene de la misma ciudad, de la misma escuela, tiene las mismas calificaciones, tomó las mismas clases, tiene una experiencia de vida similar … En ese caso, las opiniones de esas personas estarían altamente correlacionadas si no fueran iguales. Como no hay diversidad, es fácil convencer a todos los demás de que tiene razón. Aquí el promedio no ayuda mucho.
  2. Aquí presentamos cierta diversidad en nuestro comité, por ejemplo, al tener personas de diferentes campos, diferentes ciudades y / o con diferentes experiencias de vida, entonces la decisión resultante mejorará ya que se presentan múltiples percepciones y todos deben estar convencidos de que un punto de vista es lo que es correcto.

Entonces, ¿qué es la precisión y dónde aparece? Cuando hablamos de conjuntos, generalmente encontramos dos términos importantes: sesgo y varianza. Esos términos son en realidad algo que generalmente llamamos falta de precisión y falta de precisión , respectivamente. Los conjuntos están diseñados para abordar el problema de la precisión manteniendo la precisión igual.

En el primer escenario, tanto la precisión como la precisión permanecen igual, ya que si uno tiene razón, probablemente tomarán la decisión correcta. Pero si uno está equivocado, todos los demás probablemente estarán equivocados, por lo que la influencia de un factor tiene un alto impacto en la decisión, por lo que la precisión de todo el comité es similar a la precisión de un individuo.

En el segundo escenario, la precisión permanece igual pero la precisión aumenta. Sabemos eso porque si uno está equivocado, los votos de los demás pueden ser mayores que su voto. Como uno no influye mucho en la decisión final, podemos decir que nuestro comité aumentó su precisión. La precisión promedio se mantiene igual.

Para mostrar esto formalmente, se procedería definiendo [math] B \ in \ mathbb {N} [/ math] diferentes clasificadores [math] f_1 (x), f_2 (x), \ dots f_B (x), [/ math ] con cada clasificador que tiene su propio sesgo y varianza. Entonces uno podría calcular el sesgo y la varianza con respecto a las salidas verdaderas [matemáticas] y [/ matemáticas], y proceder a mostrar lo que he dicho anteriormente: que el sesgo promedio (precisión) permanece igual, pero la varianza disminuye por el factor de [math] B [/ math] en caso de que los clasificadores no estén correlacionados (diversos). En consecuencia, la precisión aumenta en un factor de [matemáticas] B. [/ matemáticas]


Una nota al margen. En el segundo escenario, si miramos a un comité de personas similares con una fuente de diversidad proveniente, por ejemplo, de diferentes cursos o diferentes experiencias de vida fuera del campo, y si simplemente promediamos sus opiniones, obtenemos algo que se llama Bagging.

Si, por otro lado, tenemos personas provenientes de diferentes campos, es mejor si las opiniones están ponderadas. Si el asunto en cuestión es sobre la ley, la opinión de un abogado debería tener un impacto mayor que la opinión de un ingeniero. Este procedimiento es lo que llamamos impulso.

More Interesting

Tengo un conjunto de datos (audios y transcripciones), necesito saber cómo entrenaré estos datos para crear un modelo acústico que se utilizará para un reconocimiento de voz.

Cómo implementar el aprendizaje automático en una aplicación de Android

¿Cuáles son los parámetros del procesamiento del lenguaje natural?

¿Cuáles son los mejores cursos introductorios para el aprendizaje automático disponibles en Internet para principiantes?

¿Se puede usar un C ++ para el aprendizaje automático? Si es así, ¿qué tan bueno es en comparación con Python y R?

¿Es una buena idea dejar el aprendizaje automático después de 2 años y estudiar desarrollo web, si me di cuenta de que no soy tan inteligente para todas esas matemáticas de ML?

Redes neuronales convolucionales: ¿Cuáles son algunos posibles proyectos de cursos de aprendizaje automático de nivel de posgrado que utilizan CNN? Específicamente en el límite de PNL y CV.

¿Cuál es la motivación de Google para el código abierto del modelo de TensorFlow para problemas ML / NLP como el resumen automático de texto?

¿Cuál es el objetivo de la detección de fraude con tarjeta de crédito?

¿Cuál es una explicación simple de un espacio de características multidimensionales?

¿Cuáles son algunos ejemplos de aprendizaje automático en operaciones de computación en la nube?

¿Qué pasos son necesarios para construir un sistema de aprendizaje profundo para el análisis de sentimientos, tomando como datos de entrada de las redes sociales?

¿Cuáles son las industrias que probablemente se verán afectadas por el aprendizaje profundo?

¿Cuál es la mejor manera de hacer un análisis de sentimientos de los datos de Facebook en Java?

¿Cuáles son las aplicaciones de aprendizaje profundo que consideras sin explotar?