Cómo optimizar la clasificación de varias clases si ya conozco el número de ocurrencias de cada clase en el conjunto de datos de prueba

No se menciona qué métrica medir el resultado de esta optimización, pero supondré que es la precisión.

Puede formularlo como un gráfico bipartito donde los nodos pueden representar la clase de clasificación o la entrada del conjunto de prueba. Entre cada clase y cada entrada hay una probabilidad de que la entrada pertenezca a la clase de acuerdo con el modelo que entrenaste. Algunos modelos muestran la probabilidad mientras que otros no, por lo que los modelos disponibles son limitados. Puede inicializar cada nodo de clase como ‘conectado’ a todas sus entradas de prueba de mayor probabilidad, con el número de entradas que tiene, luego, si algunos nodos de entrada tienen varias clases adjuntas mientras que otros no tienen ninguno, es posible que deba volver a cablear utilizando su probabilidades de adyacencia, tal vez utilizando el algoritmo húngaro. Agregar probabilidades puede no tener mucho sentido, sería común transformarlas para obtener esencialmente el mismo resultado que multiplicar probabilidades, y luego alimentar este algoritmo.