GridSearchCV necesita una métrica para optimizar. Un vectorizador no tiene nada como una precisión, por lo que no tiene sentido ejecutar ningún tipo de optimización de hiperparámetro en su método de vectorización.
El problema principal es que es imposible saber si un cambio en su vectorizador conducirá a una mayor o menor precisión en su modelo resultante, a menos que mantenga el modelo constante.
Dicho esto, si desea mantener su modelo constante y optimizar su vectorizador desde ese punto de vista, puede crear fácilmente una función de cliente que incorpore kwargs que se pasarán al vectorizador y devolverá las métricas de precisión adecuadas.
- Cómo comenzar a leer trabajos de investigación sobre Machine Learning
- ¿Cuál es el mejor libro sobre Support Vector Machines?
- ¿Existe un equivalente de imagen (lenguaje de programación probabilístico del MIT para la percepción de la escena) para PNL?
- Además de tratar de reconstruir la entrada (como en Autoencoder), ¿qué otras tareas podrían resultar útiles para el aprendizaje no supervisado de redes profundas?
- Cómo interpretar la salida de una red neuronal
Alternativamente, puede crear una función que tome un vectorizador como un kwarg, luego generar varias muestras con anticipación y luego simplemente agregarlas al argumento de parámetros que está pasando a GridSearchCV