¿TF-IDF está categorizado como una selección de características o una extracción de características?

La extracción de características y la selección de características no son incompatibles.

La extracción de características es como buscar oro. En la prospección, sumerges tu sartén en el agua y recoges un montón de lodo. La esperanza es que después de cambiarlo un poco, encuentres una pepita de oro. Con la extracción de características, la pepita de oro es una característica que “explica” mucho sobre los patrones en los datos. Es posible que otras características no expliquen nada acerca de los datos, y este es el lodo y las rocas que se arrojan al río.

La selección de funciones, por otro lado, es como tratar de averiguar si alguna de tus pepitas de oro es realmente oro de tontos. A veces, la extracción de características producirá una característica que parece explicar mucho sobre los datos, pero en realidad no lo hace. Depende de cada individuo seleccionar qué características cree que capturan la mayor cantidad de información sobre los datos.

Para resumir, la extracción de características es el proceso de encontrar las características, la selección de características es el proceso de averiguar qué características son las más apropiadas para su problema particular.

La selección de características solo existe cuando hay un parámetro innecesario en la extracción de características, puede eliminar ese parámetro y tener algún impacto en la precisión, por ejemplo, en la clasificación, por lo que en mi opinión todavía puede ejecutar el proceso de extracción de características sin selección de características siempre que su resultado sea la característica la extracción fue lo suficientemente buena y podría dar características reales en cada uno de los datos de entrenamiento