¿Por qué podría ser malo realizar el Análisis de componentes principales en un conjunto de datos antes de la clasificación?

No creo que sea malo en todos los casos, pero creo que la razón por la que a menudo perjudica la clasificación es porque elimina la variabilidad sin el conocimiento de las variables que son más útiles en la clasificación.

PCA encuentra una representación dimensional más baja de los datos que minimiza el error de reconstrucción al cuadrado. Si tiene características irrelevantes (a menudo el caso en la clasificación de texto), PCA cuenta los errores en aquellos con igual importancia que los errores en palabras que son importantes para su clasificación. Tomando un ejemplo como el análisis de sentimientos, la función objetivo de PCA pondera los errores en palabras como “julio” y “béisbol” tanto como “bueno”, “malo” y “excelente”. Dado que su clasificador se ejecuta en datos que tienen mucha de la variación útil eliminada, no funciona tan bien.

Dicho esto, creo que ayuda en algunos casos. No ha ayudado en nada de lo que he hecho, pero creo que es una práctica estándar cuando se hace algo como el aprendizaje profundo para el reconocimiento de imágenes. En ese caso, elimina la redundancia en la representación de entrada, y el clasificador no es lineal y tiene la capacidad de usar la entrada comprimida con éxito.

Related Content

¿Está Deepmind de Google muy cerca de desarrollar inteligencia artificial a nivel humano?

¿Las redes neuronales recurrentes (RNN) se consideran un método supervisado en el aprendizaje automático?

¿Debo obtener un doctorado en CV / robótica / IA de CMU, Stanford o U Wash?

¿Cuáles son las dificultades comunes para los nuevos desarrolladores en aprendizaje automático?

¿Qué es el procesamiento del lenguaje natural en inteligencia artificial?

¿Google Translate realiza la adaptación del dominio sobre la marcha?

¿Hay algún buen punto de partida de código abierto para escribir una IA para un RTS?

More Interesting

¿Cómo mantiene un equilibrio un robot humanoide bípedo cuando camina?

Con el surgimiento de autos sin conductor en un futuro previsible, ¿convertirse en un conductor de Uber / Lyft es una buena opción de carrera?

¿Cuáles son las posibles aplicaciones de la IA (Inteligencia artificial) en Arquitectura y Construcción?

¿Se puede entrenar una red neuronal para detectar buenas condiciones comerciales?

¿Cómo es hacer investigación en planificación de movimiento?

¿La tecnología o la IA eventualmente conducirán a la utopía?

¿Qué hay detrás de un agente virtual en casa?

¿Cómo funciona la inteligencia de enjambre?

¿Cuáles son algunos métodos para realizar la selección de funciones en el aprendizaje automático?

¿Prefieres estudiar Inteligencia Artificial en KU Leuven o en la Universidad de Amsterdam?

¿Cuál es la diferencia entre una red bayesiana y una red neuronal artificial?

¿Cómo afectará la IA el aprendizaje de idiomas y la traducción en los próximos cinco años?

¿Cuáles son algunos hechos desconocidos sobre Cortana?

Quiero ser experto en IA, ¿por dónde debería comenzar? Tengo veinte y tantos años viviendo en Europa.

¿Qué tan lejos estamos de crear una conciencia artificial?

Web Analytics