¿Qué es una transformación de características en el aprendizaje automático?

La transformación de características (FT) se refiere a la familia de algoritmos que crean nuevas características usando las características existentes. Es posible que estas nuevas características no tengan la misma interpretación que las características originales, pero pueden tener un poder más discriminatorio en un espacio diferente que el espacio original. Esto también se puede utilizar para la reducción de características. FT puede suceder de muchas maneras, mediante combinaciones simples / lineales de características originales o utilizando funciones no lineales. Algunas técnicas comunes para FT son:

  • Funciones de escala o normalización dentro de un rango, digamos entre 0 y 1.
  • Análisis de componentes principales y sus variantes.
  • Proyección aleatoria
  • Redes neuronales.
  • SVM también transforma características internamente.
  • Transformar características categóricas en numéricas.

Hablando brevemente, la transformación de características se refiere a alguna función inmediata aplicada a una colección de puntos de datos. Un ejemplo común es donde transforma los tipos de datos categóricos / nominales en codificación binaria o one-hot. Tenga en cuenta que conservamos la estructura original de los datos; acabamos de cambiar el formato a algo más conveniente para nosotros. Por ejemplo, queremos cambiar los valores “positivo” y “negativo” en “1” y “0”, respectivamente.

Esto a veces se confunde con “ingeniería de características” o “agregación de características” donde se emplea una transformación completa de una colección original de puntos de datos. Por ejemplo, agregar “ancho de propiedad” y “longitud de propiedad” para crear un nuevo campo llamado “área de propiedad”.

More Interesting

¿En qué dominios encuentra aplicación la tecnología de procesamiento de eventos complejos (CEP)?

¿Debería considerarse un experto en aprendizaje automático después de completar la clase de ML del profesor Andrew en Coursera?

Cómo implementar un nuevo clasificador desde cero utilizando el enfoque de aprendizaje automático

¿Cuál es una buena fuente para aprender la optimización convexa?

¿Qué tan bueno es el programa de maestría en visión por computadora de la Universidad Autónoma de Barcelona en términos de contenido, costo y futura carrera (directamente trabajo o doctorado)?

¿Cuál es la diferencia entre análisis de datos, análisis de datos, minería de datos, ciencia de datos, aprendizaje automático y Big Data?

¿Qué es ingenuo Bayes, clasificación de espacio vectorial y máquinas de vectores de soporte en la recuperación de información?

Al cambiar de plataforma, ¿cómo se debe planificar con anticipación para garantizar que el almacenamiento y el análisis de datos se mantengan rápidos y eficientes?

¿Por qué la disminución de la tasa de aprendizaje también aumenta la tasa de sobreajuste en una red neuronal?

¿Cuáles fueron los algoritmos utilizados para los chatbots antes de que surgiera el aprendizaje profundo?

¿Cuándo se ajusta bien un modelo de mezcla gaussiana?

¿Cuál es la medida cuantitativa sofisticada de la similitud de textos además de usar la similitud de coseno?

¿En qué se centran los principales competidores de Kaggle? ¿Qué les ayudó a hacerlo mejor que otros?

Sistemas de recomendación: ¿Cuál es la diferencia entre el filtrado colaborativo de elemento a elemento y el filtrado basado en contenido?

¿Cómo construiría un sitio web que utiliza el aprendizaje automático (qué marcos para frontend y backend, Python o R)?