¿Qué son las características y clases en ingeniería de características?

Las características también se denominan variables independientes o predictores. Esencialmente, estos son los datos que utiliza para predecir el objetivo (variable dependiente).

Clases generalmente es un término que se refiere al objetivo. Un objetivo que asume solo 2 valores (típicamente 0 y 1, tiene enfermedad / no tiene enfermedad, hizo clic en el anuncio / no hizo clic en el anuncio) tiene dos clases. Este es su típico problema de clasificación binaria. Un problema de clasificación de varias clases involucra un objetivo que puede tomar múltiples valores categóricos (es decir, predecir si un tweet habló sobre comida, clima, deportes o política).

Mientras que en un problema de múltiples clases, su objetivo asume uno y solo un valor a la vez (un tweet es deporte o política o comida, …) en un problema de múltiples etiquetas, la misma observación podría tomar múltiples clases.

More Interesting

¿Por qué los modelos acústicos DNN / HMM son mejores que GMM / HMM?

¿Cuál es la guía genérica y la mejor guía para aprender TensorFlow desde la plataforma Python? ¿O hay otras bibliotecas mejores que TensorFlow?

¿Cuáles son algunos modelos matemáticos o técnicas estadísticas que son útiles para los científicos que trabajan con grandes datos?

¿Qué significa esto exactamente: 'Hay dos estrategias principales para el reconocimiento facial: comparación de características y coincidencia de plantillas'?

¿Qué has aprendido haciendo investigación?

¿En qué casos notamos un problema de gradiente que explota o desaparece y por qué?

¿Cuál es la relación entre el análisis de sentimientos, el procesamiento del lenguaje natural y el aprendizaje automático?

¿Debo aplicar PCA antes o después de la selección de funciones?

¿Cómo se aplica el aprendizaje profundo en el reconocimiento de imágenes?

¿Cómo funcionan los motores de recomendación?

¿Qué estrategia usaste para resolver el juego 2048? ¿Por qué?

¿Cómo funcionan las redes interbancarias?

¿Cómo se hace el cambio de C ++ a Python? Me siento más cómodo con C ++ y lo he estado usando para hacer la mayor parte de mi programación; Me parece que lleva mucho tiempo y Python hace las cosas rápidamente. ¿Cuál es la mejor manera de hacer el cambio?

¿Cómo afectaría la homo / heteroscedasticidad al análisis de regresión?

¿Cuál es la solución del ejercicio 1.3 del libro Machine Learning de Tom M. Mitchell?