Aprendizaje automático: ¿cómo se puede saber cuándo combinar diferentes características sería útil?

Existe una gran cantidad de literatura que trata el tema de esta pregunta: selección de características.
Como suele ser el caso en ML, su enfoque se basa más en los datos que está tratando en lugar del método, varios de los cuales están disponibles.
Para comenzar, los puntos básicos a tener en cuenta son:
1. Si las características están altamente correlacionadas, entonces combinarlas no sería muy útil.
2. Puede usar Información mutua, Entropía para medir la relevancia de incluir una nueva característica.
3. Por supuesto, uno podría seguir combinando características independientemente de los rendimientos decrecientes. Hay un costo asociado con esto llamado “maldición de la dimensionalidad”, donde los datos de entrenamiento requeridos para entrenar de manera confiable un modelo aumenta exponencialmente con la dimensionalidad de las características. Por lo tanto, se convierte en una compensación entre la utilización de las características más informativas con los datos de capacitación disponibles y el rendimiento requerido del modelo entrenado. (En las tareas del mundo real, los datos de capacitación son ruidosos, tienen valores faltantes y, por lo general, mucho menos de lo requerido, todo lo cual agrega una prima en las funciones utilizadas)

En resumen, combine características si proporcionan una mejora en el rendimiento (clasificación o resultado de regresión); si mejoran la “estructura” de los datos en términos de entropía.

Machine Learning

Related Content

Si existieran interfaces neuronales, ¿cuáles serían las aplicaciones civiles? ¿Cuántos tendría, por qué?

¿En qué se diferencia una empresa financiera cuantitativa de un fondo de cobertura típico?

¿Qué conceptos debería practicar en la programación antes de ir a Machine Learning?

¿Cuál debería ser el plan adecuado para aprender el aprendizaje automático desde cero para un estudiante del tercer semestre?

¿Cuáles son las diez mejores universidades del Reino Unido para obtener un doctorado en inteligencia artificial o aprendizaje automático?

¿Qué es la regularización en el aprendizaje automático?

¿Cuál es la relación entre economía y ciencia de datos?

More Interesting

Cómo construir un modelo de propensión a comprar para el marketing de bases de datos utilizando el aprendizaje automático en un entorno financiero

¿Cuáles son las instituciones en India que ofrecen cursos de aprendizaje automático y minería de datos y cuáles son las áreas posteriores?

¿Cuál es la diferencia entre el análisis de opinión y el análisis de tonalidad?

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

¿Cómo se relaciona el concepto de simetría con la agrupación?

¿Qué técnicas son buenas para suavizar los clics de las consultas de cola larga en los motores de búsqueda?

¿Cómo funciona KNN?

¿Cuáles son las características de un motor BS4?

¿Cómo analizan los algoritmos de aprendizaje automático y los algoritmos basados en léxico las palabras coloquiales en un análisis de sentimientos de Twitter?

¿Cuáles son los cursos necesarios para aprender la recuperación de información y el aprendizaje automático?

¿Cuál es el papel del análisis de datos exploratorios (EDA) en el aprendizaje automático?

¿La IA tradicional se está volviendo obsoleta a la luz del progreso en el aprendizaje profundo?

¿Cómo detectamos el sobreajuste y la falta de ajuste en Machine Learning?

¿Por qué se utiliza un descenso gradiente iterativo para redes neuronales y no inmediato?

¿Cómo uso la regresión logística si la variable dependiente tiene más de 2 dimensiones?

Web Analytics