¿Puede la generación de características de fuerza bruta vencer a la ingeniería de características clásica?

Llegaría aún más lejos y diría que la generación de características de fuerza bruta supera siempre a la ingeniería de características clásica.

Sin embargo, hay varios puntos que uno debe tener en cuenta al forzar funciones brutas:

1. Generalidad

Las características forzadas brutas pueden vencer a las características clásicas, pero eso solo es cierto para un subconjunto dado de datos reales . En realidad, incluso con la validación cruzada, todo su conjunto de datos (prueba y entrenamiento) puede estar sujeto a un cierto sesgo, debido a la forma en que se recopilaron y procesaron los datos, o al simple hecho de que algunos puntos ocurren muy raramente y pueden no estar presentes en su conjunto de datos (que podría llamarse “casos límite” para usar un vocabulario de ingeniería de software). Esto también es cierto cuando los datos solo representan una vista truncada de lo que realmente está sucediendo, como cuando faltan algunas características básicas importantes.

La ventaja que tiene la ingeniería de características clásicas sobre la fuerza bruta es que se beneficia del mayor nivel de razonamiento y abstracción que tienen los humanos. Debido a que tenemos mejores capacidades de generalización, podemos incluir o excluir selectivamente algunas características no porque brinde mejores resultados de validación cruzada, sino porque “tienen sentido”, en otras palabras, porque se ajustan más a los conceptos (abstracciones) que a los datos. Ajustar los conceptos es algo bueno porque los conceptos también pueden aplicarse a puntos que no están presentes en el conjunto de datos.

La consecuencia es que el modelo clásico puede producir peores resultados en la validación cruzada, pero que tiene una mayor confianza en él cuando se enfrenta a datos del mundo real.

2. Explicabilidad

La mayor confianza que uno puede tener en las características clásicas, también puede explicarse por el hecho de que son más explicables. Las características forzadas brutas son más difíciles de entender y explicar, especialmente si utilizan más de dos características básicas y operadores para expresarse.

Claro, el producto del precio y la cantidad es comprensible, pero estas son típicamente el tipo de características que podrías encontrar.

La explicabilidad se vuelve cada vez más crítica cuando sus hallazgos tienen que presentarse a expertos de campo, o tomadores de decisiones, o cualquier persona realmente. Las características clásicas generalmente son más aceptadas tanto por los expertos en el campo como por los tomadores de decisiones, porque las primeras pueden relacionarse con lo que está sucediendo en el campo, y las segundas pueden comprender algunas cosas cuando explica su trabajo.

Y como en todos los entornos de trabajo, sin importar el campo, la confianza triunfa sobre los datos (juego de palabras previsto, pero no compatible).

Por supuesto, el riesgo de las características clásicas es que podemos incluir nuestro propio sesgo de percepción en el modelo, pero esto también sucede con el aprendizaje no supervisado y la única forma de combatirlo … es incluir nuestra percepción (anti) sesgo: las redes neuronales son aprendiendo inadvertidamente los prejuicios de género ocultos de nuestro idioma

Gracias por la solicitud.

La ingeniería de características clásicas consiste en aplicar el conocimiento del dominio para decidir qué características son relevantes e incluso legales y / o éticas. He creado un par de sistemas ml que deciden usar ciertos estereotipos basados ​​en la raza hasta que saque la información racial. Para averiguar cómo lidiar con los datos faltantes y, a menudo, obtenerlos. También se extiende al análisis para descubrir si los datos son incluso válidos (los datos falsos son una excelente manera de atacar muchos sistemas ml).

El problema es, por supuesto, mi sesgo basado en el conocimiento del dominio tiende a impulsar mis fuentes de funciones. La ventaja es que tengo ese sesgo por una razón. La historia se entiende mejor en base a una teoría propia de la historia. La mayoría de las investigaciones tienden a indicar que las criaturas altamente inteligentes utilizan el conocimiento recibido al menos como base de su razonamiento crítico.

More Interesting

¿Cómo se puede utilizar el aprendizaje automático para mejorar el software de gestión de proyectos?

¿Cuál es la relación entre K-means y PCA?

¿Qué tan útil es un trabajo cuantitativo en Goldman Sachs para un doctorado posterior en Machine Learning?

¿Cuál es un buen libro para estadísticas como una consideración de ML para principiantes?

¿Qué significa el siguiente pasaje de un documento de aprendizaje profundo sobre aprendizaje automático sobre representaciones distribuidas frente a representaciones no distribuidas?

¿Por qué mi árbol de clasificación que realicé en MATLAB muestra solo un nodo?

¿Qué es el análisis de componentes principales en términos de super laicos?

¿Qué es el Autoencoder Adversarial?

¿Cómo utiliza Foursquare el aprendizaje automático para mejorar el producto?

He estado aprendiendo la red neuronal de retroalimentación y la propagación hacia atrás durante 3 meses y todavía no puedo entenderlo, ¿qué debo hacer?

¿Hay un grupo de investigadores trabajando en la síntesis de texto EEG (conversión de pensamiento a texto)?

¿Cuáles son buenos recursos para aprender sobre la ejecución distribuida en redes neuronales profundas (MPI, allreduce, etc.)?

Soy Editor de Adquisiciones y para obtener conocimiento y autoaprendizaje de análisis de datos y habilidades de aprendizaje automático. ¿Alguien podría ayudarme a trazar un plan?

¿Cuáles serán los 3 principales problemas de aprendizaje profundo en los próximos 5 años?

Cómo lidiar con múltiples resultados mutuamente dependientes en el aprendizaje automático