¿Existe alguna implementación para un clasificador incremental que pueda ejecutarse en un espacio dinámico de características, lo que significa cuando aparecen nuevas características? La tecnología cambia la vida futura

¿Existe alguna implementación para un clasificador incremental que pueda ejecutarse en un espacio dinámico de características, lo que significa cuando aparecen nuevas características?

http://www.jmlr.org/papers/v7/zh…

En la selección de características de flujo continuo , las nuevas características se consideran secuencialmente para agregarlas a un modelo predictivo. Cuando el espacio de características potenciales es grande, la selección de características de flujo continuo ofrece muchas ventajas sobre los métodos de selección de características tradicionales, que suponen que todas las características se conocen de antemano. Las características se pueden generar dinámicamente, enfocando la búsqueda de nuevas características en subespacios prometedores, y el sobreajuste se puede controlar ajustando dinámicamente el umbral para agregar características al modelo. A diferencia de los algoritmos tradicionales de selección de características hacia adelante, como la regresión por pasos en la que en cada paso se evalúan todas las características posibles y se selecciona la mejor, la selección de características por flujo solo evalúa cada característica una vez cuando se genera. Describimos la inversión de información y la inversión α, dos métodos de penalización de la complejidad adaptativa para la selección de características en función del flujo que ajustan dinámicamente el umbral de la reducción de errores requerida para agregar una nueva característica. Estos dos métodos dan falsas garantías de estilo de tasa de descubrimiento contra el sobreajuste. Se diferencian de los métodos de penalización estándar, como AIC, BIC y RIC, que siempre superan o subestiman drásticamente en el límite de un número infinito de características no predictivas. Los resultados empíricos muestran que la regresión por secuencias es competitiva con (en conjuntos de datos pequeños) y superior a (en conjuntos de datos grandes) métodos de selección de características mucho más intensivos en cómputo, como la regresión por pasos, y permite la selección de características en problemas con millones de características potenciales.

Aprendizaje automáticoCaracterísticasProgramación informática