http://www.jmlr.org/papers/v7/zh…
En la selección de características de flujo continuo , las nuevas características se consideran secuencialmente para agregarlas a un modelo predictivo. Cuando el espacio de características potenciales es grande, la selección de características de flujo continuo ofrece muchas ventajas sobre los métodos de selección de características tradicionales, que suponen que todas las características se conocen de antemano. Las características se pueden generar dinámicamente, enfocando la búsqueda de nuevas características en subespacios prometedores, y el sobreajuste se puede controlar ajustando dinámicamente el umbral para agregar características al modelo. A diferencia de los algoritmos tradicionales de selección de características hacia adelante, como la regresión por pasos en la que en cada paso se evalúan todas las características posibles y se selecciona la mejor, la selección de características por flujo solo evalúa cada característica una vez cuando se genera. Describimos la inversión de información y la inversión α, dos métodos de penalización de la complejidad adaptativa para la selección de características en función del flujo que ajustan dinámicamente el umbral de la reducción de errores requerida para agregar una nueva característica. Estos dos métodos dan falsas garantías de estilo de tasa de descubrimiento contra el sobreajuste. Se diferencian de los métodos de penalización estándar, como AIC, BIC y RIC, que siempre superan o subestiman drásticamente en el límite de un número infinito de características no predictivas. Los resultados empíricos muestran que la regresión por secuencias es competitiva con (en conjuntos de datos pequeños) y superior a (en conjuntos de datos grandes) métodos de selección de características mucho más intensivos en cómputo, como la regresión por pasos, y permite la selección de características en problemas con millones de características potenciales.
- ¿Sigue siendo el curso de aprendizaje automático de Andrew Ng el mejor curso de aprendizaje automático disponible?
- ¿Es el sesgo entre las mejores universidades frente a otras universidades en los Estados Unidos tan malo como el sesgo de IIT frente al resto de la India?
- ¿Qué tipo de algoritmos utilizamos para el análisis de sentimientos? ¿Hay alguna lista para los algoritmos y sobre su estructura?
- ¿Cómo analizaría programáticamente una oración y decidiría si responde con "eso es lo que dijo"? Resuma un algoritmo que, dada una oración, devuelve verdadero o falso para determinar si la declaración es apropiada.
- ¿Debo obtener una MacBook Pro con 16 GB de RAM (máximo) para el trabajo de aprendizaje automático, a pesar de que puedo llevar cosas intensas a una instancia de Google Cloud?