¿Cuáles son algunos buenos libros de texto en selección / ingeniería de características al construir algoritmos de aprendizaje automático?

El aprendizaje automático es después de un tiempo muy específico del dominio. En mi dominio, las finanzas, los problemas del aprendizaje automático se relacionan en gran medida con el sobreajuste. He encontrado que los Elementos del aprendizaje estadístico son muy útiles. También he encontrado muy útiles los “Modelos econométricos y pronósticos económicos”.

Para ser honesto, he aprendido mucho más de los practicantes. Aprendí mucho del enfoque de mi ex colega John Martello para hacer un sistema continuo de generar coeficientes para comerciar al día siguiente, sin importar la complejidad operativa de hacerlo. He aprendido mucho del enfoque de mi ex colega David para hacer pocos modelos y no demasiados y tomarme el tiempo para formar una opinión al respecto. He aprendido de Sean Slotterback acerca de cómo combinar alfa con diferentes duraciones. He aprendido de mi amigo y que en la práctica es muy beneficioso no solo obtener el precio previsto del modelo, sino también el nivel de confianza en el precio. Todavía siento que faltan muchos de estos aspectos prácticos en los libros.

1. Cuando aprendí la regresión lineal, se introdujo la selección del modelo. De hecho, seleccionar un modelo sería seleccionar características relevantes de su conjunto de datos. El libro de texto “modelos estadísticos lineales aplicados” sería bastante fácil de entender el concepto (especialmente el capítulo 9 Construyendo el modelo de regresión I: Selección y validación del modelo).

2. Además, puede instalar Weka y probar el módulo de selección de funciones del paquete:

Realizar selección de atributos

Hay tres tipos de selecciones de funciones en el paquete Weka:

  • el enfoque nativo, usando las clases de selección de atributos directamente
  • utilizando un metaclasificador
  • el enfoque de filtro

3. Otro método de selección de características que surge recientemente se conocería como mRMR (Selección de características de relevancia mínima de redundancia mínima):

http://penglab.janelia.org/proj/

El libro Modelado predictivo aplicado de Max Kuhn y Kjeil Johnson es bastante bueno. Tiene código de muestra en R y un paquete R. Echa un vistazo al sitio http: // applypredictivemodeling

Tocan esto a través de Los Elementos del Aprendizaje Estadístico.

Prueba este

Ingeniería de funciones de masterización

More Interesting

¿Vale la pena cambiar el perfil a Big Data después de 8 años de experiencia en TI en mainframes, SQL, Unix?

¿Cuáles son algunos proyectos de ciencia de datos de código abierto en Python?

Cómo aprender a ser un análisis de datos

¿Cómo manejar los datos faltantes (estadísticas)? ¿Qué técnicas de imputación recomienda o sigue?

Estoy interesado en el aseguramiento de la calidad del software. Necesito entrar en el análisis de big data. ¿Cuáles son los cursos y certificaciones que necesito tomar?

Cómo convertirme en un "fantasma" en Internet y eliminar todos mis datos en línea

¿Qué es el ERP? ¿Cómo apoya ERP a las empresas? ¿Es una herramienta que ayuda con el mantenimiento de registros y ofrece una instalación de almacenamiento de datos?

En el aprendizaje automático, ¿por qué utilizamos un tercio de los datos para las pruebas y dos tercios para la capacitación? ¿Es sentido común o hay una razón científica?

¿Qué es un desarrollador de big data?

Si un doctorado en física con experiencia mínima en programación, pero con buenos antecedentes en matemáticas, quiere encontrar un trabajo en ciencia de datos en el mercado estadounidense, ¿qué más debe aprender?

Soy un estudiante de informática interesado en ciencia de datos. ¿A qué reuniones o conferencias (en India) debo asistir para crecer en el campo?

¿Qué tan confiables son las estadísticas oficiales en Brasil?

¿Puedo aprender ciencia de datos o big data?

Como científico de datos, ¿sería útil aprender el desarrollo completo de la pila?

¿Cómo se puede pasar de la función de consultor de un MBB a la función de ciencias de datos?