¿Hay alguna tarea específica en la que esté trabajando o le interese en general?
Una buena manera de verificar si la selección de características es buena es ejecutar t-SNE y visualizar los datos. Si es posible separar visualmente distintas clases, también es posible construir un buen modelo de predicción basado en las mismas características.
En general, en caso de tener más características que el ejemplo de aprendizaje, creo que las redes neuronales son una buena opción para el modelo de predicción. De todos modos, en el caso de seleccionar redes neuronales, debe decidir cuántas unidades estarán en la capa de entrada (es decir, el número de entidades) y las capas ocultas. Una buena forma de seleccionar una configuración adecuada es ejecutar un diagnóstico de error de desviación de sesgo. Si el error en el conjunto de entrenamiento es bajo y el error en el conjunto de prueba es grande, intente utilizar la menor cantidad de funciones. En caso de que tanto el error de entrenamiento como el de prueba sean grandes, intente utilizar un mayor número de funciones.
- ¿En qué se diferencia el aprendizaje automático de la minería de datos?
- ¿Cuáles son algunos ejemplos de código de modelos de aprendizaje automático humanos en el circuito? Me ha resultado difícil encontrar tutoriales / documentos que discutan este tema.
- ¿Son los enfoques variacionales estocásticos la forma de hacer ML bayesiano a gran escala o ves alguna esperanza de ampliar los algoritmos basados en MCMC?
- ¿Cuál es la relación entre economía y ciencia de datos?
- ¿Cuáles son los algoritmos de aprendizaje de refuerzo más eficientes en datos / muestras?
No hay una respuesta general para la pregunta, pero creo que puede construir un buen modelo empleando el diagnóstico descrito anteriormente.