¿No está seguro de lo que quiere decir con “usar el paquete R directamente”? ¿Supongo que te refieres a usar las funcionalidades completas del paquete caret frente a implementar una variedad de funciones diferentes de otros paquetes?
En ese caso, recomiendo encarecidamente usar caret. Viene con casi todo lo que necesita para el modelado predictivo. Incluye funciones para ese preprocesamiento (muestreo ascendente / descendente, imputación de NA), modelos de entrenamiento (muchos algoritmos diferentes) y evaluación (R-Square, ROC Curves, …).
Siempre me gustó trabajar con ese paquete, ya que proporciona todo lo que necesita para un análisis adecuado. El autor del paquete, Max Kuhn, también escribió un libro notable sobre modelado predictivo [1]. Cubre todas las especificaciones teóricas, así como ejemplos de código del paquete. Si desea profundizar, hay otras bibliotecas más especializadas, como e1071, rpart, randomForest, …
- ¿Cuáles son los temas sobre big data para hacer una tesis de maestría que excluye el aprendizaje automático?
- ¿Cuántas personas en el mundo son expertos en aprendizaje profundo para visión por computadora?
- ¿El aprendizaje automático es un comienzo de invasión de estadísticas?
- ¿En qué se diferencia una empresa financiera cuantitativa de un fondo de cobertura típico?
- ¿Cuál es el impacto de la limitación de la velocidad de la luz en el aprendizaje automático?
Notas al pie
[1] Modelado predictivo aplicado | Max Kuhn | Saltador