Si te gusta la minería de datos, he encontrado que lars [1] y gbm [2] son útiles.
Recientemente también he escuchado cosas buenas sobre caret [3], pero no he tenido la oportunidad de usarlo yo mismo.
Yang Zhang menciona algunos más en una reciente publicación de blog [4]: data.table [5] y zoo [6]. También señaló la manipulación de RStudio [7] en Twitter.
- ¿Es el big data y la ciencia de datos una amenaza para los estadísticos profesionales?
- ¿Cuál es la diferencia entre un almacén de datos y una plataforma de gestión de datos?
- ¿Debo seguir escribiendo aplicaciones móviles o ciencia de datos?
- ¿Cómo se usan los conceptos de probabilidad y estadística en la ciencia de datos?
- ¿Podría el aprendizaje automático avanzado sacar a los científicos de datos del negocio?
He usado lubridate [8] recientemente; hace que trabajar con fechas y horarios sea un poco más amigable.
Además, según [9], glmnet y randomForest son los dos algoritmos más importantes en el modelo predictivo actual.
En un screencast de Jeremy Howard de Kaggle [10], usa algunas funciones de caTools [11] que parecen útiles.
Recientemente descubrí knitr [12], que parece una buena alternativa a Sweave.
[1] http://cran.r-project.org/web/pa…
[2] http://cran.r-project.org/web/pa…
[3] http://caret.r-forge.r-project.org/
[4] http://yz.mit.edu/wp/whats-there…
[5] http://cran.r-project.org/web/pa…
[6] http://cran.r-project.org/web/pa…
[7] http://rstudio.org/docs/advanced…
[8] http://cran.r-project.org/web/pa…
[9] http://strataconf.com/strata2012…
[10] http://media.kaggle.com/MelbURN….
[11] http://cran.r-project.org/web/pa…
[12] http://yihui.name/knitr/