Primero, asegúrese de que R es lo que necesita para practicar ciencia de datos. Si viene de un fondo de matemática / estadística, R es la opción correcta. Si proviene de un entorno de TI / software, considere Python para su trabajo.
Ahora, para comenzar con R, haga lo siguiente:
- Necesita un intérprete para entender el idioma. ¿Derecho? Descargue e instale el entorno R desde este enlace: El Proyecto R para Computación Estadística. A la izquierda encuentra la opción de descarga.
- Necesita un IDE fácil de usar para aumentar su productividad. Descargue e instale RStudio desde este enlace: descargue RStudio. Elija la versión de código abierto de escritorio.
- Necesitará instalar algunos paquetes después para realizar cálculos potentes. Use el comando
install.packages(“package_name_here”)
en RStudio (o R shell). Algunos paquetes útiles con los que puede comenzar: - ggplot2 (visualización de datos)
- reshape2 (reestructuración de datos)
- stringr (manipulación de cadenas)
- RPostgreSQL , RMYSQL , RMongo , RODBC , RSQLite (paquetes de conexión de base de datos)
- CARET, randomForest, nnet (paquetes de aprendizaje automático)
- Siempre que quieras hacer algo, primero busca un paquete en Google. No escriba algoritmos desde cero.
Eso es todo lo que necesitas con respecto a la configuración.
- ¿Cuáles son algunos campos de proyecto de big data?
- ¿Qué herramientas usan los científicos de datos para ver y seleccionar datos de archivos CSV?
- Hay varios cursos disponibles sobre ciencia de datos y análisis como Udaicity, Upgrad Imarticus, etc. ¿Cuál es el mejor para unirse?
- ¿Cuál es la mejor manera de descubrir un modelo de datos para una aplicación?
- Vivo en Bangalore y no soy ingeniero informático. ¿Puedo aprender big data y Hadoop y cambiar mi campo?
Encuentre algunos buenos tutoriales de R en este enlace: Tutoriales | Kaggle
¡Disfrutar!