Hola,
La ciencia de datos es un término general. Debe especificar qué desea hacer exactamente. La razón por la que he escrito la declaración anterior es porque normalmente hay varias cosas que hacen los científicos de datos.
Para mantenerlo en términos generales, sí, hay bastantes idiomas o herramientas que puede elegir:
- ¿Qué técnicas podrían usar datos para predecir un valor específico y asignar un grado de confianza a esa predicción?
- ¿Cuáles son los marcos de Big Data?
- ¿Cuál es el mejor hardware de computadora para juegos y análisis de datos?
- ¿Cuáles son las aplicaciones de big data y Hadoop en educación?
- ¿El aprendizaje automático tiende a producir ganancias de rendimiento marginales o revolucionarias?
- SAS: es la herramienta más utilizada en el mercado de análisis comercial. Con una gran cantidad de funciones estadísticas y una buena GUI (Enterprise Guide & Miner), ciertamente lidera el mercado.
- R: Es un software de código abierto. Es fácil aprender R porque está bien documentado. Es rentable y tiene fuertes capacidades estadísticas.
- Python es otro lenguaje de script de código abierto que se usa ampliamente. El uso de Python ha crecido con el tiempo. Hoy en día, tiene bibliotecas deportivas como Numpy, Scipy y MatPlotLib. Puede realizar casi cualquier operación estadística o construir cualquier modelo usando estas bibliotecas.
Sugeriría elegir uno de estos, todos son bastante buenos.
Además de estos, es posible que desee aprender herramientas de visualización de datos como Power BI, Tableau, que le brindan más información sobre los datos.
En caso de que si desea saber más sobre SAS, consulte este blog que lo ayudará a comenzar con SAS y sus características: SAS Tutorial | Edureka
Si le gusta SAS y desea comenzar a programar en SAS, puede consultar este blog mío que lo ayudará a comprender los fundamentos de programación de SAS: Programación SAS | Edureka
espero que esta respuesta ayude