Aquí están las 3 preguntas más frecuentes más importantes que tuve como principiante y de alguna manera logré encontrar las respuestas también.
# 1: Ciencia de datos o Big Data?
Data Science y Big Data, a veces son confusos para los principiantes
.
Big data es un término popular utilizado para describir el crecimiento exponencial y la disponibilidad de datos, tanto estructurados como no estructurados. Por lo tanto, las personas que trabajan en esto se ocupan principalmente del procesamiento y análisis de grandes cantidades de datos.
Por otro lado, los científicos de datos investigan problemas complejos a través de la experiencia en disciplinas dentro de los campos de las matemáticas, las estadísticas y la informática. Estas áreas representan una gran amplitud y diversidad de conocimiento, y un científico de datos probablemente será experto en solo una o como máximo en dos de estas áreas y meramente competente en las demás.
# 2: ¿Qué lenguaje de programación sería necesario?
El curso de Data Science se imparte por completo en el software R, que es un lenguaje de programación estadística de código abierto y una de las herramientas esenciales que forman parte de cualquier kit de herramientas de Data Scientist. Debido a su extenso repositorio de paquetes en torno a las aplicaciones estadísticas y analíticas, R está creciendo enormemente en popularidad en todo el mundo y muchas empresas están buscando programadores de R.
- ¿Cómo puede ayudar la ciencia de datos a impulsar a los países en desarrollo?
- ¿Cuál es la forma más eficiente de analizar los datos de transacciones bancarias de Yodlee?
- ¿Hay alguna manera de que podamos incorporar la genómica y las imágenes médicas a la ciencia de datos como postgrado?
- Cómo saber si mis datos son linealmente separables
- ¿Cuáles son los casos de uso típicos para diferentes algoritmos de aprendizaje automático? Por ejemplo, ¿en qué condiciones típicas uno preferiría usar uno sobre el otro sin haber probado la precisión del aprendizaje?
# 3: ¿Cómo me convierto en un científico de datos?
Hay un curso de 9 sets con un proyecto final, en Coursera proporcionado por la John Hopkins Bloomberg School of Business. Es un curso gratuito y, con mucho, el mejor lugar para comenzar e incluso terminar.
Enlace del curso: Coursera
Lecturas adicionales: Científico de datos: el trabajo más sexy del siglo XXI – HBR