¿Qué temas se deben aprender bajo ciencia de datos?

Varios cursos de Big Data incluyen diferentes módulos de estudio y estos módulos tienen una combinación de conceptos e idiomas en los que uno debe enfocarse. Estas son las áreas centrales que debe aprender en un curso de Big Data:

Lenguajes de programación: Python, C, C ++, Java, JavaScript, CSS, HTML, PHP, Perl, Shell, Ruby, Shell, Scheme, Lisp.

Además, uno debería:

-Desarrollar un razonamiento lógico sólido

-Buena comprensión de las matemáticas y las estadísticas.

-Desarrollar un conocimiento sólido Algoritmos, estructuras de datos, sistemas operativos

-Aprende el proceso si construyes compiladores

-Aprende Apache Hadoop, Hive, Mahout, Zookeeper

-Learn NTLK – El tookit de lenguaje natural

-Aprenda sobre las herramientas de visualización – Tableau, Qlikview, Gráficos ggplot2 en Quick-R

Hay innumerables cursos y programas disponibles en línea que uno puede tomar y comenzar a aprender. Muchos de estos cursos están disponibles en Coursera y Udemy sin costo.

programación: python es el mejor … si sabe que puede manejar más de un idioma, es mejor. Algoritmo como Clasificador de bosque aleatorio, Svm … debe tener una buena comprensión … debe saber las matemáticas detrás de él … entonces puede aparecer … buena suerte

Aprendizaje automático, estadística, análisis, álgebra lineal, probabilidad.

More Interesting

Si pudiera construir una plataforma de contenido (piense en la entrega de noticias) desde cero con el objetivo de escalar a millones de usuarios, ¿qué infraestructura utilizaría?

¿Existe alguna implementación del modelo de atención en el flujo tensorial?

Siendo un principiante, ¿dónde debería comenzar a aprender Machine Learning?

¿Cuál es la explicación simple del modelo de Ising y Potts?

¿Cómo detectamos el sobreajuste y la falta de ajuste en Machine Learning?

¿En qué se diferencia un autoencoder (apilado) de un MLP, aparte de que los autoencoders aprenden funciones de identidad aproximadas?

¿Por qué los pesos hacia adelante y hacia atrás son iguales en la máquina de Boltzmann restringida?

¿Cuál es la diferencia entre lógica difusa y aprendizaje automático?

¿Cuáles son algunos trabajos de investigación recientes sobre detección de anomalías?

¿Cuántas horas le tomaría a un analista de datos profesional revisar los datos simples de la compañía y construir un modelo para predecir el desgaste?

¿Se reemplazará la programación de la computadora por aprendizaje automático?

OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?

¿Cuál es la diferencia entre el aprendizaje inductivo y transductivo?

¿Es el atributo central del reconocimiento de patrones genios?

En el aprendizaje por refuerzo, ¿cuál es la diferencia entre una función de valor de estado V (s) y una función de valor de acción de estado Q (s, a)?