¿Cuál es el programa de estudios para la ciencia de datos?

A continuación se detalla el contenido del curso de capacitación en Ciencias de datos de RStraining. Por favor, revísalo. También puede optar por RStraining, que ofrece la mejor capacitación en línea en Hyderabad , así como capacitación en el aula para Data Science .

Contenido detallado del curso de ciencia de datos

R con ejemplos en tiempo real

No soy muy bueno en Estadística o Probabilidad, pero soy un buen programador. ¿Debo aprender Big Data?
¿A qué nivel, o cuánta programación, necesito saber para convertirme en científico de datos?
¿Cuáles son algunos de los métodos que hacen los científicos para analizar datos?
¿Dónde puedo encontrar conjuntos de datos abiertos gratuitos para ganar experiencia como Business Intelligence y Data analyst?
¿Qué es mejor, Data Science M.Tech de IIT Hyderabad o Big Data Analytics Certification de IIM Bangalore?

Instalación de R y R Studio (MAC y Windows)

Tipos de variables.

Usando variables

Variables lógicas y operadores

El bucle “Mientras”

Usando la consola

El bucle “para”

La declaración “If”

¿Qué es un vector?

Vamos a crear algunos vectores.

Usando los corchetes []

Operaciones vectorizadas

El poder de las operaciones vectorizadas.

Funciones en R

Paquetes en R

Matrices

Construyendo su primera matriz

Dimensiones de nombres

Colnames () y Rownames ()

Operaciones matriciales

Visualizando con Matplot ()

Subconjunto

Visualizar subconjuntos

Creando tu primera función

Importar datos a R

Explorando su conjunto de datos

Usando el signo $

Operaciones básicas con un marco de datos

Filtrar un marco de datos

Introducción a qplot

Construyendo marcos de datos

Fusionar marcos de datos

Funciones de bucle

• lapply ()

• sapply ()

• aplicar()

• tapply ()

• mapply ()

Expresiones regulares

Guardar objetos r

paquete dplyr

Aplicaciones brillantes

Soluciones de tarea

Ley de solución de tarea de grandes números

Solución de tarea Sección 3: Análisis de estados financieros

Solución de tarea Sección 4: Tiros libres de baloncesto

Solución de tarea Sección 5: Tendencias mundiales

Solución de Tarea Sección 6: Película Doméstica% Bruto

Estadísticas con R

Descriptivo:

-Recopilación de datos

-Colección de datos – Diseño de cuestionarios

-Colección de datos – Observación

-Colección de datos – Método de estudio de caso

-Datos cualitativos vs datos cuantitativos

-Patrones de datos

-Deciles Estadísticas

-Diagrama de Venn

-Teorema del límite central

-Teorema de Chebyshev

-Curtosis

-Distribución normal

-Distribución Laplace

-Log Gamma Distribution

Distribución de Rayleigh

-Distribución exponencial

-Distribución multinomial

-Distribución binomial

-Beta Distribución

-F distribución

-Distribución binomial negativa

-Gamma Distribution

-Chi-cuadrado Distribución

-Significado geometrico

-Significado armonico

-Función externa

-Trama de hoja y tallo

-Distribución de veneno

-Distribución acumulativa de Poisson

Distribución gamma inversa

-Distribución uniforme continua

-Distribución hipergeométrica

-Número armónico

-Gumbel Distribución

-Comparar parcelas

-Calculadora de energía

-Proceso Sigma

-Frecuencia de resonancia armónica

-Tabla normal estándar

-Variancia acumulada (r)

-Desviación media

-Significa diferencia

Rcode (+ teoría) para descriptivo:

tendencia central:

-Significado aritmetico

-Media aritmética

-Modo aritmético

-Rango Aritmético

-Range Rule of Thumb

-R-cuadrado ajustado

-Desviación Estándar

-Desviación estándar relativa

-Análisis de variación

-Grand Mean

-Boxplots

-Desviación cuartil

-Distribución de frecuencias

-Gráfico de barras

-Gráfica de puntos

-Gráfico de dispersión

-Coeficiente de correlación

-Gráfico circular

-Histogramas

-Frecuencia acumulada

-Gráficos acumulativos

-Oblicuidad

-Bondad de ajuste

-Transformaciones

-Medio recortado

-Coeficiente de confiabilidad

-Regresión lineal

-Regresión logística

-Regresión cuadrática

-Regresión Intercepción Confianza Intervalo

-Residual suma de cuadrados

-Equation Sum of Square

-Error estándar (SE)

-Media cuadrática

Coeficiente kappa de Cohen

-Ti 83 Regresión exponencial

-Shannon Wiener Índice de Diversidad

Inferencial:

-Notación estadística

-Planificación de muestras

-Métodos de muestreo

-Muestreo aleatorio simple

-Muestreo estratificado

-Muestreo de racimos

-Tamaño de muestra requerido

-Evaluación de la hipótesis

– Relación señal / ruido

-Mejor estimación de puntos

-Tipo I y II Error

-T-Tabla de distribución

-Residual análisis tabla Z

-F Tabla de prueba

-Chi Mesa cuadrada

-Significancia estadística

-Coeficiente de intervalo de variación

Rcode para inferencial:

-Estudiante T Test

-Una prueba Z de proporción

-Kolmogorov Smirnov Test

-Mcnemar Test

-Anova (1 vía, 2 vías)

-Manova

-Prueba de chi-cuadrado

Probabilidad:

-Factorial

-Probabilidad

-Odd e incluso permutación

-Permutación con reemplazo

-Permutación circular

-Distribución de probabilidad geométrica

Función de densidad de probabilidad

-Probabilidad Teorema de Bayes

-Permutación

-Combinación

-Modelo Black-Scholes

Teorema de aditivo de probabilidad

-Combinación con reemplazo

-Probabilidad Teorema Multiplicativo

-Capacidad de proceso de estimación (Cp) y rendimiento del proceso (Pp)

-Fórmulas estadísticas

Aprendizaje automático con ejemplos en tiempo real

Construcción de regresores lineales

Interpretación de resultados de regresión y términos de interacción

Realizar análisis residuales y extraer observaciones extremas Distancia del cocinero

Extracción de mejores modelos con mejores subconjuntos, regresión gradual y ANOVA

Validación del rendimiento del modelo en datos nuevos con k-Fold Cross Validation

Construcción de regresores no lineales con splines y GAM

Creación de regresores logísticos, métricas de evaluación y curva ROC

Comprender el concepto y construir clasificador ingenuo de Bayes

Construcción del clasificador de vecinos más cercanos k

Construyendo modelos basados en árboles usando RPart, cTree y C5.0

Construyendo modelos predictivos con el paquete caret

Selección de características importantes con RFE, varImp y Boruta

Construcción de clasificadores con máquinas de vectores de soporte

Comprender el ensacado y la construcción de un clasificador forestal aleatorio

Implementando el impulso gradiente estocástico con GBM

Regularización con Ridge, Lazo y Elasticnet

Creación de clasificadores y regresores con XGBoost

Reducción de dimensionalidad con análisis de componentes principales

Agrupación con k-medias y componentes principales

Determinación del número óptimo de clústeres

Comprender e implementar el agrupamiento jerárquico

Agrupación con propagación de afinidad

Construcción de motores de recomendación

Comprender los componentes de una serie temporal y el paquete xts

Estacionalidad, tendencia y desestacionalización

Comprender la importancia de los retrasos, ACF, PACF y CCF

Predicción con media móvil y suavizado exponencial

Pronósticos con inviernos dobles exponenciales y holt

Predicción con modelado ARIMA

Raspado de páginas web y procesamiento de textos

Corpus, TDM, TF-IDF y Word Cloud

Similitud de coseno y análisis semántico latente

Extracción de temas con asignación de Dirichlet latente

Puntuación de sentimiento con tidytext y Syuzhet

Clasificación de textos con RTextTools

Construyendo un ggplot2 básico y personalizando la estética y los temas

Manipulación de leyenda, adición de texto y anotación

Dibujar múltiples trazados con facetas y cambiar diseños

Creación de gráficos de barras, diagramas de caja, series de tiempo y diagramas de cinta

Extensiones ggplot2 y ggplotly

Implementación de mejores prácticas para acelerar la vista previa del código R

Implementación de computación paralela con doParallel y foreach

Escribir código R legible y rápido con tuberías y DPlyR

Escribir código R superrápido con pulsaciones de teclas mínimas utilizando datos.

Interfaz C ++ en R con RCpp

Comprender la estructura de un paquete R

Construye, documenta y aloja un paquete R en GitHub

Realizar verificaciones importantes antes de enviar a CRAN

Enviar un paquete R a CRAN

Soluciones de aprendizaje automático de R

Descarga e instalación de R

Descarga e instalación de RStudio

Instalar y cargar paquetes

Leer y escribir datos

Usando R para manipular datos

Aplicando estadísticas básicas

Visualizando datos

Obtener un conjunto de datos para el aprendizaje automático

Lectura de un conjunto de datos Titanic desde una vista previa de archivo CSV

Convertir tipos en variables de caracteres

Detectar valores perdidos

Imputando valores perdidos

Explorando y visualizando datos

Predecir la supervivencia de los pasajeros con un árbol de decisión

Validar el poder de la predicción con una matriz de confusión

Evaluar el desempeño con la curva ROC

Comprender el muestreo de datos en R

Operando una distribución de probabilidad en R

Trabajar con estadística descriptiva univariante en R

Realización de correlaciones y análisis multivariado

Operación de regresión lineal y análisis multivariante

Realizar una prueba binomial exacta

Realizar la prueba t de Student

Realizar la prueba de Kolmogorov-Smirnov

Comprender la suma de rango de Wilcoxon y la prueba de rango firmado

Trabajando con la prueba de Chi-cuadrado de Pearson

Realización de un ANOVA unidireccional

Realizar un ANOVA de dos vías

Ajuste de un modelo de regresión lineal con lm

Resumiendo ajustes de modelo lineal

Uso de regresión lineal para predecir valores desconocidos

Generando un diagrama de diagnóstico de un modelo ajustado

Ajuste de un modelo de regresión polinómica con lm

Ajuste de un modelo de regresión lineal robusto con rlm

Estudiar un caso de regresión lineal en datos SLID

Reducción de dimensiones con SVD

Aplicando el modelo de Poisson para la regresión lineal generalizada

Aplicación del modelo binomial para la regresión lineal generalizada

Ajuste de un modelo aditivo generalizado a los datos

Visualizando un modelo aditivo generalizado

Diagnóstico de un modelo aditivo generalizado

Preparación de los conjuntos de datos de entrenamiento y prueba

Construyendo un modelo de clasificación con árboles de particiones recursivas

Visualizar un árbol de particiones recursivo

Medición del rendimiento de predicción de un árbol de particiones recursivo

Poda de un árbol de particiones recursivo

Crear un modelo de clasificación con un árbol de inferencia condicional

Visualizar un árbol de inferencia condicional

Medición del rendimiento de predicción de un árbol de inferencia condicional

Clasificación de datos con el clasificador vecino K-Nearest

Clasificación de datos con regresión logística

Clasificación de datos con el clasificador Naïve Bayes

Clasificación de datos con una máquina de vectores de soporte

Elegir el costo de un SVM

Visualizando un ajuste SVM

Predicción de etiquetas basadas en un modelo entrenado por un SVM

Afinando un SVM

Entrenamiento de una red neuronal con neuralnet

Visualizando una red neuronal entrenada por neuralnet

Predicción de etiquetas basadas en un modelo entrenado por neuralnet

Entrenando una red neuronal con nnet

Predicción de etiquetas basadas en un modelo entrenado por nnet

Estimación del rendimiento del modelo con k-fold Cross Validation

Realización de validación cruzada con el paquete e1071

Realizar validación cruzada con el paquete caret

Clasificación de la importancia variable con el paquete caret

Clasificación de la importancia variable con el paquete rminer

Encontrar características altamente correlacionadas con el paquete caret

Selección de funciones con el paquete Caret

Medición del rendimiento del modelo de regresión

Medición del rendimiento de predicción con una matriz de confusión

Medición del rendimiento de predicción utilizando ROCR

Comparación de una curva ROC con el paquete Caret

Medición de diferencias de rendimiento entre modelos con el paquete caret

Clasificación de datos con el método de ensacado

Realización de validación cruzada con el método de ensacado

Clasificación de datos con el método de refuerzo

Realizar validación cruzada con el método de refuerzo

Clasificación de datos con aumento de gradiente

Calcular los márgenes de un clasificador

Cálculo de la evolución de errores del método de conjunto

Clasificación de datos con bosque aleatorio

Estimación de los errores de predicción de diferentes clasificadores

Agrupación de datos con agrupación jerárquica

Cortar árboles en racimos

Agrupación de datos con el método k-medias

Dibujar un diagrama de clúster bivariado

Comparación de métodos de agrupación

Extracción de información de silueta del agrupamiento

Obtención del número óptimo de clústeres para k-medias

Agrupación de datos con el método basado en la densidad

Agrupación de datos con el método basado en modelo

Visualizando una Matriz de Disimilitud

Validación de clústeres externamente

Transformando datos en transacciones

Visualización de transacciones y asociaciones

Asociaciones mineras con la regla Apriori

Reglas redundantes de poda

Visualización de reglas de asociación

Conjuntos de artículos frecuentes de minería con Eclat

Crear transacciones con información temporal

Minería de patrones secuenciales frecuentes con cSPADE

Realizar selección de funciones con FSelector

Realizar reducción de dimensiones con PCA

Determinación del número de componentes principales mediante la prueba de pantalla

Determinación del número de componentes principales utilizando el método Kaiser

Visualización de datos multivariados usando biplot

Realizar reducción de dimensión con MDS

Reducción de dimensiones con SVD

Comprimir imágenes con SVD

Realización de reducción de dimensión no lineal con ISOMAP

Realización de reducción de dimensión no lineal con incrustación lineal local

Preparando el entorno RHadoop

Instalar rmr2

Instalar rhdfs

Operando HDFS con rhdfs

Implementación de un problema de recuento de palabras con RHadoop

Comparación del rendimiento entre un programa R MapReduce y un programa R estándar

Probar y depurar el programa rmr2

Instalar plyrmr

Manipulación de datos con plyrmr

Realización de aprendizaje automático con RHadoop

Configuración de clústeres RHadoop en Amazon EMR

Aprendizaje profundo con R

Introducción a las arquitecturas de capas ocultas múltiples

Conceptos fundamentales en el aprendizaje profundo

Introducción a las redes neuronales artificiales

Clasificación con redes neuronales artificiales de dos capas

Predicciones probabilísticas con ANN de dos capas

Introducción a las arquitecturas de capas ocultas múltiples

Ajuste de hiperparámetros ANN y mejores prácticas

Arquitecturas de redes neuronales

Las arquitecturas de redes neuronales continúan

El proceso de aprendizaje

Algoritmos de Optimización y Descenso de Gradiente Estocástico

Propagación hacia atrás

Optimización de hiperparámetros

Introducción a las redes neuronales convolucionales

Introducción a las redes neuronales convolucionales Continuación

CNN en R

Clasificación de imágenes del mundo real con modelos pre-entrenados

Introducción a las redes neuronales recurrentes

Introducción a la memoria a corto y largo plazo

RNN en R

Caso de uso: aprender a deletrear palabras en inglés desde cero

Introducción al aprendizaje no supervisado y de refuerzo

Autoencoders

Máquinas de Boltzmann restringidas y redes de creencias profundas

Aprendizaje de refuerzo con ANN

Caso de uso: detección de anomalías a través de autoencoders denoising

Aprendizaje profundo para visión artificial

Aprendizaje profundo para el procesamiento del lenguaje natural

Aprendizaje profundo para el procesamiento de señales de audio

Aprendizaje profundo para tareas multimodales complejas

Otras aplicaciones importantes del aprendizaje profundo

Depuración de sistemas de aprendizaje profundo

GPU y MGPU Computing para Deep Learning

Una comparación completa de todos los paquetes DL en R

Direcciones de investigación y preguntas abiertas

Big Data y Hadoop con ejemplos en tiempo real

Introducción a Big Data

Comenzando con Hadoop

Conceptos de colmena

Conceptos de cerdo

Caso de uso en colecciones de registros y análisis

Caso de uso en Ecommerece

Tableau con ejemplos en tiempo real

Trabajando con diferentes fuentes de datos

Interfaz de Tableau

Trabajando con gráficos

Funciones con cálculos

Temas avanzados: acciones, parámetros, filtros

Cálculos de tablas, paneles avanzados, narración de cuentos

Conectividad con R

Casos de uso

Big DataCiencia de datos

¿Soy solo yo, o es 'ciencia de datos' el peor nombre para un campo?

¿Por qué, en su opinión, tantas compañías de investigación clínica se niegan a usar Python en lugar de SAS o R?

¿Cuál es la diferencia entre la investigación de mercado y la ciencia de datos, y cómo se pueden integrar juntos?

¿Cuáles son algunas ideas o proyectos en Machine Learning o análisis de big data en un hackathon?

¿Cómo se aplica la ciencia de datos a la robótica?

¿Por qué el Titanic de Kaggle: Machine Learning del desastre es un problema de aprendizaje supervisado?

‘Programa de estudios’ se refiere a las materias en un curso de estudio o enseñanza (la respuesta se sugiere usando el primer enlace en Google). Creo que la pregunta necesita aclaración. Programa de estudios de ciencia de datos en …?

Más importante aún, la mayoría de las universidades e institutos mencionan el programa de estudios de sus cursos en su sitio web. Busca el que estás buscando.

Gracias por A2A

Vishal Gangurde

Data Science Prodegree , en asociación con Genpact como Knowledge Partner, es un programa de 200 horas que brinda una cobertura integral de ciencia de datos y estadísticas, junto con el aprendizaje práctico de herramientas analíticas líderes como SAS, R, Python y Tableau a través de la industria estudios de casos y trabajos de proyectos proporcionados por Imarticus Learning .

Conceptos básicos de ciencia de datos

Todo sobre ciencia de datos

Datos, tipos de datos
Significado de las variables
Tendencia central
Medidas de dispersión
Distribución de datos

Modelado predictivo

Árboles de decisión
Redes neuronales
Modelado predictivo con árboles de decisión

Redes neuronales

Perceptrón
MLP
Propagación de espalda
Revisión de conceptos clave

ANOVA / Análisis de regresión

Análisis de varianza y covarianza
Análisis de variación
Resultados ANOVA
Examinar resultados de regresión
Análisis de regresión
Regresión lineal y logística.

Modelos de árbol y red bayesiana

Árboles de decisión
Harpillera
Bosques al azar
Árboles potenciados
Modelos de clasificación bayesiana

Programación R

R Basics

Software base R
Entendiendo CRAN
R Studio El IDE
Secuencia de números
Vectores
Operaciones básicas
Operadores y Tipos
Funciones R

Regresión logística en R

Motivo de la regresión logística
La transformación logística
Modelado de regresión logística
Optimización de modelo
Comprender la curva ROC
Modelado predeterminado usando regresión logística en R

Árboles de decisión

Teoría de la entropía y ganancia de información
Reglas de detención
Validaciones cruzadas para problemas de sobreajuste
La poda como solución para el sobreajuste
Ensemble Learning
Agregación Bootstrap
Bosques al azar
Detección de intrusiones en la red de TI

Regresión lineal en R

Covarianza y correlación
Analisis multivariable
Evaluación de la hipótesis
Limitaciones de regresión
Caso de negocio: gestión del riesgo crediticio
Pérdida dada por defecto usando regresión lineal

Máquinas de vectores soporte

Clasificación como problema de ubicación del hiperplano
Motivación para vectores de soporte lineal
Optimización Cuadrática
SVM no lineal
Funciones del kernel
Modelado predeterminado usando SVM en R

Programación Python

Conceptos básicos de Python

¿Qué es python?
Instalando Anaconda
Comprender el entorno de desarrollo integrado de Spyder (IDE)
Listas, Tuplas, Diccionarios, Variables

Manipulación de marco de datos

Adquisición de datos
Indexación, Filtrado
Ordenar y resumir
Estadísticas descriptivas
Combinación y combinación de marcos de datos
Discretización y Binning
Manipulación de cuerdas

Proyectos

Modelado predeterminado mediante regresión logística en Python
Análisis de riesgo de crédito usando SVM en Python
Detección de intrusiones usando árboles de decisión y aprendizaje en conjunto en Python

Estructuras de datos en Python

Introducción a las matrices de Numpy
Crear ndarrays
Indexación
Procesamiento de datos utilizando matrices
Entrada y salida de archivos
Comenzando con los pandas

Otras herramientas de modelado predictivo

Introducción al aprendizaje automático
Bosques al azar
Sklearn Library y Statsmodels

Programación SAS

Conceptos básicos de SAS

Características clave
Enviar un programa SAS
Sintaxis del programa SAS
Examinar conjuntos de datos SAS que acceden a bibliotecas SAS
Ordenar y agrupar
Datos de informes
Usar formatos SAS

Transformaciones de datos

Escribir observaciones
Escribir en múltiples conjuntos de datos
Total acumulativo
Crear un total acumulado para un grupo de datos
Transformaciones de datos

SQL

SQL y RDBMS
Procedimientos SQL
Presentación y resumen de datos
Unir consultas usando SQL
Subconsultas, índices y vistas
Establecer operadores
Crear tablas y vistas usando Proc SQL

Lectura y manipulación de datos

Lectura de conjuntos de datos SAS
Lectura de datos de Excel
Leer archivos sin procesar
Lectura de datos de la base de datos
Crear informes resumidos
Combinando conjuntos de datos

Macros

Macro variables automáticas
Variables de macro definidas por el usuario
Referencia de variables macro
Definiendo y Llamando Macros
Parámetros Macro
Tablas de símbolos globales y locales
Variables macro en el paso de datos

Proyecto

Almacenar análisis de datos en SAS
ETL, análisis e informes utilizando SAS

Tableau y preparación laboral

Tableau Basic

Introducción a la visualización
Trabajando con Tableau
Visualización en profundidad
Organización de datos
Visualización avanzada
Cartografía
Cuadros de mandos empresariales
Presentación de datos

Mejores prácticas para el tablero de embarque e informes y estudios de caso

Tener una metodología
Conoce a tu audiencia
Definir acciones resultantes
Clasifica tu tablero
Perfile sus datos
Use las características visuales correctamente
Diseñe iterativamente

Entrevistas simuladas

Reanudar la construcción y la preparación de la entrevista
Entrevistas simuladas 1: 1 con veteranos de la industria
Borrar la ronda técnica de entrevistas
Darle confianza para enfrentar escenarios del mundo real

Presentación o actualización del proyecto grupal

AULA: los grupos presentan su presentación del proyecto frente a sus pares y los expertos de la industria evalúan la solución
EN LÍNEA: Actualización en el dominio

Obtenga acceso las 24 horas del día, los 7 días de la semana, a su material del curso en nuestro sistema de gestión de aprendizaje de vanguardia; acceso extendido a todo el material del curso después de que finalice el lote, y una línea directa dedicada para estudiantes con soporte 24/7 para ayudar a resolver consultas.

Neelima Vobugari

¡Ven y forma parte de SkewData Data Science Batch!

Queridos amigos,

Estoy seguro de que la mayoría de ustedes saben que Data Science se ha convertido en una de las corrientes más buscadas y se fortalecerá en un futuro próximo. El informe de la Harvard Business School califica a Data Scientist como el trabajo más sexy del siglo XXI. Entonces, si está planeando una carrera en Data Science, SkewData lo invita a sus clases de Data Science. La experiencia académica de SkewData ha diseñado un curso altamente confiable para ayudarlo a comenzar a explorar Data Science paso a paso con ejemplos de análisis en tiempo real. Minería de datos, modelado y visualización.

Para ayudar a los desarrolladores y entusiastas de la tecnología como SkewData, ha diseñado su programa para profesionales que trabajan. , Las clases se organizarán los fines de semana (sábado / domingo de 2 a 5 p. M. Provisionalmente)

· 22 clases (25 de febrero al 6 de mayo) de capacitación dirigida por un instructor. Clases de fin de semana

· Grabación de video disponible

· Proyectos enfocados en múltiples industrias como parte del curso.

· Práctica práctica en sesiones de laboratorio.

. Asientos limitados disponibles.

1st Floor Evoma LA DIRECCIÓN,

Por encima del Dr. Lal PathLabs

Sy. No. 17/1, carretera de circunvalación exterior, frente al parque Prestige Cessna,

Kadubeesanahalli, Bangalore

Para obtener más información, visite – SkewData .

Neelima Vobugari

No hay límite para el contenido de este dominio. El dominio de la ciencia de datos está evolucionando cada día. Hay muchos investigadores en todo el mundo que investigan en áreas específicas de este dominio, por ejemplo, el profesor Hinton investigó y publicó un artículo sobre cápsulas en aprendizaje profundo hace solo unos meses.

Por lo tanto, depende de lo que esté buscando exactamente. El plan de estudios para un curso específico de una universidad específica puede ser limitado, pero el contenido de este campo está creciendo a un ritmo muy alto.

Desde la perspectiva del aprendizaje, puede consultar http://analyticsvidhya.com, ya que han descubierto algunas pistas de aprendizaje de la ciencia de datos.

DataToBiz

Un programa de estudios de ciencia de datos generalmente considera todas las etapas del ciclo de vida del procesamiento de datos.

Preprocesamiento de datos

Imputación de datos

Limpieza de datos

Transformación de datos

Visualización de datos

Análisis de los datos

Ingeniería de datos – Big Data

De estos, el análisis de datos forma el fragmento con una cobertura de todos los algoritmos de aprendizaje automático: regresión, agrupación, análisis de la cesta de la compra, clasificación y análisis de redes y sistemas de recomendación.

Un lenguaje de programación como R o Python y todos los paquetes relacionados con tareas de datos anteriores se enseñan en dicho programa.

Vishal Gangurde

Debe tener conceptos básicos en álgebra lineal. El libro de Gilbert Strang es muy bueno.

Conceptos básicos de probabilidad y estadística.

Aprenda lenguaje de programación como python, R ..

Visite el sitio web de kaggale y siga el ejemplo.

Debe tener una buena comprensión de dos o tres algoritmos de aprendizaje automático.

Nirmal Patel

More Interesting

¿Cómo se utilizan los grandes datos en la industria del petróleo y el gas? La industria del petróleo y el gas ya contaba con sistemas de adquisición de datos e informes implementados para la producción y el mantenimiento. ¿Qué nivel adicional de gestión de datos proporciona Big Data?

¿Cuántos desarrolladores tiene la empresa Tableau?

¿Qué importancia tienen los datos en UPSC CSE? ¿Cómo memorizo un tramo tan enorme de fechas y datos?