¿Cuáles son algunos modelos matemáticos o técnicas estadísticas que son útiles para los científicos que trabajan con grandes datos?

Para el aprendizaje supervisado, las máquinas de vectores de soporte lineal (SVM) son excelentes para grandes datos porque pueden manejar funciones muy grandes
espacios y están garantizados para cubrir ya que son métodos convexos sin entrenamiento excesivo.
Pueden reducir un espacio de funciones masivo a algo más manejable. También paralelizan naturalmente
si haces el parámetro grid-search en paralelo.

Una limitación es que necesitan ejecutarse en la memoria, aunque con máquinas modernas puede obtener
64 GB de memoria y análisis de submuestra en datos muy grandes
Los algoritmos centrales pueden hacerse paralelos
en máquinas de memoria compartida (aunque no intentaría ejecutar tal cosa con Map_reduce en
su forma actual)

Ver, sin embargo, “Ampliar el aprendizaje automático”
http://www.cs.umass.edu/~ronb/sc…
para detalles sobre cómo escalar SVM y métodos relacionados a arquitecturas de memoria distribuida
Para el aprendizaje no supervisado, y para los métodos de datos puramente grandes que requieren reducción de mapas, son métodos no supervisados
como el Hashing sensible a la localidad (LSH) y las técnicas de proyección aleatoria relacionadas

Aprendizaje automáticoBig DataEstadística (disciplina académica)Lista de preguntasMatemáticas y Aprendizaje automáticoRegresión (estadística)

Related Content

¿Qué es una regresión logística condicional?

¿Cómo descifrar cualquier entrevista de aprendizaje automático? ¿Qué tipo de preguntas debo esperar? Qué tipos de proyectos paralelos relevantes se verían bien en un CV

¿Cómo es posible optimizar un sistema donde el entorno se modela a través de métodos de aprendizaje automático?

¿Cuál es la mejor manera de manejar un modelo multitarea si las etiquetas de datos de capacitación tienen NA, es decir, no se analizaron todas las muestras para todas las tareas?

¿Está bien usar software como scikit learn, tensorflow, keras y desarrollar aplicaciones sin profundizar en los conceptos matemáticos?

¿Cómo puedo diseñar una función hash que elija aleatoriamente 16 bits de un número de 32 bits?

¿Cómo funciona la transformación cuántica de Fourier?

escalado (normalización / estandarización), imputación de valores faltantes, re-muestreo, validación cruzada, reducción de dimensionalidad son solo algunas de las cosas con las que deberá familiarizarse, ya que se usan todo el tiempo.

También deberá estar familiarizado con la mayoría de las distribuciones disponibles:
Lista de distribuciones de probabilidad.

Brian Feeny

Diría que la reducción de dimensiones (PCA, Factor Analysis, etc.) está ahí arriba, especialmente si está trabajando con un conjunto de características muy grande, y eso lo está ralentizando o analíticamente no está seguro de lo que debería mirar. importante para la visualización y el análisis exploratorio de datos por las mismas razones.

Brian Feeny

More Interesting

¿Qué prueba estadística usar para cuantificar la similitud entre dos distribuciones cuando no son normales?

¿Funcionaría la búsqueda de 'colocaciones' de orden superior?

Data Science, Big Data, Machine Learning, ¿qué certificación debo hacer para cambiar la trayectoria profesional desde un entorno de control de calidad?

Con respecto al descenso de gradiente funcional, ¿qué significa minimizar un funcional con respecto a una función? Proporcione un ejemplo claro.

¿Estamos presenciando las primeras etapas del uso de ML en la industria o cree que la aplicación de ML hacia la industria ya está muy extendida?

¿Puedo usar el aprendizaje profundo para aprender el aprendizaje profundo?

¿Cómo debo comenzar con las redes neuronales recurrentes?

¿Qué hace que una red neuronal convolucional sea excelente?

¿Por qué las celdas LSTM tienen dos puertas de escritura?

¿Se puede usar un C ++ para el aprendizaje automático? Si es así, ¿qué tan bueno es en comparación con Python y R?

¿Cuál es la relación entre K-means y PCA?

¿Cómo aprendió Ajit Rajasekharan tanta PNL?

¿Cómo son útiles las redes neuronales convolucionales para las empresas e industrias normales?

¿Son útiles los procesos jerárquicos de Dirichlet en la práctica?

¿Cuál es una explicación intuitiva del algoritmo wake-sleep?

Web Analytics