¿Qué marco de trabajo en el aprendizaje automático puede manejar grandes conjuntos de datos?

Sugeriría ver Apache Spark ™ – Computación en clúster ultrarrápida

Es una gran herramienta para Big Data en general e incluye MLlib | Apache Spark que permite trabajar con algoritmos de Machine Learning a gran escala. Lista de algoritmos presentados actualmente:

Máquina de vector de regresión logística y soporte lineal (SVM)
árbol de clasificación y regresión
bosque aleatorio y árboles impulsados por gradientes
recomendación a través de mínimos cuadrados alternos (ALS)
agrupación a través de k-medias, bisección de k-medias, mezclas gaussianas (GMM) y agrupación de iteración de potencia
modelado de temas a través de la asignación de Dirichlet latente (LDA)
análisis de supervivencia a través del modelo de tiempo de falla acelerado
descomposición de valor singular (SVD) y descomposición QR
análisis de componentes principales (PCA)
regresión lineal con L1, L2 y regularización de red elástica
regresión isotónica
Bayes ingenuo multinomial / binomial
extracción frecuente de conjuntos de elementos mediante reglas de asociación y crecimiento de FP
minería de patrones secuenciales a través de PrefixSpan
resumen de estadísticas y pruebas de hipótesis
transformaciones de características
evaluación del modelo y ajuste de hiperparámetros

Related Content

¿Cuáles son las mejores plataformas de ciencia de datos?

¿Hay algún lugar en la ciencia donde la biblioteca estadística de Python sea pobre o inmadura en comparación con R?

¿Cómo es un proyecto de visión por computadora "típico", de principio a fin?

¿Cuál es la mejor herramienta de aprendizaje automático para Mac OS?

¿Por qué el clasificador Bayes Network funciona tan bien como SVM con menos funciones que las que se usan con SVM?

Máquinas de factorización: ¿cómo hacen los FM para hacer predicciones y aprender?

¿Cuánto conocimiento sobre circuito (o VLSI) se necesita para investigar en el campo de la arquitectura de computadoras?

More Interesting

¿Por qué hay una compensación entre exploración y explotación en el aprendizaje por refuerzo?

¿Cuál es la diferencia entre adaboost y el clasificador de perceptrones de una capa?

¿Cómo califica Kaggle los envíos?

¿Cuál es el papel del análisis de datos exploratorios (EDA) en el aprendizaje automático?

¿Cómo funciona el CAPTCHA 'No soy un robot'?

¿Existen aplicaciones para bandidos multi armados en el campo de aprendizaje profundo?

En Data Science, ¿cuáles son algunos proyectos específicos de la industria del juego?

Cómo calcular gradientes en una red neuronal de avance utilizando matrices

Cómo usar SVM para clasificar imágenes normales y anormales si se conocen las características

¿Cuál es la relación de la función objetivo de muestreo negativo con la función objetivo original en word2vec?

¿Puede el desarrollador de hadoop aprender el aprendizaje automático?

Si no tengo experiencia en aprendizaje automático o investigación computacional, pero tengo antecedentes estadísticos, ¿es posible hacer investigación en esta área en la escuela de posgrado o hacer una pasantía?

¿Qué clasificador es el más adecuado para clasificar los signos en un video de lenguaje de señas?

¿Qué es más exigente, desarrollo de aplicaciones, aprendizaje automático, aprendizaje profundo, inteligencia artificial o IOT?

¿El trabajo de finanzas corporativas será reemplazado por aprendizaje automático?

Web Analytics