¿Cuáles son algunas bibliotecas de software para el aprendizaje a gran escala?

Fuente abierta:

  • Netlib / Scalapack: http://netlib.org/liblist.html
  • ScalaNLP y brisa
  • Theano
  • dmlc / xgboost
  • NAG: http://www.nag.co.uk/numeric/fd/…
  • Nvidia presenta CuDNN, una biblioteca basada en CUDA para redes neuronales profundas
  • PredictionIO
  • Biblioteca de red probabilística PNL de Intel y PNL | ITLab Lobachevsky Universidad Estatal de Nizhni Novgorod
  • refr – Reranker Framework (ReFr) – Google Project Hosting, sobre: ​​Un nuevo marco de código abierto para construir modelos de reorganización
  • parredHMMlib | Andreas Sand
  • SAMOA por yahoo
  • El proyecto PEQUEÑO: http://www.small-project.eu/
  • Descomponedor: http://code.google.com/p/decompo…
  • SuiteSparse: http://www.cise.ufl.edu/research…
  • SMMP: http://www.mgnet.org/~douglas/Pr…
  • SPARSEKIT: http://www-users.cs.umn.edu/~saa… (también http://www-users.cs.umn.edu/~saa…)
  • HEIGEN: http://www.cs.cmu.edu/~ukang/HEI…
  • MLbase
  • 0xdata / h2o
  • milakov / nnForge
  • http://deeplearning4j.org/
  • Kit de herramientas de Leon Bottou: http://leon.bottou.org/projects/sgd
  • MADlib: http://madlib.net/
  • BayesDB
  • Infer.NET
  • Factorizaciones matriciales: https://sites.google.com/site/ig…
  • VW: http://hunch.net/~vw/
  • Apache Mahout: http://mahout.apache.org/ (notas: www.cs.stanford.edu/~ang/papers/nips06-mapreducemulticore.pdf)
  • Pegasus: http://www.cs.cmu.edu/~pegasus/
  • Proyecto de datos BID por John Canny
  • VFML: http://www.cs.washington.edu/dm/…
  • Shogun: http://www.shogun-toolbox.org/
  • GraphLab: http://www.graphlab.ml.cmu.edu/p… (notas: http://metaoptimize.com/qa/quest…, a través de Danny Bickson y Joseph Turian)
  • iSAX: http://www.cs.ucr.edu/~eamonn/iS…
  • MOA: http://moa.cs.waikato.ac.nz/ (notas http://sourceforge.net/projects/…)
  • S4: http://s4.io/
  • LinAlg (Ruby): http://rubyforge.org/projects/li…
  • dlib: http://dlib.net/ (notas: http://jmlr.csail.mit.edu/papers…)
  • Tiburón: http: //shark-project.sourceforge…
  • Borealis: http://www.cs.brown.edu/research…
  • Hama: http://incubator.apache.org/hama/
  • PSVM: http://code.google.com/p/psvm/ (a través de Joseph Misiti)
  • LibCVM: http://www.cse.ust.hk/~ivor/cvm…. (a través de Joel Hoff)
  • El proyecto TLD: http://info.ee.surrey.ac.uk/Pers…
  • LIBLINEAR: http://www.csie.ntu.edu.tw/~cjli…
  • SVMTorch: http://bengio.abracadoudou.com/S…
  • SVDPACK: http://www.netlib.org/svdpack/
  • StreamIt: http://groups.csail.mit.edu/cag/…
  • SENNA: http://ml.nec-labs.com/senna/
  • Biblioteca de aprendizaje automático de Spark (MLlib) (a través de Apache Spark: ¿la próxima gran cosa de datos?)
  • Spark-LIBLINEAR: Bibliotecas para la clasificación lineal a gran escala en entornos distribuidos
  • Elefante: http: //elefant.developer.nicta.c… (notas: http: //elefant.developer.nicta.c…)
  • Elefante / Stream: http://users.cecs.anu.edu.au/~jp…
  • SparseM: http://cran.r-project.org/web/pa… (a través de Josh Wills)
  • R / HPC: http://cran.r-project.org/web/vi… (a través de Dan Knoepfle)
  • R / ML: http://cran.r-project.org/web/vi…
  • SciPy: http://www.scipy.org/
  • SciKits: http: //scikit-learn.sourceforge….
  • Sage e IPython: http://www.sagemath.org/, http://ipython.scipy.org/moin/ (a través de Jameson Quinn)
  • NumPy, etc.: http://wiki.python.org/moin/Nume…, http://pypi.python.org/pypi?%3Aa…
  • ARPACK: http://www.caam.rice.edu/softwar…
  • ScaLAPACK: http://www.netlib.org/scalapack/
  • Implementaciones de BLAS: http://en.wikipedia.org/wiki/Bas…
  • uBLAS / Boost: http://www.boost.org/doc/libs/1_…
  • Eigen: http://eigen.tuxfamily.org/index…
  • ESPÍRITU: http://www.cs.cmu.edu/afs/cs/pro…
  • Scilab: http://www.scilab.org/projects/c… (a través de Aditya Sengupta)
  • Optimización no lineal de Java: ww1.fpl.fs.fed.us/optimization.html
  • Optimización paralela de Java: http: //www5.informatik.uni-erlan…
  • JAMA: http://math.nist.gov/javanumeric…
  • Octave Multicore: http://octave.sourceforge.net/mu… (a través de Jordi Arnabat)
  • Tesseract OCR: http://code.google.com/p/tessera…
  • Caja de herramientas de IBM Parallel ML: http://www.alphaworks.ibm.com/te…
  • Microsoft Sigma: http://research.microsoft.com/en…
  • http://mloss.org/software/
  • HPCC por LexisNexis: http://hpccsystems.com/
  • Caja de herramientas de Modelos gráficos: http://people.rit.edu/jcdicsa/JGMT/
  • Caja de herramientas de Lazy Learning: http://iridia.ulb.ac.be/~lazy/
  • Caja de herramientas de aprendizaje profundo: http://deeplearning.net/software…
  • Mortero: http://cseweb.ucsd.edu/~kyocum/s…
  • Debellor: http://www.debellor.org/
  • STXXL: http://stxxl.sourceforge.net/
  • Matlab Toolbox para la reducción de la dimensionalidad: http://homepage.tudelft.nl/19j49… (a través de Laurens van der Maaten)
  • CUDA: http://www.nvidia.com/object/cud…, http://www.nvidia.com/object/tes…
  • Lenguaje de datos Perl: http://pdl.perl.org/
  • PGPLOT: http://www.astro.caltech.edu/~tj…
  • Procesamiento: http://processing.org/
  • C5.0: http://rulequest.com/download.html
  • Spark: http://www.spark-project.org/
  • Bagel: https://github.com/mesos/spark/p…
  • StatStream: http://cs.nyu.edu/shasha/papers/…
  • OpenCV: http://opencv.willowgarage.com/w…
  • vecLib: http://developer.apple.com/hardw…
  • Netlab: http://www1.aston.ac.uk/eas/rese…
  • Numéricos de Java: http://math.nist.gov/javanumeric…
  • Matrix Toolkits para Java: http://code.google.com/p/matrix-…
  • Lista de software de análisis numérico: http://en.wikipedia.org/wiki/Lis…
  • PLASMA: http://icl.cs.utk.edu/plasma/ind…
  • Potro: http://acs.lbl.gov/software/colt/
  • Potro Paralelo: https://sites.google.com/site/pi…
  • Incanter: https://github.com/liebke/incanter/
  • Exuberante: http://lush.sourceforge.net/
  • Hal: http://www.umiacs.umd.edu/~hal/s…
  • Cython para cálculos numéricos: http://conference.scipy.org/proc…

Comercial:

  • Matlab distribuido: http://www.mathworks.com/product…
  • Microsoft / ISC Star-P: http://www.microsoft.com/pathway… (notas:
    http://beowulf.csail.mit.edu/18…. )
  • IBM InfoSphere: http://www-01.ibm.com/software/d…
  • API de predicción de Google: http://code.google.com/apis/pred… (notas: http://mark.reid.name/iem/predic…)
  • RapidMiner: http://rapid-i.com/content/view/…
  • Pentaho: http://www.pentaho.com/
  • Tableu: http://www.tableausoftware.com/
  • Servidor de pronóstico SAS: http://www.sas.com/technologies/…
  • Esper: http://www.espertech.com/
  • Streambase: http://www.streambase.com/
  • Oracle BI: http://www.oracle.com/us/solutio…
  • Tibco Spotfire: http://spotfire.tibco.com/
  • Oracle Data Mining: http://www.oracle.com/technetwor…, http://en.wikipedia.org/wiki/Ora…
  • Intel Math Kernel: http://software.intel.com/en-us/…
  • EigenDog: https://www.eigendog.com (gracias a Julien Verlaguet)

Laboratorios:

  • Boyd: http://www.stanford.edu/~boyd/so…
  • Franklin: http://www.cs.berkeley.edu/~fran…
  • Faloutsos: http://www.cs.cmu.edu/~christos/
  • Bontempi: http://mlg.ulb.ac.be/
  • Shalev-Shwartz: http://www.cs.huji.ac.il/~shais/…
  • NEC: http://www.nec-labs.com/research…
  • Seleccione: http://www.select.cs.cmu.edu/peo…
  • Shasha: http://cs.nyu.edu/shasha/papers/…
  • CBCB: http://www.cbcb.umd.edu/software/
  • Wendykier: https://sites.google.com/site/pi…
  • http://www.gpucomputing.net
  • http://www.cse.nd.edu/~ccl/

Otro:

  • Pregel: http: //googleresearch.blogspot.c…
  • ¿Alguien ha comenzado un proyecto Apache basado en el documento Pregel publicado recientemente por Google?
  • Bases de datos de gráficos: http://www.graph-database.org/ov…
  • Bases de datos NoSQL: http://nosql-database.org/
  • Kdb +: http://kx.com/kdb+.php
  • Paralelo de GNU: http://www.gnu.org/software/para…
  • Bloom: http://www.bloom-lang.net/
  • LinAlg: http://www.linalg.org/
  • Exuberante: http://lush.sourceforge.net/
  • Brainlab: http://www.interstice.com/~drewe…
  • El kit de herramientas de modelado de lenguaje SRI: http://www.speech.sri.com/projec… (a través de Jeff Dalton)
  • Yahoo LDA: https://github.com/shravanmn/Yah… (a través de Alex Smola http://blog.smola.org/post/63597…)
  • AppScale: http://code.google.com/p/appscal…
  • Bibliotecas científicas para Mac: http://www.atmos.washington.edu/…
  • Directorio de AI dmoz: http://www.dmoz.org/Computers/Ar…
  • Hilo de Metaoptimize en bibliotecas ML: http://metaoptimize.com/qa/quest…
  • Búsqueda de código de Google: http://www.google.com/codesearch…
  • http://www.jstatsoft.org/
  • http://hunch.net/?p=230
  • http://hpc.sourceforge.net/
  • http://stackoverflow.com/questio…
  • Java-matrix-benchmark: http://code.google.com/p/java-ma…
  • Gorila: Arquitectura de aprendizaje de refuerzo de Google

(Esta es una lista en vivo. Ediciones y adiciones son bienvenidas)