Última actualización de diciembre de 2015:
Varias personas han producido datos y paisajes de aprendizaje automático.
De Shivon Zilis – Machine Intelligence:
- ¿Cuál será el mejor proveedor de servicios en la nube para datos de IoT, aparte de AWS y Azure?
- ¿Cuál es el mejor software de contabilidad basado en la nube?
- Cómo elegir el mejor plan de alojamiento web para mi sitio web
- ¿Cuál es la mejor estrategia para maximizar la utilización de la CPU empresarial?
- ¿Cuánto me costará mensualmente amaws aws si tengo 3 instancias (3 T2 pequeñas) y tengo 10k usuarios / día y cada usuario consume datos de 3MB de mi nube de AWS?
De Matt Turck:
“Analytics” y “big data” incluyen una amplia gama de startups. Muchas startups usan big data debajo de sus aplicaciones, por supuesto, pero no están haciendo nada innovador en el frente de big data. Es útil restringir esta lista a las empresas que trabajan con una nueva tecnología, así como a proporcionar una nueva forma de servicio.
Las siguientes son algunas categorías sueltas y superpuestas …
Para inteligencia empresarial, generalmente más centrado en la accesibilidad a la nube y la facilidad de uso que en la escala de datos:
- Domo
- Pentaho
- Kognitio
- QlikTech: ya no es una startup, sino una empresa emergente en este espacio
- SiSense – gracias a Bruno Aziza a continuación
Para el análisis en la base de datos (big data, no tradicionalmente en la nube, a menudo utilizando innovaciones de base de datos en columnas, y últimamente, Hadoop):
- Datos de aster
- Calpont
- ParAccel – ahora debajo de RedShift de AWS
- Ciruela verde
- Netezza
- Vertica
Tenga en cuenta que esta ola de startups se han adquirido (todas menos una) en los últimos años … Todavía considero estas startups de etapa tardía a pesar de que son casos límite.
En lugar de incluir una lista de bases de datos mucho, mucho más larga, solo lo referiré aquí:
Para análisis avanzados (minería de datos, aprendizaje automático, modelado sofisticado, simulación):
- Analítica continua
- Databricks
- KNIME
- Paradigma4
- PiCloud
- PLOM.IO – comercializado como Epy.io – hermoso lanzamiento, buena causa!
- Precog – recientemente adquirido por RichRelevance
- Revolution Analytics
- Cielo arbol
- Ufora
- Yhat
Desde mi perspectiva en Ufora, el interés en las herramientas diseñadas para profesionales de análisis avanzado (codificadores, quants, investigadores, analistas, científicos de datos) se está calentando.
El análisis de regresión / clasificación / gráfico generalizado para aceptar datos únicos de una empresa, a veces con control guiado por GUI y menos codificación:
- Datos alpinos
- Alteryx
- Ayasdi
- BigML
- Contexto relevante
- Análisis de tormenta de lava
- Neo Technology
- tresata *: análisis predictivo automatizado
Para combinaciones de SQL / NoSQL / Hadoop (big data verdadero, procesamiento de datos a gran escala, capacidades analíticas avanzadas a menudo limitadas) en la nube:
- Actian
- Datameer
- Hadapt
- Inktank / Ceph
- Platfora
- Splice Machine * – “SQL en tiempo real en Hadoop”
- Zettaset
Herramientas NoSQL / Hadoop centradas en el desarrollador para gestionar big data:
- Cloudera
- Datastax
- Hortonworks
- Infochimps
- Karmasphere
- MapR
- Datos de mortero
- Qubole * – “UI intuitiva para colmena, cerdo y MapReduce”
- Rainstor
- Sqrrl * – usando Apache Accumulo
Para búsqueda, visualización de datos, minería de datos básica y herramientas predictivas; a menudo usando otras soluciones NoSQL:
- Sistemas de centrifugado
- Razonamiento digital
- EdgeSpring
- LucidWorks
- Palantir – crecido fuera de la fase de “inicio”
- Tableau: también creció fuera de la fase de “inicio”
- Trifacta * – fase de transformación de datos de ETL
Para el procesamiento de eventos complejos:
- StreamBase
Para paneles en tiempo real:
- Chartbeat
- Metamercados
- Ingresos visuales
- … mucho más en esta categoría
Infraestructura para web y móvil en tiempo real:
- Joyent – Equipo impresionante. Ingeniería inteligente Soy un fan.
Para hojas de cálculo de la nueva era:
- Permanente
… + muchos más. Esta categoría es un cementerio centrado en Excel y Google Docs.
Reventa de datos:
- DataSift
- Exversion
- Factual
- Quandl
- Topsy
GPU:
- Tecnologías SQREAM
Verticales específicos
Ad-Tech: plataformas del lado de la demanda
- Adchemy
- AppNexus
- PANTALLA DE MARCA
- DatXu
- Invitar a los medios
- Lucid Media
- MediaMath
- Triggit
- Giro
- X + 1
Ad-Tech: herramientas de optimización de marketing en línea
- Coremetrics
- Omniture
- RichRelevance
- Unica
Bio:
- Accelrys
- Affymetric
- Ariadne Genomics
- BioXpr
- DNAnexus
- Eagle Genomics
- Bioinformática de Ginebra
- IO Informática
- Genética Espiral
- Tecnologías de la vida
- Tripos Discovery Informática
Ingeniería / monitoreo de desempeño:
- Concurix
- … mucho mas.
Finanzas (con énfasis en FinTech):
También:
- 1010data
- Arialíticos
- QuantConnect
- Quantopian
Márketing:
- PivotLink
- Kontagent
- Clario
Otras listas de análisis y nuevas empresas de datos:
- 42 Startups de Big Data – Vote por los 10 mejores
- Colección de startups de datos en Pinterest
- Financiación de inicio de Big Data por proveedor
Mucho para agregar, incluidos algunos importantes. Si tengo una oportunidad, continuaré ampliando esta lista.
Algunos blogs útiles y estudios de mercado, aunque las startups son solo una parte de su enfoque:
El panorama de Big Data
Kurt Monash: http://www.dbms2.com/
Merv Adrian: http://blogs.gartner.com/merv-ad…
James Kobelius: http://blogs.forrester.com/blog/143
IDC: http://www.idc.com/
Intersect360: http://www.intersect360.com/
También vale la pena vigilar las firmas establecidas, por supuesto … Oracle, SAP (HANA), Microsoft, IBM (SPSS), SAS, MathWorks, MicroStrategy, MarkLogic, TIBCO, etc., y empresas consultoras como Opera Solutions, Mu Sigma Accenture McKinsey está desarrollando una práctica analítica avanzada.