Esta es una gran pregunta y, como alguien que está trabajando en la construcción de la Plataforma ML de Quora y la infraestructura relacionada, lo pienso mucho.
Creo que hay dos segmentos de mercado muy diferentes para estos servicios de aprendizaje automático:
El primer segmento consiste en compañías como Macy’s y Walmart para las cuales la tecnología en general y ML en particular es solo un multiplicador de valor, pero no una competencia central. Estas compañías no tienen una densidad súper alta de talento de alta tecnología / ML y tienen problemas relativamente “más fáciles” donde las soluciones estándar / estándar funcionan “razonablemente bien”. Este segmento puede parecer aburrido para las personas que viajan en su caballo alto de Silicon Valley, pero creo que este es un segmento de mercado extremadamente grande e importante; después de todo, a medida que ML se generalice, la mayoría de las compañías importantes del mundo caerán en este segmento
- ¿Será la Universidad de Gotemburgo un buen lugar para estudiar el procesamiento del lenguaje natural con CLASP en camino?
- ¿Qué tema es importante para la ingeniería integrada, las redes neuronales o la automoción moderna?
- Cómo configurar Sublime Text para el entorno de Machine Learning
- ¿Cuál es el trabajo de investigación sobre aprendizaje automático más emocionante que Yoshua Bengio leyó en 2015?
- Cómo determinar la distribución que sigue un conjunto de datos
Mi predicción es que veremos una avalancha de compañías SaaS que ofrecen varios aspectos de ML como servicio a este segmento de mercado. Algunos servicios de ejemplo:
- Servicios de Blackbox que solo aceptan datos de entrenamiento arbitrarios como entrada y hacen predicciones
- Entrenamiento de algoritmos estándar (especialmente entrenamiento distribuido)
- Sirviendo modelos entrenados a partir de algoritmos estándar
- Gestión de código ML / cuadernos (por ejemplo, repositorio de código, revisiones de código)
- Gestión de canalizaciones de datos para ML
- Monitoreo de la salida de modelos ML (por ejemplo, detección de anomalías)
- Etiquetado de datos de capacitación (por ejemplo, Amazon Mechanical Turk + una capa de algoritmos de ML para ahorrar costos)
- Servicios que venden datos de capacitación recopilados de varias fuentes no divulgadas
Además de estos, creo que surgirán al menos dos tipos más de compañías SaaS en torno al aprendizaje automático:
- Empresas que brindan escasa experiencia y asesoría humana (posiblemente junto con algunos de los servicios descritos anteriormente)
- Empresas que brindan servicios de predicción ML listos para usar en verticales muy específicos que pueden ser comercializados (por ejemplo, clasificación de imágenes, detección de spam, resumen de texto, navegación para automóviles autónomos, etc.). A diferencia de la mayoría de las empresas en el espacio ML SaaS, este tipo de empresas tendrá en realidad defensa contra la competencia, ya que sus sistemas serán mejores y más baratos con más datos y usuarios.
En general, creo que ML SaaS va a ser un espacio superpoblado y habrá servicios para cada aspecto en el ciclo de vida de un sistema de ML. Sin embargo, la mayoría de las empresas no tendrán un activo estratégico defendible, aunque disfrutarían de un efecto de bloqueo debido a los altos costos de cambio. En muchos sentidos, todo este espacio se parecerá mucho al espacio SaaS para soluciones de datos.
Por otro lado, las cosas se verán muy diferentes en otro segmento del mercado: compañías para las cuales la tecnología en general es una competencia central. Este segmento incluye las principales compañías tecnológicas como Google, Facebook, Amazon y Quora. Estas compañías querrán construir / operar la mayoría de sus sistemas de ML internamente por las siguientes razones:
- ML a menudo podrá generar una ventaja estratégica significativa sobre sus competidores; como resultado, muchas de estas compañías querrán desarrollar una competencia central en torno a ML.
- ML estará tan estrechamente integrado en sus productos que la distinción entre características de productos ML / no ML, código base, infraestructura e incluso desarrolladores se desvanecerá. Como resultado, querrán ejercer un gran control sobre los sistemas de ML para garantizar una estrecha integración.
- Dado que la tecnología es su competencia principal, tales empresas generalmente tienen una alta densidad de talento tecnológico → en realidad les será posible construir muchos de estos sistemas de forma interna.
- Incluso si comienzan con un servicio externo de ML, en cierta escala, sería más barato para ellos escribir el sistema internamente.
Si está interesado en más detalles, he descrito por qué una compañía como Quora puede querer construir y controlar su Plataforma ML en esta presentación:
Para ser claros, creo que veremos a las empresas en este segmento producir y consumir una gran cantidad de trabajo de alta calidad de código abierto. Sin embargo, mi opinión es que las compañías SaaS basadas en ML generalmente no tendrán mucho éxito en este segmento. En todo caso, estas compañías proporcionarán servicios de ML a otras compañías (por ejemplo, Amazon que ofrece reconocimiento de voz como servicio), posiblemente como parte de sus ofertas en la nube.
De cualquier manera, ¡tenemos un momento emocionante por delante!