¿Dónde funcionará bien el aprendizaje automático como servicio? ¿Dónde no lo hará?

Esta es una gran pregunta y, como alguien que está trabajando en la construcción de la Plataforma ML de Quora y la infraestructura relacionada, lo pienso mucho.

Creo que hay dos segmentos de mercado muy diferentes para estos servicios de aprendizaje automático:

El primer segmento consiste en compañías como Macy’s y Walmart para las cuales la tecnología en general y ML en particular es solo un multiplicador de valor, pero no una competencia central. Estas compañías no tienen una densidad súper alta de talento de alta tecnología / ML y tienen problemas relativamente “más fáciles” donde las soluciones estándar / estándar funcionan “razonablemente bien”. Este segmento puede parecer aburrido para las personas que viajan en su caballo alto de Silicon Valley, pero creo que este es un segmento de mercado extremadamente grande e importante; después de todo, a medida que ML se generalice, la mayoría de las compañías importantes del mundo caerán en este segmento

Mi predicción es que veremos una avalancha de compañías SaaS que ofrecen varios aspectos de ML como servicio a este segmento de mercado. Algunos servicios de ejemplo:

  • Servicios de Blackbox que solo aceptan datos de entrenamiento arbitrarios como entrada y hacen predicciones
  • Entrenamiento de algoritmos estándar (especialmente entrenamiento distribuido)
  • Sirviendo modelos entrenados a partir de algoritmos estándar
  • Gestión de código ML / cuadernos (por ejemplo, repositorio de código, revisiones de código)
  • Gestión de canalizaciones de datos para ML
  • Monitoreo de la salida de modelos ML (por ejemplo, detección de anomalías)
  • Etiquetado de datos de capacitación (por ejemplo, Amazon Mechanical Turk + una capa de algoritmos de ML para ahorrar costos)
  • Servicios que venden datos de capacitación recopilados de varias fuentes no divulgadas

Además de estos, creo que surgirán al menos dos tipos más de compañías SaaS en torno al aprendizaje automático:

  1. Empresas que brindan escasa experiencia y asesoría humana (posiblemente junto con algunos de los servicios descritos anteriormente)
  2. Empresas que brindan servicios de predicción ML listos para usar en verticales muy específicos que pueden ser comercializados (por ejemplo, clasificación de imágenes, detección de spam, resumen de texto, navegación para automóviles autónomos, etc.). A diferencia de la mayoría de las empresas en el espacio ML SaaS, este tipo de empresas tendrá en realidad defensa contra la competencia, ya que sus sistemas serán mejores y más baratos con más datos y usuarios.

En general, creo que ML SaaS va a ser un espacio superpoblado y habrá servicios para cada aspecto en el ciclo de vida de un sistema de ML. Sin embargo, la mayoría de las empresas no tendrán un activo estratégico defendible, aunque disfrutarían de un efecto de bloqueo debido a los altos costos de cambio. En muchos sentidos, todo este espacio se parecerá mucho al espacio SaaS para soluciones de datos.


Por otro lado, las cosas se verán muy diferentes en otro segmento del mercado: compañías para las cuales la tecnología en general es una competencia central. Este segmento incluye las principales compañías tecnológicas como Google, Facebook, Amazon y Quora. Estas compañías querrán construir / operar la mayoría de sus sistemas de ML internamente por las siguientes razones:

  • ML a menudo podrá generar una ventaja estratégica significativa sobre sus competidores; como resultado, muchas de estas compañías querrán desarrollar una competencia central en torno a ML.
  • ML estará tan estrechamente integrado en sus productos que la distinción entre características de productos ML / no ML, código base, infraestructura e incluso desarrolladores se desvanecerá. Como resultado, querrán ejercer un gran control sobre los sistemas de ML para garantizar una estrecha integración.
  • Dado que la tecnología es su competencia principal, tales empresas generalmente tienen una alta densidad de talento tecnológico → en realidad les será posible construir muchos de estos sistemas de forma interna.
  • Incluso si comienzan con un servicio externo de ML, en cierta escala, sería más barato para ellos escribir el sistema internamente.

Si está interesado en más detalles, he descrito por qué una compañía como Quora puede querer construir y controlar su Plataforma ML en esta presentación:

Para ser claros, creo que veremos a las empresas en este segmento producir y consumir una gran cantidad de trabajo de alta calidad de código abierto. Sin embargo, mi opinión es que las compañías SaaS basadas en ML generalmente no tendrán mucho éxito en este segmento. En todo caso, estas compañías proporcionarán servicios de ML a otras compañías (por ejemplo, Amazon que ofrece reconocimiento de voz como servicio), posiblemente como parte de sus ofertas en la nube.

De cualquier manera, ¡tenemos un momento emocionante por delante!

Fuerte demanda de soluciones MLaaS basadas en la nube privada

Según el estudio, las soluciones MLaaS se implementan principalmente en la nube pública y en la nube privada. Entre los dos, la nube privada contribuye a la mayoría de los ingresos generados en el mercado global de MLaaS, ya que las empresas prefieren las soluciones de MLaaS basadas en la nube privada a sus contrapartes basadas en la nube pública debido a razones de seguridad de datos.

Descargue el folleto en PDF para conocer más información sobre el aprendizaje automático como industria de servicios 2017.

El mercado global de aprendizaje automático como servicio (MLaaS) está aumentando rápidamente debido principalmente a la revolución de Internet. El proceso de conectar el mundo prácticamente ha generado una gran cantidad de datos que está impulsando la adopción de soluciones de aprendizaje automático. Esto se debe a que la implementación del aprendizaje automático mejora la velocidad y la precisión de las funciones realizadas por el sistema.

Me gusta bastante Google Cloud Machine Learning como servicio. Y el cambio hacia plataformas sin servidor (como AWS Lambda) en general.

Pero específicamente Google Cloud ML. Todos conocen TensorFlow. Es un conjunto de herramientas comprobado.

Entonces te enfocas en eso y luego es mágicamente rápido y poderoso, y no te molestes en ajustar los hiperparámetros gracias a HyperTune.

Solo concéntrate en el razonamiento, haz que pruebe un montón de mierda y descubra qué funciona.

Eso es una cosa hermosa. Y es relativamente barato.

Las cosas se moverán en esa dirección. Casi todo lo hará a la larga.

Si puede hacer algo así y vender el acceso a él de manera muy económica, básicamente eso es todo. Google todavía no está a un precio muy bajo, no creo, en relación con otras API, pero llegará allí. Es barato de usar, pero no extremadamente barato.

La gente construirá cosas encima y venderá acceso a eso. La gente ya tiene. Instalará sus aplicaciones móviles y sus juegos y sus bots en modelos preconstruidos, o los que usted mismo haga.

Este es uno de esos momentos agradables donde el futuro está aquí, así que ve a divertirte con él.

La adopción de tecnologías analíticas avanzadas de varios sectores de la industria, como la salud y las ciencias de la vida, BFSI, comercio minorista, telecomunicaciones y fabricación, está contribuyendo al crecimiento del aprendizaje automático como mercado de servicios. Las soluciones de aprendizaje automático como servicio también se adoptan en los sectores verticales de la industria para mejorar la capacidad de toma de decisiones de las máquinas.

Conozca más sobre MLAAS [correo electrónico protegido] Transparencia Market Research

Cuidado de la salud y ciencias de la vida Segmentos de uso final líderes debido a la digitalización de registros de pacientes

Fabricación, venta minorista, telecomunicaciones, salud y ciencias de la vida, BFSI y otros son los segmentos en los que el mercado global de aprendizaje automático como servicio se clasifica en función del uso final. De ellos, el segmento de la salud y las ciencias de la vida es el principal contribuyente al mercado, principalmente debido a la creciente necesidad de aprendizaje automático en el sector para integrar datos estructurados y no estructurados. Los datos generados son principalmente de registros de salud electrónicos (EHR), datos genómicos y de reclamos.

La industria de la salud y las ciencias de la vida seguirá siendo el usuario final líder de MLaaS

La fabricación, el comercio minorista, las telecomunicaciones, la atención médica y las ciencias de la vida, BFSI y varios otros sectores, como la energía y los servicios públicos, la educación y el gobierno, son los usuarios finales clave del aprendizaje automático como servicio en todo el mundo. Entre estos, el segmento de la salud y las ciencias de la vida se ha convertido en el contribuyente clave de este mercado, gracias a la creciente necesidad de aprendizaje automático en este sector para integrar los datos estructurados y no estructurados, especialmente los datos generados por el registro electrónico de salud (EHR) y los datos genómicos y de reclamos.

Conozca más sobre las tendencias y pronósticos de mercado de MLAAS: Investigación de mercado de transparencia

En los próximos años, se anticipa que la demanda de MLaaS aumentará sustancialmente en otras industrias de uso final, específicamente en BSFI, comercio minorista, telecomunicaciones y fabricación, a fin de mejorar la capacidad de toma de decisiones de las máquinas utilizadas en estas industrias.

Algunos casos en los que el aprendizaje automático como servicio ya funciona bien o podría funcionar bien:

  • Escalar un modelo a conjuntos de datos más grandes y máquinas más grandes
  • Estandarizar conjuntos de datos de uso común de diferentes proveedores (por ejemplo, poner conjuntos de datos de oficinas de calificación crediticia en un formato común)
  • Coincidencia / deduplicación basada en información parcial, por ejemplo, descubrir que Kate Thompson, que vive en 113 Willow Street, es la misma persona que Katherine Thomson, que vive en 113 Willow Road.
  • Filtrado de spam
  • Detección de fraude / anomalía

Algunos casos donde tiende a fallar:

  • Si no ha ejecutado con éxito un modelo interno, probablemente no pueda usar un servicio de aprendizaje automático. Los servicios son mejores para tomar algo que funciona al 80% y aumentarlo al 95% o hacerlo más barato.
  • Si no sabe qué está tratando de hacer con sus datos, un servicio no puede decírselo. Esto puede parecer obvio, pero …
  • Permitir que alguien completamente no técnico use el aprendizaje automático. Si no comprende algunos de los conceptos básicos (que el aprendizaje automático utiliza datos de entrenamiento para aproximar una función de salida), hay demasiados detalles que se perderán que harán que un servicio sea inutilizable
  • Visualización. No es que esto sea difícil, es simplemente que es bastante innecesario: si puede construir un modelo internamente, puede hacer la visualización usted mismo
  • Pequeños conjuntos de datos. Los servicios a veces pueden ajustar un modelo para usted si tiene grandes conjuntos de datos, pero si desea aplicar el conocimiento del dominio, es mejor contratar a alguien en la empresa

El aprendizaje automático como servicio funciona bien en el siguiente sector:

  • Fabricación
  • Al por menor
  • Salud y ciencias de la vida
  • Telecom
  • BFSI
  • Otros (energía y servicios públicos, educación, gobierno, etc.)

Descargar PDF para más información

el aprendizaje automático funcionará en cualquier lugar y en cualquier lugar donde los eventos actuales tengan relevancia para el pasado, mientras que fallará en los eventos en los que el presente no está influenciado por el pasado o cualquier evento para el caso.

¿Aprendizaje automático como servicio?

¿Como en el vertido de datos completamente automatizado y obtener resultados sin tener que preocuparse por eso?

Probablemente no por un tiempo … si alguna vez. Puede requerir una IA dura.

More Interesting

¿Por qué las redes convolucionales profundas llegaron tan tarde?

¿Qué áreas de ciencia de datos o aprendizaje automático están creciendo en importancia?

Cómo aprender a limpiar datos usando R rápidamente

¿Quiénes son algunos investigadores notables del aprendizaje automático?

¿Cuáles son algunos marcos de tiempo realistas para dominar diversas habilidades de programación, como el dominio de Python para la ciencia de datos, git, etc.?

¿Cuál es la mejor opción, Machine Learning o codificación?

¿Cuáles son algunos proyectos que puedo hacer mientras aprendo aprendizaje automático?

¿Cuáles son las cosas divertidas que encontró en el procesamiento del lenguaje natural (PNL)?

El aprendizaje profundo hará que los humanos sean innecesarios para qué trabajos.

¿Cómo implemento un análisis de sentimiento a nivel de documento?

¿Cuál es la mejor manera de hacer reconocimiento / clasificación de múltiples objetos en tiempo real usando OpenCV y GPU (CUDA)?

¿Qué son los vectores de características basados ​​en cuadros (como se usan en el reconocimiento de voz)?

En la regresión logística multinomial, ¿por qué el valor p en la prueba de razón de probabilidad es significativo pero en las estimaciones de parámetros no es significativo para cada dimensión?

El problema de los bandidos armados múltiples discutido en el libro de Sutton y Barto, usa 2000 ensayos y 1000 jugadas. Cuál es la diferencia entre esto?

¿El aprendizaje automático es un campo sobresaturado?