¿Qué tan grande será el mercado para el modelado de datos de crowdsourcing? ¿Qué sectores se beneficiarán más? ¿Qué tipos de expertos se ganarán la vida compitiendo en estos sitios en el futuro?

Creo que el mercado será muy significativo. El análisis predictivo de datos no es una ciencia bien entendida por la mayoría de las empresas, aunque muchas podrían beneficiarse de ella. Ya es una industria de muchos miles de millones de dólares a pesar de estar restringida principalmente a las empresas más grandes.

Y con la cantidad de datos creados en el mundo, estos problemas y oportunidades solo crecerán a una tasa de crecimiento increíble.

Creo que el crowdsourcing de esta industria tiene mucho sentido por varias razones simples:

  1. Más rápido : las empresas obtendrán respuestas / algoritmos más rápido que en la empresa
  2. Mejor : Kaggle ya ha demostrado que su red puede vencer a los algoritmos establecidos que han estado vigentes durante más de 10 años.
  3. Más barato : no puede competir con el costo del crowdsourcing.

Entonces, preguntas si es solo un pasatiempo para los participantes y no pueden ganar dinero real. Creo que este es un problema temporal. El hecho es que las empresas pagarán MUCHO dinero por modelos predictivos precisos (piense en los seguros). Descubrir el modelo de pago correcto para los participantes es todo lo que queda, y pagar solo al ganador $ 10k pero no recompensar a todos los demás participantes definitivamente no es el modelo correcto. Esto es solo cuestión de tiempo para resolverlo. El dinero está ahí: los expertos recibirán un pago generoso.

Y el comentario final, la belleza del crowdsourcing es que tiendes a obtener contribuciones de las personas y lugares más improbables, podría ser un profesor en Moscú, un ingeniero químico en la selva amazónica o un genio de 14 años en la escuela secundaria. Y esa es la belleza: no sabemos quién será el próximo en descifrar algún código y tener una idea brillante. ¡Viva #crowdsourcing!

Utilicé TopCoder, el líder en desarrollo de SW de fuentes múltiples para tener una idea del mercado potencial para el análisis de fuentes múltiples. Aquí hay algunos datos interesantes sobre TopCoder:

  • Establecido en noviembre de 2000. Entregó entre 2000 y 2009 $ 20 millones en premios.
  • Los ingresos de 2006 son de $ 14 millones, los ingresos de 2007 son de $ 18.31 millones, los ingresos de 2008 son de $ 18.75 millones y los ingresos de 2009 son de $ 8.44 millones. [Los ingresos de 2009 cayeron debido a la Gran Recesión]
  • Un puñado de desarrolladores ganan hasta $ 300K. El 5% de los desarrolladores ganan el 80% del dinero del Premio.
  • TopCoder ha desarrollado una plataforma de servicio completo para el desarrollo SW de abastecimiento público. Todas las tareas en el proceso de desarrollo a partir de la obtención de especificaciones se realizan en función del abastecimiento colectivo.
  • TopCoder también tiene una gran biblioteca de componentes SW reutilizables que están a disposición del cliente.

Con razón o sin ella, utilicé TopCoder para obtener un límite en el mercado de análisis de datos de Crowd-origin. Supongo que dentro de 5-6 años, una compañía que sigue el modelo de análisis de datos de Crowd-origin puede ver $ 10 millones en ingresos y puede disparar por una valoración de $ 100- $ 150 millones. También creo que estoy siendo muy optimista aquí. Algunos otros puntos a tener en cuenta son, puede que no sea fácil para la empresa anterior desarrollar una biblioteca reutilizable y puede que no sea fácil para las empresas clientes integrar la solución ganadora, que a menudo son modelos de mezcla esotérica que implican múltiples algoritmos y están escritos en R.
Según las estadísticas de TopCoder, es posible que los científicos de datos de Europa del Este o China puedan ganarse la vida basándose únicamente en sus ganancias.
Aquí hay otro punto de datos para tener una idea sobre este mercado: Opera Solutions. Opera Solutions es una compañía de servicios de consultoría completa (como la McKinsey of Analytics) que emplea a 600 personas, incluidos 150 científicos de grado avanzado y que obtuvo ingresos de más de $ 100 millones en 2011. Recientemente cerró una ronda de financiación de $ 84 millones que valoró a $ 500 millones. La valoración relativamente baja teniendo en cuenta los ingresos considerables se debe al hecho de que las empresas de consultoría suelen tener múltiplos bajos.
Entonces, para resumir esta publicación bastante larga, mi opinión es que las compañías que juegan en este sector probablemente no se convertirán en potencias de mil millones de dólares (capitalización de mercado) y probablemente serán jugadores de nicho.