¿Podrá Kaggle sobrevivir a la explosión en la industria del software de análisis? La tecnología cambia la vida futura

En mi opinión, la mayor amenaza para Kaggle no es el creciente mercado de herramientas. De hecho, las herramientas son excelentes, ya que siempre será necesario que las personas las operen (a menos que alguien construya IA general, por supuesto). La mayor amenaza para Kaggle es su propia incapacidad para resolver los problemas de los clientes.

¿Alguna vez ha escuchado historias exitosas de clientes sobre el uso de Kaggle? Claro, algunos grandes clientes como Netflix o Facebook contratan ganadores, pero este mercado es relativamente pequeño y hay mucho más que la capacidad de obtener un puntaje alto en la tabla de clasificación que lo convierte en una buena contratación.

Nunca vi a Kaggle revelar esta estadística, pero estoy bastante seguro de que el 0% de los modelos ganadores se usaron en la producción. Se tomaron prestadas algunas ideas, se contrató a algunas personas, pero Kaggle aún es incapaz de resolver las necesidades comerciales de sus clientes, es decir, proporcionar cursos de capacitación y predicción.

Se alienta a los usuarios de Kaggle a usar las herramientas que quieran y cualquier hardware al que tengan acceso con el único objetivo de obtener pequeños detalles de precisión. No se hacen preguntas sobre cuánto tiempo llevó entrenar el modelo ganador, cuántas máquinas se usaron o cuán difícil sería mantenerlo. Esto es ideal para los usuarios, ya que pueden probar los últimos complementos R, scikitlearn, aprendizaje profundo, lo que sea, todo unido en un bosque aleatorio o combinado de alguna otra manera incomprensible. ¿Es bueno para los clientes? No lo creo El cliente hace el trabajo duro de recopilar datos, paga dinero, espera varios meses y termina con una pieza de código horrible que nadie excepto el autor puede ejecutar, y mucho menos mantener.

Y volviendo a la cuestión de las herramientas. Las herramientas realmente pueden ayudar a Kaggle. Si logran proporcionar un conjunto de herramientas estándar y una evaluación justa de los modelos en función del tiempo de capacitación y predicción, así como la precisión, brindan herramientas para que los clientes produzcan los modelos ganadores, entonces pueden tener éxito.

Análisis PredictivoCiencia de datosKaggle