En mi opinión, la mayor amenaza para Kaggle no es el creciente mercado de herramientas. De hecho, las herramientas son excelentes, ya que siempre será necesario que las personas las operen (a menos que alguien construya IA general, por supuesto). La mayor amenaza para Kaggle es su propia incapacidad para resolver los problemas de los clientes.
¿Alguna vez ha escuchado historias exitosas de clientes sobre el uso de Kaggle? Claro, algunos grandes clientes como Netflix o Facebook contratan ganadores, pero este mercado es relativamente pequeño y hay mucho más que la capacidad de obtener un puntaje alto en la tabla de clasificación que lo convierte en una buena contratación.
Nunca vi a Kaggle revelar esta estadística, pero estoy bastante seguro de que el 0% de los modelos ganadores se usaron en la producción. Se tomaron prestadas algunas ideas, se contrató a algunas personas, pero Kaggle aún es incapaz de resolver las necesidades comerciales de sus clientes, es decir, proporcionar cursos de capacitación y predicción.
- ¿Cómo es Data Mining and Predictive Analytics, de Chantal d larose?
- ¿Cómo se puede pasar de la función de consultor de un MBB a la función de ciencias de datos?
- ¿Cuáles son las razones que explican que Random Forest funcione mejor que los métodos sin ensamblaje?
- ¿Puedo comenzar a aprender ciencia de datos y ser digno de mercado en 6 meses? Acabo de terminar mi maestría en ingeniería mecánica y tengo habilidades de programación muy básicas (solo C) a partir de ahora.
- ¿Es el Big Data el futuro? Actualmente estoy trabajando en Java con 1 año de experiencia. Estoy planeando cambiar mi dominio a big data. ¿Es aconsejable? En caso afirmativo, ¿qué paquete puedo esperar? ¿Seré tratado como más fresco? ¿Es necesaria la certificación?
Se alienta a los usuarios de Kaggle a usar las herramientas que quieran y cualquier hardware al que tengan acceso con el único objetivo de obtener pequeños detalles de precisión. No se hacen preguntas sobre cuánto tiempo llevó entrenar el modelo ganador, cuántas máquinas se usaron o cuán difícil sería mantenerlo. Esto es ideal para los usuarios, ya que pueden probar los últimos complementos R, scikitlearn, aprendizaje profundo, lo que sea, todo unido en un bosque aleatorio o combinado de alguna otra manera incomprensible. ¿Es bueno para los clientes? No lo creo El cliente hace el trabajo duro de recopilar datos, paga dinero, espera varios meses y termina con una pieza de código horrible que nadie excepto el autor puede ejecutar, y mucho menos mantener.
Y volviendo a la cuestión de las herramientas. Las herramientas realmente pueden ayudar a Kaggle. Si logran proporcionar un conjunto de herramientas estándar y una evaluación justa de los modelos en función del tiempo de capacitación y predicción, así como la precisión, brindan herramientas para que los clientes produzcan los modelos ganadores, entonces pueden tener éxito.