¿Podrá Kaggle sobrevivir a la explosión en la industria del software de análisis?

En mi opinión, la mayor amenaza para Kaggle no es el creciente mercado de herramientas. De hecho, las herramientas son excelentes, ya que siempre será necesario que las personas las operen (a menos que alguien construya IA general, por supuesto). La mayor amenaza para Kaggle es su propia incapacidad para resolver los problemas de los clientes.

¿Alguna vez ha escuchado historias exitosas de clientes sobre el uso de Kaggle? Claro, algunos grandes clientes como Netflix o Facebook contratan ganadores, pero este mercado es relativamente pequeño y hay mucho más que la capacidad de obtener un puntaje alto en la tabla de clasificación que lo convierte en una buena contratación.

Nunca vi a Kaggle revelar esta estadística, pero estoy bastante seguro de que el 0% de los modelos ganadores se usaron en la producción. Se tomaron prestadas algunas ideas, se contrató a algunas personas, pero Kaggle aún es incapaz de resolver las necesidades comerciales de sus clientes, es decir, proporcionar cursos de capacitación y predicción.

Se alienta a los usuarios de Kaggle a usar las herramientas que quieran y cualquier hardware al que tengan acceso con el único objetivo de obtener pequeños detalles de precisión. No se hacen preguntas sobre cuánto tiempo llevó entrenar el modelo ganador, cuántas máquinas se usaron o cuán difícil sería mantenerlo. Esto es ideal para los usuarios, ya que pueden probar los últimos complementos R, scikitlearn, aprendizaje profundo, lo que sea, todo unido en un bosque aleatorio o combinado de alguna otra manera incomprensible. ¿Es bueno para los clientes? No lo creo El cliente hace el trabajo duro de recopilar datos, paga dinero, espera varios meses y termina con una pieza de código horrible que nadie excepto el autor puede ejecutar, y mucho menos mantener.

Y volviendo a la cuestión de las herramientas. Las herramientas realmente pueden ayudar a Kaggle. Si logran proporcionar un conjunto de herramientas estándar y una evaluación justa de los modelos en función del tiempo de capacitación y predicción, así como la precisión, brindan herramientas para que los clientes produzcan los modelos ganadores, entonces pueden tener éxito.

More Interesting

¿Qué libro recomienda para aprender sobre todas las habilidades matemáticas que se necesitan para la ciencia de datos para alguien que esté familiarizado con las estadísticas básicas y las matemáticas?

¿Qué no enseñan los bootcamps de ciencia de datos?

¿Cuándo explotará la burbuja de ciencia de datos?

¿Con qué frecuencia se usa el paralelismo en la ciencia de datos?

Cómo seguir creciendo como analista de datos

¿Qué trabajos son más abundantes, puestos actuariales o puestos de ciencia de datos? ¿Requiere esto último un título de maestría o superior?

Cómo anonimizar datos de búsqueda de usuarios con machine learning

Qué tan bien se traduce la economía de pregrado (y algunas estadísticas) a trabajar en ciencia de datos. ¿Qué posición (es) debo considerar?

¿Por qué mi CNN proporciona una buena precisión en los datos de entrenamiento y prueba (división 80-20 del total de datos de entrenamiento) pero falla miserablemente en los datos de validación (no vistos)?

¿Por qué es importante el núcleo en los algoritmos de aprendizaje automático, como SVM o k-NN?

¿Cómo puede afectar el uso de videos a la industria de big data?

¿El puesto de gerente de operaciones y logística en Uber es un buen trabajo para un aspirante a científico de datos?

Soy un ingeniero de datos al año fuera de la escuela que gana 65k, ¿qué debo esperar para ganar sueldo después de 5 años?

Para alguien que esté interesado en la "Ciencia de datos", ¿sería más útil una clase sobre combinatoria o procesos estocásticos?

Para convertirse en un científico de datos, ¿en qué campos son los más útiles?