¿Vale la pena organizar un concurso de dinero de Kaggle?

Depende de tus objetivos.

1) Un modelo predictivo preciso (probablemente mejor que el interno): un concurso de Kaggle podría funcionar.
Advertencia: esto no significa que el modelo sea implementable o obtendrá lo que el algoritmo realmente “explica / significa”

2) Comprender / resolver un problema de negocios usando crowdsourcing: es poco probable que un concurso de Kaggle ayude mucho … Sugeriría buscar un modelo más flexible.
Esto me pareció interesante … ¿Alguien ha usado tanto Kaggle como CrowdANALYTIX para concursos de análisis de datos? ¿Cuáles son los pros y los contras de ambas plataformas?

3) Experimentar con análisis de crowdsourcing: simplemente no piense que Kaggle ofrece valor. Personalmente, me gustaría algo que reduzca mi riesgo y pago solo si realmente veo que trae nuevas ideas (un modelo de pago por rendimiento), algunas ideas sobre los modelos de precios aquí, ¿hay un sitio web similar a Kaggle sin una tarifa mínima por ¿competencia?
También eche un vistazo a ¿Cuáles son algunas alternativas a Kaggle?

¡Espero que esto ayude!

Análisis PredictivoAprendizaje automáticoCiencia de datos

¿Cuál es un instituto de capacitación en big data en Bangalore?

¿Cuál es un ejemplo de cómo usaste la ciencia de datos para resolver un problema, tomar una decisión u optimizar algo en tu vida personal?

¿Cuál es el valor de los datos? A medida que las empresas recopilan los datos de los consumidores, ¿cómo pueden los economistas calcular el valor de estos datos?

¿Qué es mejor: Metis o información para el campo de entrenamiento de ciencia de datos?

¿Cómo se pueden aplicar los grandes datos a los pronósticos económicos?

¿Por qué es importante el núcleo en los algoritmos de aprendizaje automático, como SVM o k-NN?

El dinero no es un problema, el tiempo empleado puede serlo. Una formulación de un mal problema puede reducirlo, una respuesta sorprendente puede dar un retorno de diez veces.

Busqué en un concurso de Kaggle por un problema de aprendizaje automático en un proyecto que estaba planeando. Después de obtener una cotización de Kaggle, descubrí que su tarifa, el dinero del premio y el tiempo que me llevaría supervisar la competencia y responder las preguntas de los concursantes tendría un costo igual a 5-6 semanas hombre en mi propia compañía. Dado que mi propia estimación para atacar el problema era de 4 a 5 meses, Kaggle habría proporcionado una buena relación calidad-precio.

Una posible desventaja de una competencia de Kaggle es pasar mucho tiempo teniendo que explicar su campo en detalle a los recién llegados antes de que puedan hacer una contribución significativa al aprendizaje automático. Una buena solución puede ser inviable en la práctica si los concursantes no conocen los supuestos y las limitaciones de los datos. El concurso podría volverse inútil si no ha hecho suficientes iteraciones sobre la formulación del problema.

Una posible ventaja de una competencia es obtener una solución o información que usted o su empresa nunca podrían haber alcanzado por su cuenta. Tal creatividad puede ser más común en las competiciones de crowdsourcing que no corren contra una métrica establecida como lo hace Kaggle, pero Kaggle también puede aportar ideas.

El proyecto nunca tuvo éxito, por razones no relacionadas, pero si tuviera que retomarlo hoy, probablemente consideraría si una competencia contra un conjunto de pruebas como en las competencias de Kaggle era la mejor manera de seleccionar un ganador, o si yo debería ir por una lluvia de ideas más abierta al crowdsourcing en Innocentive. (Aunque creo que son más caros)

Anónimo

More Interesting

Como científico de datos, ¿es mejor especializarse en la recopilación o el análisis de datos?

¿Cuáles son las compañías de análisis / ciencia de datos que pagan mucho en Bangalore?

¿Cómo es más útil el Big Data que otros conjuntos de datos?

¿Cómo se usa el SNA (Social Network Analysis) para combatir el fraude o las transacciones fraudulentas?

¿Cuáles son los temas más importantes para un futuro estadístico?

¿Cuál es la maldición de los grandes datos?

¿Por qué la gente está tan loca por Hadoop?

¿Cuál es el escenario actual / las perspectivas futuras de la ciencia de datos en la India en comparación con Silicon Valley?

Cómo implementar big data como Quora en mi sitio web para mostrar solo cosas interesadas por el usuario

¿Cómo y de qué sitios web y libros puedo aprender en profundidad los conceptos de ciencia de datos para prepararme para el nivel de entrevista?