¿Vale la pena organizar un concurso de dinero de Kaggle?

Depende de tus objetivos.

1) Un modelo predictivo preciso (probablemente mejor que el interno): un concurso de Kaggle podría funcionar.
Advertencia: esto no significa que el modelo sea implementable o obtendrá lo que el algoritmo realmente “explica / significa”

2) Comprender / resolver un problema de negocios usando crowdsourcing: es poco probable que un concurso de Kaggle ayude mucho … Sugeriría buscar un modelo más flexible.
Esto me pareció interesante … ¿Alguien ha usado tanto Kaggle como CrowdANALYTIX para concursos de análisis de datos? ¿Cuáles son los pros y los contras de ambas plataformas?

3) Experimentar con análisis de crowdsourcing: simplemente no piense que Kaggle ofrece valor. Personalmente, me gustaría algo que reduzca mi riesgo y pago solo si realmente veo que trae nuevas ideas (un modelo de pago por rendimiento), algunas ideas sobre los modelos de precios aquí, ¿hay un sitio web similar a Kaggle sin una tarifa mínima por ¿competencia?
También eche un vistazo a ¿Cuáles son algunas alternativas a Kaggle?

¡Espero que esto ayude!

El dinero no es un problema, el tiempo empleado puede serlo. Una formulación de un mal problema puede reducirlo, una respuesta sorprendente puede dar un retorno de diez veces.

Busqué en un concurso de Kaggle por un problema de aprendizaje automático en un proyecto que estaba planeando. Después de obtener una cotización de Kaggle, descubrí que su tarifa, el dinero del premio y el tiempo que me llevaría supervisar la competencia y responder las preguntas de los concursantes tendría un costo igual a 5-6 semanas hombre en mi propia compañía. Dado que mi propia estimación para atacar el problema era de 4 a 5 meses, Kaggle habría proporcionado una buena relación calidad-precio.

Una posible desventaja de una competencia de Kaggle es pasar mucho tiempo teniendo que explicar su campo en detalle a los recién llegados antes de que puedan hacer una contribución significativa al aprendizaje automático. Una buena solución puede ser inviable en la práctica si los concursantes no conocen los supuestos y las limitaciones de los datos. El concurso podría volverse inútil si no ha hecho suficientes iteraciones sobre la formulación del problema.

Una posible ventaja de una competencia es obtener una solución o información que usted o su empresa nunca podrían haber alcanzado por su cuenta. Tal creatividad puede ser más común en las competiciones de crowdsourcing que no corren contra una métrica establecida como lo hace Kaggle, pero Kaggle también puede aportar ideas.

El proyecto nunca tuvo éxito, por razones no relacionadas, pero si tuviera que retomarlo hoy, probablemente consideraría si una competencia contra un conjunto de pruebas como en las competencias de Kaggle era la mejor manera de seleccionar un ganador, o si yo debería ir por una lluvia de ideas más abierta al crowdsourcing en Innocentive. (Aunque creo que son más caros)

More Interesting

Como científico de datos, ¿es mejor especializarse en la recopilación o el análisis de datos?

¿Cuáles son las compañías de análisis / ciencia de datos que pagan mucho en Bangalore?

¿Cómo es más útil el Big Data que otros conjuntos de datos?

¿Cómo se usa el SNA (Social Network Analysis) para combatir el fraude o las transacciones fraudulentas?

¿Cuáles son los temas más importantes para un futuro estadístico?

¿Cuál es la maldición de los grandes datos?

¿Por qué la gente está tan loca por Hadoop?

¿Cuál es el escenario actual / las perspectivas futuras de la ciencia de datos en la India en comparación con Silicon Valley?

Cómo implementar big data como Quora en mi sitio web para mostrar solo cosas interesadas por el usuario

¿Cómo y de qué sitios web y libros puedo aprender en profundidad los conceptos de ciencia de datos para prepararme para el nivel de entrevista?

Cómo convertirse en un científico de datos, sin las habilidades necesarias

¿Dónde aprendo análisis de datos para un mejor trabajo?

¿Cuál es el futuro de la ciencia de datos en los próximos años? ¿Cómo es el mercado laboral en ciencia de datos para los graduados de nivel de entrada? ¿Es fácil de aprender, o necesitamos hacer más y más trabajo duro para conseguir un trabajo de nivel de entrada?

¿Cuáles son algunos algoritmos de aprendizaje automático que no pueden tolerar la falta de datos?

Con más de 50 años, ¿cuáles son mis posibilidades de convertirme en un científico de datos exitoso?