Cómo organizar una buena competencia relacionada con el aprendizaje automático o la ciencia de datos

Depende de lo que quieras decir con bueno … Tenemos consejos en nuestro sitio web ChaLearn.

También di algunas respuestas en la publicación:

¿Cuáles son los mayores cuellos de botella en la organización de los desafíos de LA?

A menudo, las personas miden el éxito de una competencia por el número de participantes. En ese sentido, el desafío Higgs Boson es la competencia más exitosa que coorganicé (más de 1700 participantes). La receta fue: un problema con alta visibilidad (el Bosón de Higgs ha estado en todas las noticias), patrocinado por una organización de alto perfil (CERN), formulado como un problema que no requiere conocimiento del dominio, con un documento que explica los antecedentes, y un código de muestra para comenzar en minutos. Tenga en cuenta que la cantidad de premios en efectivo no es un factor importante en el éxito de un desafío.

Otras dimensiones de la “bondad” de un desafío incluyen:

  • si los resultados son estadísticamente significativos,
  • si los resultados son sólidos y concluyentes,
  • si el resultado tiene un impacto duradero.

La importancia estadística se logra fácilmente con conjuntos de datos lo suficientemente grandes (pero esta no es la norma), la solidez se logra con mucho cuidado, incluidas las pruebas beta (muchos desafíos, incluso los más populares, han estado plagados de problemas de fuga de datos). La conclusión es una de las más difíciles: tiene que ver con la buena formulación de la pregunta formulada y no se revela hasta que se analiza el desafío. El impacto duradero es difícil de medir. Nuestro primer desafío en la selección de funciones ha tenido un impacto duradero, aunque no fue particularmente concluyente 🙂 Pero, son solo 10 años en el futuro que puedes saber esto …

More Interesting

¿Cómo se hacen los servidores de la computadora?

¿Es fácil hacer que el centro de Bhopal sea bueno para GATE (informática)?

La inteligencia artificial y la robótica están progresando a un ritmo cada vez mayor. ¿Qué debe hacerse para la fuerza laboral desplazada?

¿Recomiendas estudiar el enfoque bayesiano hacia el aprendizaje automático?

¿Cómo la IA puede ser útil en las pruebas?

¿Podría probar que P = NP también es un problema de NP?

¿Cómo dibuja una línea en la pantalla un programa de gráficos por computadora? Del código de alto nivel al nivel de la tarjeta gráfica, ¿qué sucede?

¿Qué necesito saber para construir una IA genérica?

¿Cómo funcionan realmente las tablas de arcoiris y el hash?

¿Qué cosas puedo hacer con una computadora poderosa?

¿Cuáles son las ventajas y desventajas de trabajar en una división de investigación frente a una división que no es de investigación en una gran empresa de software?

¿Cómo aprender ciencia de datos de una manera eficiente en el tiempo? La ciencia de datos es un campo amplio. ¿Cuál es el '20% 'del tema que puedo dominar para darme el '80%' del valor?

¿Cuáles son las diferencias entre una supercomputadora y una informática distribuida (como Amazon Cloud o Google Data Center o Hadoop)?

¿Cómo aprender análisis de datos con aprendizaje automático / minería de datos? ¿Están relacionadas la minería de datos y el aprendizaje automático?

¿Es mejor trabajar en una aplicación para algoritmos de aprendizaje automático (por ejemplo, biología computacional), en lugar de trabajar en ML central, ya que el campo ya está maduro y hay menos espacio para mejorar?