Prefacio: Odio el guión, y estoy 100% predispuesto contra ellos. De hecho, dejé Kaggle cuando estaba en el puesto 12 en el ranking mundial, principalmente debido a cómo los guiones arruinaron mi diversión Kaggle.
Pros
- permite que se comparta más código de una manera simple para aquellos que quieren compartir y aquellos que quieren usar.
- Algo mejora la transparencia del código compartido, reduciendo el riesgo de que las personas queden excluidas de algún fragmento importante de código enterrado en alguna publicación oscura del foro.
- Supuestamente (según los partidarios de los guiones) ayudar a las personas a ponerse al día con Kaggle, ML y las competiciones y reducir la barrera de entrada
- Agrega una característica al sitio web de Kaggle que Kaggle puede vender como parte de su visión de ser el hogar de la ciencia de datos, lo que aumenta su valoración.
Contras
- ¿Dónde puedo descargar los documentos y conjuntos de datos de Panama Papers?
- ¿Es realmente necesario saber la codificación Java para Big Data? ¿Es posible aprender Big Data sin conocimiento de Java?
- ¿Debo aprender a fondo la ciencia de datos o la nube? ¿Qué paga más en estos días?
- Cómo preparar la interpretación y el análisis de datos financieros para una prueba bancaria (PYME)
- ¿Qué necesito saber para convertirme en científico de datos?
- Una cosa más que debe vigilar para asegurarse de que no está en desventaja frente a personas que son tan buenas como usted, pero que usan todo el código y las ideas compartidas en el foro y los scripts.
- Podría reducir la barrera de entrada para una primera presentación, pero en mi humilde opinión no ayuda a elevar la calidad promedio de la comunidad. Solo tienes más personas en la cola débil.
- Los desincentivos que trabajan en la competencia desde el principio porque puedes esperar y ver qué publicarán otras personas.
- Reduce la probabilidad de enfoques innovadores porque los guiones sesgan la forma en que muchas personas ven el problema. Empiezas con un punto de referencia y lo construyes alrededor de él, en lugar de mirar el problema desde un ángulo único. No es cierto para todos, pero es probable que suceda independientemente.
- Favorece el rendimiento de una presentación y listo, y con 10 competencias al mismo tiempo, puede argumentar que 10 resultados mediocres le dan tantos puntos como 1 buen resultado. Eso afecta las clasificaciones generales.
- Pero la razón principal por la que los guiones me molestan es que, cuando todo está listo y hecho y la competencia ha terminado, ya no sabes realmente cuál es tu rendimiento en comparación con los demás. ¿Habrías derrotado a ese jugador si no hubieras usado el código de otra persona, y lo habrías hecho mejor que ese otro jugador si él / ella no tuviera el código de los scripts?