El intercambio de datos es integral para el desarrollo eficiente (y el avance) de cualquier área de investigación, incluido el aprendizaje coincidente.
Uno puede compartir sus modelos, pero sin los datos sobre los que operan, otras personas no pueden verificar las afirmaciones que se hicieron sobre esos modelos (con respecto al conjunto de datos original, que es, por definición, a lo que se aplican las reclamaciones) , ni identificar si se podrían realizar mejoras.
Esto no es diferente de lo que sucede en otros campos. La unidad estándar dentro de las ciencias naturales y sociales es el artículo de la revista, una pieza que describe los pasos tomados para medir y caracterizar el proceso que le concierne, pero que generalmente no incluye los datos en sí (ya que estos son propietarios, por laboratorio). ) Como resultado, la identificación de errores ha sido lenta (donde ha ocurrido), y la identificación de posibles mejoras ha requerido que otros laboratorios salgan, encuentren fondos para recopilar datos similares (que se vuelven más difíciles que los fondos públicos para la ciencia se ha reducido), y luego analizarlo ellos mismos. Tener conjuntos de datos independientes de múltiples grupos es importante para la replicación conceptual, pero representa una barrera muy alta para ingresar al campo, y esto probablemente ha tenido consecuencias negativas que superan los beneficios de la variabilidad conceptual (en la medida en que la variabilidad conceptual podría estar garantizada por otros significa también).
- ¿Cuál es la próxima especie que desarrollará la autoconciencia?
- ¿Qué tan pronto los robots reemplazarán la mano de obra en trabajos físicos de alta habilidad como la construcción?
- ¿Las carreteras serán más seguras debido a la IA?
- ¿Puede AI crear su propio lenguaje de programación como lo hace Facebook?
- ¿Existe algún requisito previo para el aprendizaje automático y el aprendizaje profundo? ¿Has trabajado en eso?
Sin embargo, las prácticas de intercambio de datos están cambiando, con un mayor énfasis en los conjuntos de datos abiertos, en particular de los centros de investigación con fondos privados (por ejemplo, el Instituto Allen). Los grupos de investigación de ML deberían prestar atención a esto. Aunque sus barreras son diferentes (los datos son propietarios debido a su valor comercial, en lugar de la escasez de fondos gubernamentales con los que recaudarlos), el concepto subyacente es el mismo, y cualquier persona interesada en avanzar en el campo en su conjunto (en lugar de su aplicación a los fines de una empresa específica) debería trabajar para avanzar en el intercambio de datos, así como de modelos.