¿Con qué frecuencia te preguntas sobre algún nuevo resultado sensacional en ML solo para pensar después “eh, desearía que se explicara mejor, estos trabajos académicos pueden ser realmente difíciles de leer”?
Creo que muy a menudo, a pesar de estar algo acostumbrado a ellos. Una cosa que realmente necesita solución es la forma en que se comunican las ideas, no solo dentro de la academia, sino también fuera, para los profesionales y entusiastas de la industria. Distill es una revista de ML que busca claridad.
Puntos de dolor típicos en un trabajo académico:
- En la mayoría de los entrenamientos de precisión de CNN, ¿por qué la precisión de validación no aumenta suavemente en lugar de con tantas ondas?
- ¿El aprendizaje automático no supervisado basado en la agrupación de datos también determina automáticamente la cantidad de agrupaciones?
- ¿Cuáles son algunos problemas no resueltos en el procesamiento del lenguaje natural?
- ¿Qué tipo de algoritmo de aprendizaje usa el cerebro humano y cómo se compara con los algoritmos que se están desarrollando actualmente para la inteligencia artificial?
- ¿Quiénes son algunos de los principales profesores que enseñan Machine Learning en Europa?
- La falta de herramientas expresivas.
Solo texto, escrito en un lenguaje altamente formal, algunas parcelas, un par de diagramas que a veces son ambiguos, rara vez, un seudocódigo. ¿Es realmente la mejor manera de transmitir la información? Distill fomenta la creatividad en la escritura, propone un conjunto de herramientas para crear artículos interactivos ricos y establece altas expectativas para la calidad general. - Formato antiguo
En este momento es PDF, que es una tradición. PDF es bueno para escribir un informe, tal vez apuntes rápidos, cosas así. A la academia realmente le gustan las tradiciones, de hecho, recuerdo una frase que escuché de uno de los científicos más exitosos en ML: “a nadie le disgusta la innovación tanto como a un científico”. Lo que es al mismo tiempo cierto para las personas mayores que se sienten cómodas con las cosas tal como son, y no es cierto (¡afortunadamente!) Para la mayoría de los jóvenes que critican todo por el mero hecho de hacerlo. Distill propone un nuevo formato basado en la web, que es básicamente una publicación larga con ilustraciones, fórmulas, aplicaciones de demostración integradas y otras cosas. - Confiar demasiado en la notación matemática
Necesitamos matemáticas cuando se describe un nuevo método. De hecho, necesitamos más matemáticas, porque inevitablemente surgen muchas preguntas en el proceso de lectura del documento, y aquí es donde pueden ayudar los estándares elevados de claridad. La formulación matemática estricta es necesaria para no inventar cosas y definiciones precisas. Digamos que quiero usar un nuevo tipo de capa en mi proyecto, pero primero necesito descubrir cómo interactúa con los demás: puedo hacer mis propios experimentos y confiar en eso o eso puede discutirse (aunque sea brevemente) en el documento , preferiblemente en forma de ilustraciones. Esto ayudaría enormemente con el lado práctico de las cosas. - No hay suficiente discusión
Los mejores resultados que he obtenido provienen de los experimentos más estimulantes. Los que no estaban restringidos a “probemos este modelo y veamos qué sucede”. El formato habitual para la conferencia no siempre permite poner todas las preguntas y problemas interesantes en un solo documento.
Si bien Distill no tiene muchas publicaciones ahora, con el respaldo que recibió recientemente, con suerte despegará al menos como una alternativa a la publicación científica tradicional para aquellas personas que no tienen una gran necesidad de reconocimiento académico, o que están dispuestas a haz un poco de esfuerzo extra y escribe una buena publicación. En el futuro veo este formato ubicuo, primero en CS y luego en otras áreas.
Esta
es mejor que esto
Fuente: distill.pub
Al mismo tiempo, la mayor cantidad de trabajo requerida para escribir un artículo digno de destilación en comparación con un artículo típico eliminará todos los resultados “incrementales” que no introducen nada interesante o discuten un viejo problema desde un ángulo diferente.
La idea de que ML es una herramienta imprescindible para todo tipo de programador requiere una buena fuente de conocimiento que no requiera un equivalente de la carga de trabajo de tres cursos superiores para sentirse cómodo con ella. Destill no puede reemplazar todo, pero seguramente podríamos usar más artículos buenos que expliquen o resuman nuevos resultados.
Sus pautas y el proceso de revisión se describen en el sitio web: Destilería – Últimos artículos sobre aprendizaje automático – échale un vistazo.