¿Qué es Distill y cuál es su importancia para la investigación de Machine Learning?

¿Con qué frecuencia te preguntas sobre algún nuevo resultado sensacional en ML solo para pensar después “eh, desearía que se explicara mejor, estos trabajos académicos pueden ser realmente difíciles de leer”?

Creo que muy a menudo, a pesar de estar algo acostumbrado a ellos. Una cosa que realmente necesita solución es la forma en que se comunican las ideas, no solo dentro de la academia, sino también fuera, para los profesionales y entusiastas de la industria. Distill es una revista de ML que busca claridad.

Puntos de dolor típicos en un trabajo académico:

  1. La falta de herramientas expresivas.
    Solo texto, escrito en un lenguaje altamente formal, algunas parcelas, un par de diagramas que a veces son ambiguos, rara vez, un seudocódigo. ¿Es realmente la mejor manera de transmitir la información? Distill fomenta la creatividad en la escritura, propone un conjunto de herramientas para crear artículos interactivos ricos y establece altas expectativas para la calidad general.
  2. Formato antiguo
    En este momento es PDF, que es una tradición. PDF es bueno para escribir un informe, tal vez apuntes rápidos, cosas así. A la academia realmente le gustan las tradiciones, de hecho, recuerdo una frase que escuché de uno de los científicos más exitosos en ML: “a nadie le disgusta la innovación tanto como a un científico”. Lo que es al mismo tiempo cierto para las personas mayores que se sienten cómodas con las cosas tal como son, y no es cierto (¡afortunadamente!) Para la mayoría de los jóvenes que critican todo por el mero hecho de hacerlo. Distill propone un nuevo formato basado en la web, que es básicamente una publicación larga con ilustraciones, fórmulas, aplicaciones de demostración integradas y otras cosas.
  3. Confiar demasiado en la notación matemática
    Necesitamos matemáticas cuando se describe un nuevo método. De hecho, necesitamos más matemáticas, porque inevitablemente surgen muchas preguntas en el proceso de lectura del documento, y aquí es donde pueden ayudar los estándares elevados de claridad. La formulación matemática estricta es necesaria para no inventar cosas y definiciones precisas. Digamos que quiero usar un nuevo tipo de capa en mi proyecto, pero primero necesito descubrir cómo interactúa con los demás: puedo hacer mis propios experimentos y confiar en eso o eso puede discutirse (aunque sea brevemente) en el documento , preferiblemente en forma de ilustraciones. Esto ayudaría enormemente con el lado práctico de las cosas.
  4. No hay suficiente discusión
    Los mejores resultados que he obtenido provienen de los experimentos más estimulantes. Los que no estaban restringidos a “probemos este modelo y veamos qué sucede”. El formato habitual para la conferencia no siempre permite poner todas las preguntas y problemas interesantes en un solo documento.

Si bien Distill no tiene muchas publicaciones ahora, con el respaldo que recibió recientemente, con suerte despegará al menos como una alternativa a la publicación científica tradicional para aquellas personas que no tienen una gran necesidad de reconocimiento académico, o que están dispuestas a haz un poco de esfuerzo extra y escribe una buena publicación. En el futuro veo este formato ubicuo, primero en CS y luego en otras áreas.

Esta

es mejor que esto

Fuente: distill.pub

Al mismo tiempo, la mayor cantidad de trabajo requerida para escribir un artículo digno de destilación en comparación con un artículo típico eliminará todos los resultados “incrementales” que no introducen nada interesante o discuten un viejo problema desde un ángulo diferente.

La idea de que ML es una herramienta imprescindible para todo tipo de programador requiere una buena fuente de conocimiento que no requiera un equivalente de la carga de trabajo de tres cursos superiores para sentirse cómodo con ella. Destill no puede reemplazar todo, pero seguramente podríamos usar más artículos buenos que expliquen o resuman nuevos resultados.

Sus pautas y el proceso de revisión se describen en el sitio web: Destilería – Últimos artículos sobre aprendizaje automático – échale un vistazo.

More Interesting

¿Cómo se usa SVM y cómo se implementa mejor?

¿Cómo se debe elegir el parámetro [math] l [/ math] en la regresión de mínimos cuadrados parciales?

¿Qué computadora portátil debo comprar, la Dell XPS 15 o la MacBook pro 13 '2017 para una Maestría en Ciencias de la Computación, en los EE. UU. Con enfoque en aprendizaje automático y ciencia de datos?

¿Cuál es el futuro del aprendizaje por refuerzo?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?

¿Cómo podría una máquina / sistema de IA identificar una oración sarcástica?

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?

¿Qué hace que una computadora sea única? ¿Es el HDD? Si es así, ¿eliminarlo y ponerlo en otra máquina hace que esa máquina sea la misma que la original?

¿Por qué debería usar TensorFlow sobre NumPy o scikit-learn para construir redes neuronales (excepto para CPU o GPU)?

¿Qué debo leer para desarrollar un rastreador web que raspe un subconjunto de Internet y me brinde los enlaces de los sitios web que son tiendas de abarrotes?

¿Cuál sería un ejemplo de una función simple no convexa?

¿Cómo se eligieron las palabras sesgo y varianza (Machine Learning)?

¿Funciona el aprendizaje profundo si las entradas están en un espacio dimensional relativamente bajo?

¿Dónde se usa la función de pérdida con clases verdaderas desconocidas?

¿Cómo se compara la industria del aprendizaje automático con las opciones de carrera dentro del desarrollo web?