¿Los principales profesionales de aprendizaje profundo a menudo tienen grandes lagunas de conocimiento debido a lo rápido que se mueve el campo?

Cuando se para en una plataforma ferroviaria y un tren de alta velocidad se precipita frente a sus ojos a una velocidad superior a 250 km / h, puede pensar que se mueve muy rápido. Pero para el maquinista que se sienta dentro del tren no se mueve en absoluto.

Lo mismo con los principales investigadores. No (en su mayoría) se ponen al día con los últimos descubrimientos como el resto de nosotros porque crean el movimiento. Hacer nuevos algoritmos y publicar documentos requiere que estén al tanto del progreso actual, al menos en su campo.

Un documento siempre contiene una sección de “trabajo relacionado”, que enumera los experimentos similares en el mismo problema. Esto se supervisa de cerca durante el proceso de revisión, por lo general, no se mencionan los trabajos importantes. Por cierto, la mayoría de estas personas sirven como revisores de las principales conferencias, lo cual es una excelente manera de leer más artículos sobre los que todos los demás escucharán.

A menudo, las personas de PNL no saben mucho sobre visión por computadora y viceversa, pero es lo mismo que con las matemáticas: todo el campo científico es demasiado vasto para que una persona lo domine todo.

Yo diría que cualquier practicante / científico / ingeniero tiene los llamados vacíos de conocimiento, algunos intencionales y otros no intencionales. Esto podría ser más común en la era actual o en la era de la información (es decir, vivimos en la “era de la información”) con la explosión de datos y el aumento de la disponibilidad de muchos recursos digitales. Diría que para algunos sería fácil obtener perdido en el mar (digital). Sin embargo, digamos en la década de 1980, era simplemente más difícil saber qué podrían estar haciendo otros grupos de investigación, aunque se estaba haciendo una gran cantidad de trabajo en paralelo (un buen ejemplo es el a menudo afirmado “descubrimiento / recuperación paralela / independiente descubrimiento ”de propagación hacia atrás de errores). Por lo tanto, se podría argumentar que las brechas en el conocimiento han sido mayores en el pasado, ya que era más difícil comunicar la investigación de lo que es hoy. Y el trabajo en redes neuronales definitivamente se estaba moviendo “más lento” de lo que es hoy (incluso antes del gran invierno de IA).

Sin embargo, con ese punto, diré que a menudo aparecen vacíos en el conocimiento de los investigadores cuando se trata de literatura / trabajo previo sobre el tema que publican. Algo de esto se debe simplemente a que los recién llegados simplemente no señalan los orígenes del campo y, a menudo, se les hace creer que el único trabajo significativo que hay que conocer son los documentos más populares que salen “este año”. Esto no solo conduce a una falla en la asignación de crédito (un principio del que hablamos en ML, pero que no practicamos a menudo como humanos en las citas), sino a una gran cantidad de “reinvención de ruedas”. A menudo se vuelve tan ridículo que muchos investigadores no logran mirar el año anterior y al menos reconocen el trabajo que están reinventando. Por supuesto, el peor de los casos es la “brecha de conocimiento intencional”, donde las citas son importantes. Demasiados investigadores (tanto académicos como industriales) parecen tener demasiada arrogancia, pensando que simplemente pueden ignorar el buen trabajo o incluso las “verdades” científicas (“PNL profunda” es el mejor ejemplo – más profundo es a menudo no es mejor que las líneas de base simples, a menos que uno elija reducir su línea de base o simplemente no informar las líneas de base reales) porque no hace su “historia” o caso. Pero me estoy desviando un poco …

En resumen, sí, muchos profesionales / investigadores de aprendizaje profundo tienen lagunas en su conocimiento, es inevitable, aunque esto puede remediarse mucho leyendo todos los días y manteniéndose al día a través de colecciones / bibliotecas digitales como arXiv, Google Scholar y CiteSeerX . Hay una razón por la cual las personas todavía escriben libros de texto para al menos darles a los estudiantes de hoy en día una oportunidad de conocer el pasado y el estado actual de las cosas en las redes neuronales (y ML en general) =] El tamaño de estas brechas de conocimiento varía … sería difícil afirmar que “los principales profesionales de aprendizaje profundo” tienen tales brechas debido al problema de las “brechas de conocimiento intencional” que discutí anteriormente.

¿Cuál podría ser un punto de partida para combatir esas temidas brechas de conocimiento, podría estar pensando? No tengo el enlace en este momento, pero recuerdo en una vieja publicación de Quora o tal vez en la discusión de Reddit que Andrew Ng simplemente se acostumbró a leer al menos dos artículos de ML al día. Yo diría que los hábitos de Ng podrían ser bastante útiles para los estudiantes incipientes / prometedores de aprendizaje profundo / aprendizaje automático (doctorado, maestría y estudiantes universitarios similares) 😉

Creo que las brechas de conocimiento se deben más a la amplitud del campo que a su velocidad de desarrollo. Un experto en aprendizaje supervisado puede no seguir de cerca el modelo generativo o RL. La mayoría de las personas que conozco no tienen lagunas en el conocimiento de su propia especialidad que yo llamaría “mayor”.