¿Los principales profesionales de aprendizaje profundo a menudo tienen grandes lagunas de conocimiento debido a lo rápido que se mueve el campo?

Cuando se para en una plataforma ferroviaria y un tren de alta velocidad se precipita frente a sus ojos a una velocidad superior a 250 km / h, puede pensar que se mueve muy rápido. Pero para el maquinista que se sienta dentro del tren no se mueve en absoluto.

Lo mismo con los principales investigadores. No (en su mayoría) se ponen al día con los últimos descubrimientos como el resto de nosotros porque crean el movimiento. Hacer nuevos algoritmos y publicar documentos requiere que estén al tanto del progreso actual, al menos en su campo.

Un documento siempre contiene una sección de “trabajo relacionado”, que enumera los experimentos similares en el mismo problema. Esto se supervisa de cerca durante el proceso de revisión, por lo general, no se mencionan los trabajos importantes. Por cierto, la mayoría de estas personas sirven como revisores de las principales conferencias, lo cual es una excelente manera de leer más artículos sobre los que todos los demás escucharán.

A menudo, las personas de PNL no saben mucho sobre visión por computadora y viceversa, pero es lo mismo que con las matemáticas: todo el campo científico es demasiado vasto para que una persona lo domine todo.

Deep LearningMachine Learning

¿Cuáles son las diferentes áreas donde los bancos pueden usar NLP (procesamiento del lenguaje natural) para mejorar las operaciones comerciales?

¿Cómo se calcula el subconjunto de vocabulario en 'Al usar vocabulario de objetivos muy grandes para la traducción automática neuronal'?

¿Cuál es la mejor manera de implementar un SVM usando Hadoop?

¿Cuáles son los mayores desafíos al hacer análisis de big data?

¿Qué tan arriesgado es comprar una CPU en eBay?

Cómo ejecutar la seguridad del sitio

Yo diría que cualquier practicante / científico / ingeniero tiene los llamados vacíos de conocimiento, algunos intencionales y otros no intencionales. Esto podría ser más común en la era actual o en la era de la información (es decir, vivimos en la “era de la información”) con la explosión de datos y el aumento de la disponibilidad de muchos recursos digitales. Diría que para algunos sería fácil obtener perdido en el mar (digital). Sin embargo, digamos en la década de 1980, era simplemente más difícil saber qué podrían estar haciendo otros grupos de investigación, aunque se estaba haciendo una gran cantidad de trabajo en paralelo (un buen ejemplo es el a menudo afirmado “descubrimiento / recuperación paralela / independiente descubrimiento ”de propagación hacia atrás de errores). Por lo tanto, se podría argumentar que las brechas en el conocimiento han sido mayores en el pasado, ya que era más difícil comunicar la investigación de lo que es hoy. Y el trabajo en redes neuronales definitivamente se estaba moviendo “más lento” de lo que es hoy (incluso antes del gran invierno de IA).

Sin embargo, con ese punto, diré que a menudo aparecen vacíos en el conocimiento de los investigadores cuando se trata de literatura / trabajo previo sobre el tema que publican. Algo de esto se debe simplemente a que los recién llegados simplemente no señalan los orígenes del campo y, a menudo, se les hace creer que el único trabajo significativo que hay que conocer son los documentos más populares que salen “este año”. Esto no solo conduce a una falla en la asignación de crédito (un principio del que hablamos en ML, pero que no practicamos a menudo como humanos en las citas), sino a una gran cantidad de “reinvención de ruedas”. A menudo se vuelve tan ridículo que muchos investigadores no logran mirar el año anterior y al menos reconocen el trabajo que están reinventando. Por supuesto, el peor de los casos es la “brecha de conocimiento intencional”, donde las citas son importantes. Demasiados investigadores (tanto académicos como industriales) parecen tener demasiada arrogancia, pensando que simplemente pueden ignorar el buen trabajo o incluso las “verdades” científicas (“PNL profunda” es el mejor ejemplo – más profundo es a menudo no es mejor que las líneas de base simples, a menos que uno elija reducir su línea de base o simplemente no informar las líneas de base reales) porque no hace su “historia” o caso. Pero me estoy desviando un poco …

En resumen, sí, muchos profesionales / investigadores de aprendizaje profundo tienen lagunas en su conocimiento, es inevitable, aunque esto puede remediarse mucho leyendo todos los días y manteniéndose al día a través de colecciones / bibliotecas digitales como arXiv, Google Scholar y CiteSeerX . Hay una razón por la cual las personas todavía escriben libros de texto para al menos darles a los estudiantes de hoy en día una oportunidad de conocer el pasado y el estado actual de las cosas en las redes neuronales (y ML en general) =] El tamaño de estas brechas de conocimiento varía … sería difícil afirmar que “los principales profesionales de aprendizaje profundo” tienen tales brechas debido al problema de las “brechas de conocimiento intencional” que discutí anteriormente.

¿Cuál podría ser un punto de partida para combatir esas temidas brechas de conocimiento, podría estar pensando? No tengo el enlace en este momento, pero recuerdo en una vieja publicación de Quora o tal vez en la discusión de Reddit que Andrew Ng simplemente se acostumbró a leer al menos dos artículos de ML al día. Yo diría que los hábitos de Ng podrían ser bastante útiles para los estudiantes incipientes / prometedores de aprendizaje profundo / aprendizaje automático (doctorado, maestría y estudiantes universitarios similares) 😉

Alexander Ororbia

Creo que las brechas de conocimiento se deben más a la amplitud del campo que a su velocidad de desarrollo. Un experto en aprendizaje supervisado puede no seguir de cerca el modelo generativo o RL. La mayoría de las personas que conozco no tienen lagunas en el conocimiento de su propia especialidad que yo llamaría “mayor”.

Nikhil Badugu

More Interesting

¿Por qué necesitamos Python y Java para el aprendizaje automático mientras tenemos R?

¿Cómo detectamos el sobreajuste y la falta de ajuste en Machine Learning?

¿Qué es el aprendizaje automático basado en modelos?

¿Me puede recomendar algunos buenos libros, blogs, artículos y documentos dedicados a conjuntos de modelos y especialmente apilamiento de modelos, también conocidos como conjuntos de modelos híbridos?

¿Puedo terminar en trabajos de aprendizaje automático si tengo una maestría en neurociencia?

¿Quiénes son los mejores ingenieros de aprendizaje automático?

En LSTM, ¿cómo calculas qué tamaño deben tener los pesos?

Cómo optimizar el ANFIS de MATLAB usando el método de descenso de gradiente conjugado

¿Cómo se implementa la funcionalidad de verificación de spam mediante el aprendizaje automático?

En la mayoría de los entrenamientos de precisión de CNN, ¿por qué la precisión de validación no aumenta suavemente en lugar de con tantas ondas?