¿La implementación de documentos también es la forma correcta de hacer investigación de IA? ¿Le permitirá a alguien tener nuevas ideas?

Déjame guiarte a través de un ejemplo.

Es posible que haya encontrado el documento de clasificación de texto: FastText. Para NLPers y DLers, es una extensión directa de Word2Vec para la configuración de clasificación. ¡Nada sofisticado!

Estaba interesado en replicar sus resultados en Torch (Lua). De esta manera , estoy seguro de que el modelo funciona según las afirmaciones del autor y también soy consciente de los desafíos técnicos en su implementación.

No estaba listo para examinar su código C ++. Por lo tanto, hice mis propias suposiciones siempre que fue apropiado y pensé que sería pan comido. Probablemente estaba demasiado confiado.

Mis resultados estuvieron lejos de su resultado por puntos significativos. Después de rascarme la cabeza por algún tiempo, de mala gana me lancé a su base de código.

Hubo 2 diferencias principales:

  • No hay sesgo en la capa lineal en la salida.
  • La tasa de aprendizaje disminuye linealmente a partir de 1 y termina en 0 (cuando finaliza el entrenamiento).

Manejar los 2 cambios fue suficiente para alcanzar su resultado. Más tarde, aprendí que estos dos casos se aplican a otros modelos menos profundos como Word2Vec y Doc2Vec.

Nunca habría conocido estas complejidades de FastText si hubiera dado por sentado su implementación.

Lección aprendida.

PD: es aún más difícil codificar documentos cuya implementación no está disponible. Debido a limitaciones de espacio, muchos de los documentos recientes no brindan suficientes detalles para reproducir su configuración con precisión. Incluso si son generosos para proporcionar detalles en la versión complementaria, tuve dificultades para obtener acceso a esto desde laboratorios eminentes.

More Interesting

¿Cuáles son las 5 mejores ciudades del mundo para el aprendizaje automático y la experiencia de aprendizaje profundo en el mundo a partir de 2017?

Si la IA reemplazara a los humanos, ¿seguirían interesados ​​en encontrar vida en el universo?

¿Qué dicen los asistentes virtuales inteligentes como Cortana y Siri sobre el futuro de los humanos?

¿Las preocupaciones relacionadas con la inteligencia sobrehumana que Nick Bostrom aborda en su libro 'Superinteligencia' son relevantes o descabelladas?

¿Qué técnicas de programación debo saber para hacer un juego jugando IA y desafiar en concursos como este: The Great Escape?

¿Cómo se calcula el refuerzo?

¿La IA realmente refleja las capacidades cognitivas del cerebro humano?

¿Cuán informativo / útil es usar la extrapolación de hardware para predecir cuándo realmente surgirá un AGI?

¿Dominarán las empresas chinas en el diseño de AI ASIC?

¿El libro de IBM Watson 'Cocina cognitiva con chef Watson' está protegido por derechos de autor?

¿Qué causó el "invierno AI" y cuáles fueron las primeras señales de advertencia? Dado el estado actual de la IA, ¿es probable que haya otro período de bajo interés en el campo? ¿Qué cuellos de botella serían la causa de eso?

¿Por qué creamos robots cuando nos roban nuestros trabajos?

¿Por qué la gente prefiere Python como lenguaje de IA?

Cómo aprender prácticamente las redes neuronales mientras se obtiene una comprensión profunda

¿Sería eventualmente posible transferir la mente humana a la nube para que el humano virtual continúe 'viviendo' en la red informática?