Dado que existen marcos optimizados en línea, ¿vale la pena implementar manualmente implementaciones vectorizadas para redes neuronales complicadas?

Como la mayoría de las respuestas en informática, depende. Para mí, la respuesta fue sí, pero lo digo como uno de los que construyeron su propia biblioteca neuronal desde cero hace años, así que toma mis palabras con el grano de sal que necesites.

Me ha dado dividendos mucho más allá de la experiencia emocionante y satisfactoria de aprender cómo funcionan realmente los modelos bajo el capó. Las matemáticas son elegantes y hermosas, y útiles para escribir artículos y expresar ideas, pero hacer que las fórmulas, expresiones y ecuaciones exactas funcionen en código (y de manera escalable y eficiente) es otra historia. Además, meterme en el barro me dio la idea que deseaba desesperadamente comprender cómo funcionaba todo para poder romperlo y mejorarlo yo mismo. Nunca me gustó mucho usar cajas negras …

Sin embargo, mi formación académica me hace conjuntamente ingeniero informático y filósofo mental. Como tal, debo hacer varias cosas para satisfacer las preguntas que plantea cada una de esas perspectivas. Sin embargo, al completar esta pregunta, soy un ingeniero que está acostumbrado a construir sus propias herramientas y para quienes las arquitecturas neuronales son el fin, no un medio para un fin (si obtienes esa referencia parcial, ¡bien por ti!). Además, nunca entiendo completamente algo hasta que lo construyo yo mismo.

Si las redes neuronales son solo una herramienta que necesita para resolver un problema diferente, entonces no vale la pena ir demasiado lejos bajo el capó, ya que podría llevarlo muy lejos de donde quiere ir. Debería ser suficiente implementar algo simple por razones pedagógicas, pero luego dominar una herramienta o biblioteca que ha sido probada y optimizada cuidadosamente. Pero si no, entonces solo diré que ha valido la pena. Por lo menos, me ha ayudado a darme cuenta de lo poco que sé y cuánto más necesito aprender =]

More Interesting

¿Qué importancia tienen las estructuras de datos y los modelos gráficos para el aprendizaje automático?

Cómo depurar sus proyectos de ciencia de datos y aprendizaje automático

¿Cómo entrenamos un clasificador para el cual solo tenemos datos de entrenamiento positivos (no hay datos negativos o sin etiquetar disponibles)?

¿Cuál es el beneficio de utilizar la agrupación promedio en lugar de la agrupación máxima?

¿Qué tecnologías existen actualmente para hacer matemáticas en grandes conjuntos de datos?

¿Cómo puedo comenzar a usar métodos de "generalización apilada" en Python para las competencias de Kaggle?

¿Cómo se hacen los algoritmos EM?

Según Wikipedia, las redes neuronales artificiales actuales tienen la complejidad del cerebro de un gusano. ¿Es eso cierto?

Con la introducción de la inteligencia artificial, ¿podrán las computadoras tener un alto coeficiente intelectual?

¿Qué se entiende por el término "ejemplos adversos" en el aprendizaje automático?

Cómo generar una oración gramaticalmente correcta y completa usando un número dado de palabras

¿Cuáles son las diez mejores universidades del Reino Unido para obtener un doctorado en inteligencia artificial o aprendizaje automático?

Cómo saber si estoy hecho para el aprendizaje automático y las estadísticas

¿Puede un ingeniero eléctrico seguir una carrera en aprendizaje automático en el futuro?

¿Por qué los académicos usan Matlab / Octave y tan pocos en la industria?