¿Cuáles son las diferencias entre hacer aprendizaje automático en la academia y en la industria?

En la academia se te ocurre un nuevo algoritmo A para resolver o mejorar soluciones anteriores al problema X. Necesita pruebas de que su algoritmo A es mejor que los algoritmos anteriores. Entonces, haces muchos experimentos sobre la verdad básica para evaluar que sí A es mejor que los algoritmos anteriores sobre el problema X.

Si tuviera que publicar un documento con afirmaciones extraídas de la nada, el último algoritmo A supera el aprendizaje profundo (DL) sobre el problema X , incluso cuando tiene razón, nadie lo tomará en serio. Pero si publica los resultados junto con su reclamo y proporciona el código fuente para que otras personas puedan reproducir su trabajo, entonces todos lo tomarán en serio.

Por lo tanto, encontrará mucho trabajo de evaluación en la academia simplemente porque es la mejor manera de comunicarse con otros investigadores que “observan qué puede hacer el algoritmo A “. Entonces, todos los que vean esos hechos no tendrán nada más que decir que aceptarlo, bueno, podrían discutir un poco y luego realizarán mejoras en el algoritmo A para obtener el algoritmo B y el círculo continuará y continuará.

En la industria, su enfoque se centra más en alinearse con un objetivo comercial de la empresa para la que trabaja, dependiendo del departamento, por supuesto. Si desarrolla el algoritmo A bajo alguna compañía y su gerente ve una ventaja competitiva si el algoritmo A se mantuvo en secreto comercial, entonces no tendrá que hacer todo ese trabajo de evaluación solo para demostrar que su algoritmo es mejor que el resto. Algunas industrias realizan trabajos de investigación similares a los de la academia mediante los cuales publican artículos de vez en cuando. Normalmente, el trabajo de investigación industrial está bien financiado, especialmente en los gigantes tecnológicos Google, Facebook, Microsoft y Baidu en comparación con la academia. Estos gigantes pueden limpiar fácilmente los centros de investigación académica, dejando solo unas pocas docenas de investigadores allí.

En la mayoría de los casos, los ingenieros de aprendizaje automático (ML) se ocupan del final de la producción. Como la implementación de su algoritmo A en productos reales para mejorar algunos productos existentes de la compañía. Mientras que las personas con doctorado se centran en crear nuevos algoritmos que tienen que evaluar al igual que en la academia.

La diferencia entre ellos puede ser borrosa porque lo que se descubre en la industria eventualmente encontrará su camino hacia la academia y viceversa. TensorFlow, por ejemplo, está encontrando su camino en la academia y algoritmos como las redes neuronales residuales (ResNet) desarrolladas por investigadores de Microsoft están encontrando su camino en la academia. La primera red neuronal convolucional (CNN) estaba en la academia y ahora se ha difundido en la industria casi sin problemas ahora.

En la mayoría de los trabajos de investigación, encontrará pequeños pasos que conducen a algunas mejoras en los algoritmos anteriores. El trabajo innovador importante es muy raro, por lo que rara vez se encontrará con un trabajo que sea muy diferente del resto. De ahí su impresión de que se trata solo de la evaluación del clasificador, esa es una impresión incorrecta. Si lees cuidadosamente el artículo una y otra vez, descubrirás algunos trucos nuevos que son novedosos en ese documento y merecen un nuevo enfoque para los autores, aunque sea un pequeño incremento.

Espero que esto ayude.

AcademiaAplicaciones deMachine Learning

Related Content

¿Qué son los SVM?

¿Cuáles son algunos de los conjuntos de habilidades esenciales que debe tener un desarrollador de aprendizaje automático?

¿Cuál es el lugar de las redes neuronales en una arquitectura más amplia de cognición mecánica?

¿Qué motor de recomendación / personalización estándar ofrece recomendaciones utilizando tanto el aprendizaje automático como la entrada manual?

¿Existe alguna implementación de aprendizaje profundo de respuesta basada en la recuperación de preguntas?

¿Son las baterías de estado sólido la próxima gran novedad en tecnología?

¿Es aconsejable automatizar el trabajo del presidente de la Fed con un software de aprendizaje automático dado que sus decisiones se basan principalmente en datos?

Según mi experiencia, la diferencia clave entre la investigación académica e industrial en general (es decir, no solo para el aprendizaje automático) es aproximadamente la siguiente. En la academia se desarrollan principalmente nuevas ideas a un nivel más general, mientras que en la industria se desarrolla y adapta un método con la aplicabilidad a un producto en particular como su objetivo principal.

Por ejemplo, en un trabajo de investigación académica, los autores a menudo hacen suposiciones restrictivas y muestran la optimización de su método dados estos supuestos. Sin embargo, estos supuestos no siempre se cumplen en la práctica, por lo que un “algoritmo académico” podría no ser directamente aplicable para resolver un problema industrial. Las tareas de un ingeniero en la industria son ajustar un método determinado para satisfacer las necesidades prácticas, hacer que el algoritmo sea más robusto o encontrar una implementación más rápida, solo por mencionar algunos.

Sin embargo, no siempre se puede separar por completo de esta manera. También puede publicar un trabajo de investigación sobre hacer algo más robusto o más rápido. O, a menudo, también existen nuevos métodos generales derivados de la investigación industrial. Esto depende en gran medida de cuánto está dispuesta a invertir la empresa en particular en su propio departamento de investigación o relaciones académicas.

Håkon Hapnes Strand

En la academia, se te ocurren nuevos algoritmos que pueden resolver problemas futuros.

También hay investigación aplicada en la academia que se ocupa principalmente de resolver un problema y menos preocupada por la novedad, pero la mayoría de la investigación se centra en encontrar algo nuevo.

En la industria, resuelve problemas aplicando algoritmos ideados en el pasado.

La industria se trata de resolver los problemas de la manera más eficiente mediante el uso de cualquier medio prácticamente posible. Si eso significa diseñar un nuevo algoritmo, que así sea, pero generalmente significa aplicar métodos probados.

Por supuesto, esta es una simplificación general, pero esa es la idea general.

Con respecto a la evaluación de algoritmos, eso es importante tanto en la academia como en la industria, pero los requisitos de rigor científico son mucho más estrictos en la academia.

Benny Ha

Permítanme hacerlo breve y distinguir entre los dos de la siguiente manera:

1] Aprendizaje automático en la industria: –

1.A] Determine qué modelo es el más adecuado para una tarea.

1.B] Estime cómo funcionará el modelo después de la implementación.

1.C] Convencer a los usuarios de que el modelo satisfará sus necesidades.

2] Aprendizaje automático en la academia: –

2.A] Evalúe el desempeño del nuevo método contra las líneas de base existentes.

2.B] Determine el mejor enfoque de aprendizaje automático para un problema específico.

2.C] Realizar experimentos de referencia.

Benny Ha

En la academia estudias desde el principio

la academia puede crear una imagen para su industria, pero aún necesita experiencia de la industria también porque en la academia no aprendió cómo resolver el problema en la industria, pero aprendió sobre el método

Benny Ha

More Interesting

¿Cómo entiendes las ecuaciones de MLE para los clasificadores Naive Bayes en el libro de aprendizaje automático de Kevin Murphy?

¿Cuáles fueron las principales conclusiones del tutorial de Richard Sutton sobre el aprendizaje por refuerzo en NIPS 2015?

¿Cuál es la diferencia entre hash y minhashing sensibles a la localidad?

¿Cuál es la pérdida latente en autoencoders variacionales?

¿Cuál sería un buen enfoque de aprendizaje automático para un bot de comercio de criptomonedas con aproximadamente media docena de parámetros de entrada de estrategia de comercio numérico y una salida numérica (porcentaje de ganancia diaria)? Todos los días el modelo probaría nuevos parámetros.

¿Cuál es la diferencia entre aplicar la descomposición del tren Tensor y agregar más capas a la red donde cada una tiene un tamaño reducido?

Cómo crear la línea de regresión de mínimos cuadrados (error cuadrático medio mínimo) en R

¿Cómo podría el aprendizaje automático mejorar la nariz electrónica?

¿Por qué usamos convolución en redes neuronales?

¿NVIDIA GTX 1050 Ti 4GB es suficiente para Deep Learning?