¿Cuál es la diferencia entre ‘Google Cloud Datalab’ y ‘portátiles Jupyter’?

GC DataLab está construido sobre Jupyter, por lo que no hay diferencia en la base.

La diferencia será los paquetes agrupados y el back-end de cómputo no insignificante al que tiene acceso.

Por ejemplo, uso Anaconda para Python, Spyder y Jupyter. Viene con una gran cantidad de paquetes. Pero proporciono mis propios recursos informáticos.

GC DataLab viene con paquetes adicionales, que no obtienes con Anaconda, por ejemplo. Y obtienes la nube informática.

Si sabe cómo usar Jupyter, entonces sabe cómo usar GC DataLab.

Pero GC DataLab tendrá diferentes paquetes y dependencias … y la nube de cómputo!

Si está haciendo un proyecto que dice “instalar GC DataLab”, ¡simplemente hágalo! Obtiene un crédito de $ 300 para usar durante un año. Muy libre de probar.

Si está tratando de hacer la misma funcionalidad y no paga nada, tiene un poco de trabajo por delante. Claramente ven una oportunidad para un producto de suscripción compatible. Deberá duplicar ese trabajo. Probablemente tengan una ventaja de 100 años-hombre.

A2A: Google Cloud Datalab (que ahora está en GA) es un banco de trabajo de ciclo de vida completo que lo ayuda a construir / implementar / escalar sus modelos de una manera que los portátiles por sí solos no pueden. Su valor “además de la integración” con GCP es un gran “además”; es algo así como decir “además de permitir la capacidad de volar, ¿cuál es el valor de las alas en un avión?” (exageración intencional con fines ilustrativos).

Con Cloud Datalab, puede crear prototipos de su modelo localmente con scikit-learn o TensorFlow y luego moverlo / entrenarlo en la nube con un gran conjunto de datos; También puede utilizar Cloud Dataflow para preprocesar sus datos y hacerlos impecables. Cloud Datalab también proporciona control de origen y autenticación de usuario.

Creo que la conclusión es: si solo estás jugando o trabajando en proyectos personales, Jupyter funcionará bien. Si desea construir modelos de grado comercial e implementarlos en producción, Cloud Datalab proporciona el enfoque de ciclo de vida completo que necesitaría.

Jupyter proporciona el núcleo de Cloud Datalab con respecto a la interfaz de usuario del editor; sin embargo, Cloud Datalab proporciona integraciones adicionales con Cloud Platform para que no necesite escribir estas integraciones usted mismo y pueda crear prototipos y analizar rápidamente utilizando estas integraciones sin una inversión inicial de este tipo. El código para Cloud Datalab es de código abierto (consulte googledatalab / datalab en GitHub), por lo que puede comparar fácilmente su código fuente con el código fuente de Jupyter e identificar las diferencias por usted mismo; También puede bifurcar y / o enviar solicitudes de extracción para una funcionalidad adicional.