Antes de responder a su pregunta, me gustaría expresar rápidamente algunos hechos:
Introducción:
- Pandas es un paquete de Python independiente (Pandas significa Python Data Analysis)
- SFrames (abreviatura de marcos escalables) son parte del ecosistema más grande de Graphlab Create
Licencias y tarifas:
- ¿Se puede trabajar en Machine Learning con un doctorado en estadísticas?
- ¿Cuáles son las diferencias en profundidad, amplitud y rigor entre 6.036 Introducción al aprendizaje automático - MIT, y el curso del Curso de aprendizaje automático de Andrew Ng?
- En el aprendizaje profundo, ¿se pueden obtener buenos resultados cuando usas una función lineal entre las capas ocultas?
- ¿Hay alguna anomalía inexplicable en la codificación de la computadora que pueda sugerir que las máquinas tienen alma?
- ¿Cómo funcionan los árboles de decisión para la regresión?
- Puede usar Pandas en aplicaciones comerciales sin cargo
- Debe comprar una licencia para usar Graphlab Create SFrames para uso comercial. SFrame es de código abierto ahora.
Escalabilidad:
- Pandas es una estructura de datos en memoria. Esto significa que generalmente no puede almacenar marcos de datos más grandes que la memoria principal (también conocida como RAM) en su máquina
- SFrame es una estructura de datos fuera del núcleo. Esto significa que puede almacenar virtualmente cualquier marco de datos de tamaño, siempre y cuando no se quede sin espacio en disco y memoria
Dependencias de la biblioteca:
- Pandas no necesita ningún otro paquete para almacenar datos. No puede hacer mucho modelado de datos con Pandas, necesitará scikit learn u otros paquetes de Anaconda Python Distribution
- SFrame está estrechamente relacionado con Graphlab Create y, por lo tanto, no necesitará configurar ni instalar nada si está utilizando Graphlab Create. Es autosuficiente para la mayoría de las tareas.
Lenguaje y dependencias de la máquina:
- Pandas, que yo sepa, funciona tanto en máquinas de 32 bits como de 64 bits.
- SFrame funciona solo en máquinas de 64 bits.
- Pandas funciona con Python 2.xy 3.x
- SFrame funciona solo con Python 2.7
Debido a las tarifas de licencia y algunas otras razones menos importantes, la mayoría de los usuarios no han probado Graphlab Create. Por lo tanto, no apreciamos la inmensa potencia de la pila Python Create de Graphlab.
Ahora, para responder su pregunta directamente, ¿qué debe aprender?
Si es principiante, comience con Pandas y la distribución de Python Anaconda (que incluye scikit learn, numpy, scipy, matplotlib, frasco, etc.). Recomiendo Pandas porque hay muchos más tutoriales y respuestas de stackoverflow disponibles en comparación.
Pero tenga en cuenta que el hecho de que la mayoría de las personas brillantes no hayan probado Graphlab Create no lo convierte en una mala herramienta. Utiliza la herramienta que mejor te funcione.