Pandas ha sido una adición muy significativa al kit de herramientas Python. Le permite a Python traer muchas fortalezas de R.
Personalmente, creo que Pandas es un kit muy poderoso. Sin embargo, la razón por la que no se usa ampliamente en la industria es porque es una adición relativamente reciente (creo que en algún lugar de 2008). Cambiar un ecosistema completo (p. Ej., En una organización, laboratorios de investigación) es un proceso lento y solo comienza unos años después de que la herramienta de lenguaje se haya enriquecido en funciones. Esto se debe a que las personas agregan sus propias capas de códigos y aplicaciones sobre la oferta principal.
Por ejemplo, me he encontrado con algunos investigadores, que tienen sus algoritmos completos codificados en R que se pueden usar en forma de biblioteca. Entonces, cualquier persona nueva que ingrese a sus laboratorios termina siendo parte del ecosistema R.
- ¿Qué es más útil para la ciencia de datos: modelos de regresión o series de tiempo?
- Cómo analizar la intensidad de los datos de noticias
- ¿Cuál es su opinión sobre el repentino interés de las personas en la ciencia de datos y análisis?
- ¿Qué empresas están haciendo aprendizaje automático real en lugar de ciencia de datos hacky?
- ¿Cómo es relevante el big data para CRM?
La segunda razón es que, por lo general, los sistemas de código abierto son menos preferidos por las industrias donde existen grandes requisitos de auditoría (por ejemplo, BFSI). Necesitan un seguimiento auditable de los cambios en las versiones y, por lo tanto, prefieren sistemas propietarios como SAS.
Creo que el uso de Pandas se volverá cada vez más convencional, pero no debemos esperar que reemplace las herramientas existentes en el corto plazo.
Espero que esto responda a su pregunta.
Gracias,
Kunal