¿Por qué debería usar anaconda en lugar de las distribuciones tradicionales de Python para la ciencia de datos?

La razón por la que me gusta más Python para estudiar Data Science es que viene con muchos paquetes poderosos y la gente de la comunidad de código abierto parece que nunca deja de contribuir más a los paquetes de Python. Mientras que Python tradicional le brinda solo una plataforma básica en la que debe instalar los paquetes deseados manualmente (esto incluso no tiene NumPy y Pandas instalados), Anaconda le brinda todo. Quiero decir que ya tiene instalados los paquetes más útiles para Matemáticas, Ciencias e Ingeniería. ¡Qué conveniente es!

Actualización : Además, Anaconda proporciona iPython Notebook que cambia maravillosamente la forma en que escribimos código en Python. Básicamente, un cuaderno de iPython contiene muchas celdas donde puede escribir código fácilmente y agregar comentarios (en Markdown) a su celda. El cuaderno se muestra directamente en su navegador web. Eche un vistazo a un archivo de cuaderno de ejemplo de tensorflow:

Tuve la misma pregunta cuando quise probar el raspado web usando Python. Dado que es un archivo grande y plantearía algunos problemas durante la descarga (aunque dependiendo de dónde se encuentre en la tierra). Así que supongo que desea saber por qué no debería simplemente descargar los paquetes particulares que desea en lugar de todo el material. Así que te ayudaré a responder tu pregunta.

Básicamente, Anaconda tiene una lista de ventajas que enumeraré a continuación, puede ver más leyendo la documentación oficial de anaconda aquí Distribución de Anaconda

  • Sin embargo, depende de su preferencia, pero prefiero Anaconda porque le da al Usuario la capacidad de realizar una instalación fácil de la versión de python que desea.
  • Es posible que no tenga una idea de cuánto pueden ser un problema los privilegios de administrador si está utilizando su computadora portátil y no es propiedad de una empresa. pero Anaconda elimina todos esos problemas.
  • Ofrece computación de alto rendimiento con Anaconda Accelerate y varios otros componentes.
  • Elimina los cuellos de botella involucrados en la instalación de los paquetes correctos, teniendo en cuenta su compatibilidad con otros paquetes que se pueden encontrar al usar pip.
  • No hay riesgo de estropear las bibliotecas del sistema requeridas
  • ¿Debo agregar que tiene hasta 720 paquetes de código abierto, la mayoría de los cuales no están en el repositorio pip?

Así que concluiré diciendo que nadie puede quitarle la importancia de pip, pero si está hablando de ciencia de datos con python, use Anaconda.

La respuesta corta es que anaconda contiene portabilidad para todas las bibliotecas populares de Python que se pueden usar en ciencia de datos. El más importante es scikit-learn, numpy, pandas, scipy, etc. Además, también viene con el cuaderno jupyter y la distribución Ipython. Por lo tanto, le ahorra importar numerosas bibliotecas por separado.

Si tienes alguna pregunta / comentario / sugerencia Suscríbete a mi canal de YouTube para comentar o visítame en Quora, Twitter o en Facebook para comentar o simplemente saludar 🙂

Muchos paquetes científicos requieren una versión específica de Python para ejecutarse, y es difícil evitar que interactúen entre sí. Es aún más difícil mantenerlos actualizados. Anaconda Distribution hace que obtener y mantener estos paquetes sea rápido y fácil

Tiene un excelente administrador de paquetes. Viene con muchas cosas útiles preinstaladas y listas para ejecutarse en un proyecto típico de aprendizaje automático. Puedes hacer casi todo en anaconda frente a Python estándar, pero prepárate para perder mucho tiempo instalando paquetes y haciéndolos funcionar.

Anaconda si el propósito es usar python para la ciencia de datos, a menos que tenga un gran interés en conocer todos los detalles, como cómo compilar usted mismo pandas, matplotlib, etc. Es una tarea dolorosa construirlos.