¿Cuáles son las principales herramientas para la ciencia de datos?

Es solo una idea personal. Estoy usando R y Python para la mayoría de mis análisis de datos (principalmente R ya que estoy más familiarizado con él).

Ambos tienen muchos paquetes / bibliotecas que contienen funciones útiles y convenientes de minería / análisis de datos y modelado / predicción.
Las funciones de trazado también son potentes y siempre puede hacer que sus trazados sean más profesionales.
Fácil de comenzar con / muchos materiales en línea para aprender R (especialización en ciencia de datos de Coursera) y Python (Udemy, etc.)
Siempre puede ejecutar análisis en C / C ++ para mejorar la eficiencia.

Si esos datos son demasiado grandes y comienzan a ser lentos para usar R / Python para analizarlos, Hadoop es una buena herramienta para hacerlo. Recién comencé con él y no pude discutir en detalle sobre eso.

Espero que alguien más pueda hacerlo.

Big DataBig Data AnalysisData AnalysisData MiningData ScienceMachine Learning

¿Vale la pena pagar el campamento de datos por Python?

¿Cuáles son ejemplos de datos primarios y datos secundarios?

¿Cuándo debe un principiante en ciencia de datos comprender que ha elegido un campo equivocado?

Si encripta un SSD sin primero borrar de manera segura los datos antiguos, luego llénelos con datos encriptados, ¿podrían los datos no encriptados aún ser recuperables?

¿Qué significa un modelo en analítica y aprendizaje automático?

¿Cuáles son algunos de los servicios de banda ancha en Bangalore que ofrecen descargas ilimitadas sin ninguna cláusula de “equidad de uso”?

Personalmente uso Python y me parece bastante impresionante, ya que tiene bibliotecas muy bien soportadas y fáciles de usar, como sklearn (para aprendizaje automático), nltk (para procesamiento de lenguaje natural / minería de texto), scrapy (para rastreo web) y theano (para aprendizaje profundo)

William Emmanuel Yu

Apache Hadoop. La base esencial para la gestión moderna de datos.

William Emmanuel Yu

More Interesting

Si un doctorado en física con experiencia mínima en programación, pero con buenos antecedentes en matemáticas, quiere encontrar un trabajo en ciencia de datos en el mercado estadounidense, ¿qué más debe aprender?

¿Cuál es la mejor arquitectura de chispa (big data) crees que para este caso de uso?

Para la validación cruzada K-fold, ¿qué k se debe seleccionar?

¿Hay alguna manera de que podamos incorporar la genómica y las imágenes médicas a la ciencia de datos como postgrado?

¿Hay algún descuento en el Día de Acción de Gracias para el aprendizaje de big data?

Estoy trabajando actualmente. Quiero convertirme en un científico de datos. ¿Cuáles fueron los conceptos y tecnologías centrales que necesito aprender?

El programa MSAN en USF se ve muy bien. Pero, ¿por qué el curso no se menciona en ninguno de los 10 mejores rankings de cursos de análisis empresarial?

¿Qué habilidades son necesarias para conseguir un trabajo en análisis de datos?