¿Cuáles son las principales herramientas para la ciencia de datos?

Es solo una idea personal. Estoy usando R y Python para la mayoría de mis análisis de datos (principalmente R ya que estoy más familiarizado con él).

  1. Ambos tienen muchos paquetes / bibliotecas que contienen funciones útiles y convenientes de minería / análisis de datos y modelado / predicción.
  2. Las funciones de trazado también son potentes y siempre puede hacer que sus trazados sean más profesionales.
  3. Fácil de comenzar con / muchos materiales en línea para aprender R (especialización en ciencia de datos de Coursera) y Python (Udemy, etc.)
  4. Siempre puede ejecutar análisis en C / C ++ para mejorar la eficiencia.

Si esos datos son demasiado grandes y comienzan a ser lentos para usar R / Python para analizarlos, Hadoop es una buena herramienta para hacerlo. Recién comencé con él y no pude discutir en detalle sobre eso.

Espero que alguien más pueda hacerlo.

Personalmente uso Python y me parece bastante impresionante, ya que tiene bibliotecas muy bien soportadas y fáciles de usar, como sklearn (para aprendizaje automático), nltk (para procesamiento de lenguaje natural / minería de texto), scrapy (para rastreo web) y theano (para aprendizaje profundo)

Apache Hadoop. La base esencial para la gestión moderna de datos.

More Interesting

Si un doctorado en física con experiencia mínima en programación, pero con buenos antecedentes en matemáticas, quiere encontrar un trabajo en ciencia de datos en el mercado estadounidense, ¿qué más debe aprender?

¿Cuál es la mejor arquitectura de chispa (big data) crees que para este caso de uso?

Para la validación cruzada K-fold, ¿qué k se debe seleccionar?

¿Hay alguna manera de que podamos incorporar la genómica y las imágenes médicas a la ciencia de datos como postgrado?

¿Hay algún descuento en el Día de Acción de Gracias para el aprendizaje de big data?

Estoy trabajando actualmente. Quiero convertirme en un científico de datos. ¿Cuáles fueron los conceptos y tecnologías centrales que necesito aprender?

El programa MSAN en USF se ve muy bien. Pero, ¿por qué el curso no se menciona en ninguno de los 10 mejores rankings de cursos de análisis empresarial?

¿Qué habilidades son necesarias para conseguir un trabajo en análisis de datos?

¿La ciencia de datos necesita estadísticas?

¿Vale la pena organizar un concurso de dinero de Kaggle?

¿Cómo se aplica el big data al marketing de películas?

¿Hay alguna capacitación en el aula dirigida por un instructor en Pune para el aprendizaje automático y la ciencia de datos para un principiante completo?

Cómo medir la calidad de un proyecto de ciencia de datos

¿La física ayuda a entender la ciencia de datos?

¿Debo usar big data como tema de investigación para mi tesis? ¿Cuál es la diferencia entre cloud computing y big data?