No existen los algoritmos de ciencia de datos . Así que repasemos qué es la ciencia de datos y citaré Wikipedia:
La ciencia de datos es un campo interdisciplinario sobre procesos y sistemas para extraer conocimiento o percepciones de datos en varias formas, ya sea estructuradas o no estructuradas, [1] [2] que es una continuación de algunos de los campos de análisis de datos como estadísticas, minería de datos, y análisis predictivo, [3] similar al descubrimiento de conocimiento en bases de datos (KDD).
Pero creo que lo que realmente está buscando es aprendizaje automático, aprendizaje profundo y algoritmos de inteligencia artificial.
- ¿Cuáles son algunos algoritmos básicos en el aprendizaje automático para que su programa aprenda de otros datos (aprendizaje supervisado)?
- Cómo aprender a escribir buenos algoritmos
- ¿En qué debe centrarse un estudiante de ingeniería informática, proyectos o estructuras de datos y algoritmos?
- ¿Cuáles son algunos algoritmos interesantes que se han encontrado en la naturaleza?
- ¿Cómo funciona el algoritmo de 'forma de relleno' en los programas de dibujo?
Hay muchas implementaciones de estos algoritmos disponibles como soluciones de código abierto como scikit-learn, xgboost, dl4j, tensorflow, caffee, etc. La lista es realmente muy larga y puede encontrar más en GitHub.
Con respecto a otras partes del flujo de trabajo de la ciencia de datos y en cuanto a las herramientas de limpieza y disputa de datos, Python and R tiene herramientas muy impresionantes y también parte disponible de soluciones de código abierto, por ejemplo, Pandas, dplyr, etc.
La visualización de datos tiene sus propios conjuntos de herramientas y biblioteca disponibles con implementaciones de código abierto.
Personalmente, todas las herramientas que utilizo son de código abierto, desde disputas de datos hasta procesamiento de datos, visualización e implementación de datos, etc.
Google es tu amigo ! Y cualquier otro motor de búsqueda 🙂
Espero haber respondido tu pregunta.