¿Cuál es la herramienta de big data más fácil que se puede utilizar para el aprendizaje automático?

Cuando se trata de big data, una sola máquina no es suficiente. Si puede almacenar sus datos, entonces no son grandes datos. Se necesitan múltiples procesadores con soporte en la nube. Creo que no hay herramienta ahora. Además, los grandes datos tienen muchos problemas, como los datos no estructurados y la dependencia de series temporales. Por lo tanto, simplemente no puede tomar una instancia para encontrar una idea.

Triffacta Wrangler que nació de Data Wrangler es una herramienta que está buscando pero aún en estado beta y no admite análisis de big data. Pero, afirman que su edición comercial final admitirá big data que aún no está en el mercado.

Las herramientas de ML compatibles con Big Data nunca serán gratuitas, ya que utilizará algo de soporte en la nube. O puede configurar su propio gran sistema con Apache Spark, Hadoop, etc.

Si solo desea trabajar con ML con datos pequeños, puede usar Weka.

Recomiendo MLJAR, porque es muy fácil entrenar diferentes modelos y ajustar hiperparámetros con esta plataforma. Tiene muchos algoritmos incorporados: xgboost, lightGBM, Random Forest, Neural Networks. La formación del modelo se realiza por navegador a través de la interfaz de usuario. Aquí hay un análisis de ejemplo para la calificación crediticia

Dividiría esta pregunta en dos partes: ML Frameworks y herramientas. ML Frameworks le proporciona una plataforma con un conjunto de bibliotecas ML que se pueden utilizar para crear su aplicación ML. La siguiente es la lista de los principales marcos para ML que también proporciona herramientas interactivas para crear una aplicación:

  1. TensorFlow
  2. SparkMLlib
  3. Apache Mahout
  4. Scikit-learn
  5. Keras
  6. Shogan
  7. H2O

Luego se trata de las herramientas de código abierto independientes de ML que pueden ayudarlo a escribir sus aplicaciones, de la siguiente manera:

  1. Cuadernos Jupyter
  2. Zeppeline
  3. RStudio IDE
  4. Caballo de mar
  5. OpenRefine

Yo considero

  1. La programación Scala y su biblioteca Mlib se alinean estrechamente con big data y ML.
  2. La tormenta Apache, Hadoop, la colmena están relacionadas con la categoría de herramientas de Big Data.

Una encuesta de herramientas de código abierto para el aprendizaje automático con big data en el ecosistema de Hadoop

Este artículo puede ayudarte.

Weka ya que te permite hacer modelos de construcción en GUI.

Minería de datos con software de aprendizaje automático de código abierto en Java

More Interesting

¿De qué maneras es importante la investigación matemática fundamental en espacios de alta dimensión (por ejemplo, geometría / topología) importante para la ciencia de datos y el aprendizaje automático?

Quiero hacer un análisis de datos sobre datos sanitarios. ¿Dónde puedo encontrar estos conjuntos de datos?

¿Cuál es la diferencia entre análisis de datos y análisis de datos? ¿Cómo se refleja esta diferencia en los procedimientos de gestión de datos de una empresa?

¿De qué manera el big data y el aprendizaje automático cambiarán el mundo de los restaurantes?

¿Cuánto tiempo durará la exageración de la ciencia de datos antes de que se sature? ¿Y cuál podría ser la próxima tendencia?

Cómo convertirse en un científico de datos en la NASA

¿Qué es el software Tally? ¿Cómo ayuda a capturar los datos del canal?

Cómo convertirme en un "fantasma" en Internet y eliminar todos mis datos en línea

¿Dónde puedo encontrar preguntas y problemas sobre análisis de datos y ciencia de datos?

Por lo general, en la tercera sección de un artículo describimos el tipo de datos, la fuente de datos, el análisis de datos, etc. ¿Es este un método o una sección de metodología?

¿Cómo es útil el Big Data para las personas?

¿Cuáles son los principales rasgos necesarios para tener éxito con Big Data?

Si un doctorado en física con experiencia mínima en programación, pero con buenos antecedentes en matemáticas, quiere encontrar un trabajo en ciencia de datos en el mercado estadounidense, ¿qué más debe aprender?

¿Consejos prácticos para el aprendizaje automático?

¿Cuáles son algunas de las empresas de análisis de big data?