¿Cuál ha sido la experiencia de la gente con RapidMiner?

He probado RapidMiner, SAS EM y Oracle DM para hacer análisis de series temporales de datos transaccionales y análisis de patrones utilizando características anteriores. En mi opinión, RapidMiner tiene la interfaz más intuitiva para personas con antecedentes académicos debido a la terminología utilizada en la documentación y los menús. Sin embargo, RapidMiner requiere muchos más recursos de hardware que SAS y ODM para exactamente la misma tarea y la misma cantidad de datos. Además, cuando sus datos no están en archivos planos y almacenados en una base de datos, me resulta muy difícil (en cuanto a la interfaz de usuario) integrarlo con un RDBMS. También tuve algunas excepciones de Java durante mis intentos de acceso a la base de datos de que Google no devolvió ningún resultado para poder resolver el problema por mi cuenta. Por lo tanto, es posible que necesite comprar soporte si lo va a usar en producción. Para casos más comunes, como construir un árbol de decisión o hacer regresión, RapidMiner funciona perfectamente y la capacidad de obtener una plantilla de flujo de trabajo completamente funcional de la sección del tutorial es un toque genial.

¿Cómo se mejora y mejora la técnica de aprendizaje automático mientras nadie sabe exactamente cómo funciona?

Para un SVM lineal, ¿cómo se elige la intersección b * para el límite de decisión de margen máximo?

¿Usaría WEKA o MATLAB para la clasificación binaria?

¿Cuáles son los principales niveles de clasificación de reclusos?

¿Sería posible entrenar una computadora para reconocer con precisión a escritores individuales en Quora analizando muestras escritas?

¿Cuáles son las ventajas y desventajas de los proveedores de Internet que cobran más a los que consumen grandes cantidades de datos (por ejemplo, Netflix)?

Usé RapidMiner porque ofrecía una interfaz intuitiva en comparación con otras. No puedo codificar y tampoco soy matemático, pero puedo usar RapidMiner.

Fui a través de Data Mining for the Masses: Dr. Matthew A North: 9780615684376: Amazon.com: Books y estuve en funcionamiento en un par de noches. Estábamos luchando contra un gran problema de devolución de cargo, así que poco después de leer el libro pude usar RapidMiner para predecir la probabilidad de que las compras digitales sean fraudulentas o no a través de una de nuestras aplicaciones web. No era una solución automatizada que podría implementarse, sino que sirvió como un gran prototipo (y experiencia de aprendizaje). Los resultados fueron geniales. Este es un ejemplo relativamente simple, pero las predicciones eran ~ 90% precisas cuando el nivel de confianza era> 58%. Principalmente estaba usando regresión logística.

Modelo:

Conjunto de resultados de ejemplo:

Mustafa Kirac

Los lenguajes de script como python, matlab hacen felices a los investigadores y teóricos al permitirles programar y olvidar detalles de programación de bajo nivel. Aún sabemos la cantidad de productividad que se puede lograr con las secuencias de comandos. La forma en que las secuencias de comandos son para programadores no hardcore, es como RapidMiner es para los practicantes de aprendizaje automático / minería de datos. RapidMiner está basado en Java, por lo que obviamente tendrá todas las limitaciones de Java. RapidMiner tiene un diseño de proceso bastante intuitivo, por lo que puede ser muy útil para la creación rápida de prototipos y también puede integrarse fácilmente con cualquier aplicación Java existente. Para uso comercial, puede comprar la edición comercial RapidMiner, donde puede obtener soporte para el producto y también obtener un buen soporte de los foros de la comunidad.

Mi uso de Rapidminer

1. para mi proyecto de tesis de maestría

2. para la creación rápida de prototipos en el trabajo.

3. También he desarrollado una extensión para Rapidminer, para hacer uso de las funciones existentes de RapidMiner, junto con mi necesidad.

En general, estoy muy satisfecho con RapidMiner, ya que me ahorró mucho tiempo. Sí, puede ser un problema con grandes conjuntos de datos, pero funciona muy bien incluso en mi computadora portátil para pequeños conjuntos de datos. Casi uso RapidMiner, para hacer muchos preprocesamientos de datos para las competiciones de minería de datos en las que participo en Kaggle.com.

En resumen, RapidMiner no ofrece todo lo que necesita para Machine Learning, pero lo encuentro muy útil a menudo.

Jared Franklin

More Interesting

¿Los analistas de datos serán reemplazados por aprendizaje automático e inteligencia artificial pronto?

¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?

¿Cuándo y por qué un clasificador Bayes ingenuo es una opción mejor / peor que un clasificador forestal aleatorio?

¿Qué medida de evaluación fuera de línea para los sistemas de recomendación se correlaciona mejor con los resultados de la prueba AB en línea?

El límite de decisión de los árboles de decisión es el eje paralelo. Random Forests es un conjunto de árboles. ¿Cuál es el límite de decisión de los bosques aleatorios?

Qué rama es mejor en THAPAR UNIVERSITY: Computer Science Core (COE) o Hons. ¿En el aprendizaje automático y el análisis de datos (CML)?

¿Será factible dentro de los próximos 5 años que una API de aprendizaje automático maneje la construcción de representaciones significativas a partir de datos sin procesar?

¿El aprendizaje por refuerzo es escalable?

¿Qué son los vectores de características basados en cuadros (como se usan en el reconocimiento de voz)?