¿Cuál ha sido la experiencia de la gente con RapidMiner?

He probado RapidMiner, SAS EM y Oracle DM para hacer análisis de series temporales de datos transaccionales y análisis de patrones utilizando características anteriores. En mi opinión, RapidMiner tiene la interfaz más intuitiva para personas con antecedentes académicos debido a la terminología utilizada en la documentación y los menús. Sin embargo, RapidMiner requiere muchos más recursos de hardware que SAS y ODM para exactamente la misma tarea y la misma cantidad de datos. Además, cuando sus datos no están en archivos planos y almacenados en una base de datos, me resulta muy difícil (en cuanto a la interfaz de usuario) integrarlo con un RDBMS. También tuve algunas excepciones de Java durante mis intentos de acceso a la base de datos de que Google no devolvió ningún resultado para poder resolver el problema por mi cuenta. Por lo tanto, es posible que necesite comprar soporte si lo va a usar en producción. Para casos más comunes, como construir un árbol de decisión o hacer regresión, RapidMiner funciona perfectamente y la capacidad de obtener una plantilla de flujo de trabajo completamente funcional de la sección del tutorial es un toque genial.

Usé RapidMiner porque ofrecía una interfaz intuitiva en comparación con otras. No puedo codificar y tampoco soy matemático, pero puedo usar RapidMiner.

Fui a través de Data Mining for the Masses: Dr. Matthew A North: 9780615684376: Amazon.com: Books y estuve en funcionamiento en un par de noches. Estábamos luchando contra un gran problema de devolución de cargo, así que poco después de leer el libro pude usar RapidMiner para predecir la probabilidad de que las compras digitales sean fraudulentas o no a través de una de nuestras aplicaciones web. No era una solución automatizada que podría implementarse, sino que sirvió como un gran prototipo (y experiencia de aprendizaje). Los resultados fueron geniales. Este es un ejemplo relativamente simple, pero las predicciones eran ~ 90% precisas cuando el nivel de confianza era> 58%. Principalmente estaba usando regresión logística.

Modelo:

Conjunto de resultados de ejemplo:

Los lenguajes de script como python, matlab hacen felices a los investigadores y teóricos al permitirles programar y olvidar detalles de programación de bajo nivel. Aún sabemos la cantidad de productividad que se puede lograr con las secuencias de comandos. La forma en que las secuencias de comandos son para programadores no hardcore, es como RapidMiner es para los practicantes de aprendizaje automático / minería de datos. RapidMiner está basado en Java, por lo que obviamente tendrá todas las limitaciones de Java. RapidMiner tiene un diseño de proceso bastante intuitivo, por lo que puede ser muy útil para la creación rápida de prototipos y también puede integrarse fácilmente con cualquier aplicación Java existente. Para uso comercial, puede comprar la edición comercial RapidMiner, donde puede obtener soporte para el producto y también obtener un buen soporte de los foros de la comunidad.

Mi uso de Rapidminer

1. para mi proyecto de tesis de maestría

2. para la creación rápida de prototipos en el trabajo.

3. También he desarrollado una extensión para Rapidminer, para hacer uso de las funciones existentes de RapidMiner, junto con mi necesidad.

En general, estoy muy satisfecho con RapidMiner, ya que me ahorró mucho tiempo. Sí, puede ser un problema con grandes conjuntos de datos, pero funciona muy bien incluso en mi computadora portátil para pequeños conjuntos de datos. Casi uso RapidMiner, para hacer muchos preprocesamientos de datos para las competiciones de minería de datos en las que participo en Kaggle.com.

En resumen, RapidMiner no ofrece todo lo que necesita para Machine Learning, pero lo encuentro muy útil a menudo.

More Interesting

¿Los analistas de datos serán reemplazados por aprendizaje automático e inteligencia artificial pronto?

¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?

¿Cuándo y por qué un clasificador Bayes ingenuo es una opción mejor / peor que un clasificador forestal aleatorio?

¿Qué medida de evaluación fuera de línea para los sistemas de recomendación se correlaciona mejor con los resultados de la prueba AB en línea?

El límite de decisión de los árboles de decisión es el eje paralelo. Random Forests es un conjunto de árboles. ¿Cuál es el límite de decisión de los bosques aleatorios?

Qué rama es mejor en THAPAR UNIVERSITY: Computer Science Core (COE) o Hons. ¿En el aprendizaje automático y el análisis de datos (CML)?

¿Será factible dentro de los próximos 5 años que una API de aprendizaje automático maneje la construcción de representaciones significativas a partir de datos sin procesar?

¿El aprendizaje por refuerzo es escalable?

¿Qué son los vectores de características basados ​​en cuadros (como se usan en el reconocimiento de voz)?

¿El libro de Neural Networks de James Freeman cubre todos los temas?

¿Cómo funcionan las redes neuronales convolucionales?

Sistemas móviles: ¿Qué empresas / organizaciones de investigación están trabajando en el área de análisis de comportamiento / sistemas colaborativos basados ​​en dispositivos móviles?

¿Debo saber Python y R para aprender Machine Learning?

¿Cuáles son las áreas de investigación abiertas en refuerzo y aprendizaje profundo?

Soy candidato a doctorado en una universidad en Irán, tengo experiencias en PNL persa, Spark, Hadoop y aprendizaje profundo. ¿Tengo alguna posibilidad de ingresar a Google?