¿Los científicos de datos usan Rapid Miner?

RapidMiner definitivamente se usa. Y bastante ampliamente como lo demuestra la encuesta de 2015 de KDNuggets.

Sin embargo, como muchas herramientas de análisis, sospecho que hay un fuerte sesgo geográfico en los resultados. Y esto puede estar impulsando lo que puede estar experimentando si no puede encontrar muchos usuarios de RapidMiner en su comunidad local de ciencia de datos.

Es probable que esto se deba principalmente al enfoque del desarrollo empresarial y los esfuerzos de marketing de varias herramientas.

Como ejemplo, cuando trabajaba en Australia, era raro encontrar usuarios de RapidMiner incluso entre reuniones de cientos de científicos de datos y entusiastas de la ciencia de datos. Muchos habían oído hablar de él, pero simplemente no parecía estar tan integrado en la comunidad. Por otro lado, Tableau parecía ser fuerte en la región y era el estándar de facto para la visualización. El aleta amarilla también hizo una serie de apariciones en contextos de trabajo y anuncios de trabajo, probablemente porque tenían su sede en Australia.

Cuando me mudé a Asia, mi experiencia fue que Tableau fue uno de los muchos en la mezcla que incluía Qlikview y Spotfire, entre otros. El aleta amarilla casi no se veía por ninguna parte.

Entonces, desde el mismo sitio, aquí está el desglose geográfico de los encuestados:

La participación por región fue: EE. UU. / Canadá (41.5%), Europa (38.4%), Asia (8.2%), América Latina (6.3%), Australia / NZ (3.1%), África / Medio Oriente (2.5%).

Como alguien que usa Knime y ha usado el modelador SPSS en el pasado, puedo decir que muy pocos usan las herramientas Point and Click a menos que estén en una industria determinada, como los seguros, que usan estas herramientas. La mayoría prefiere usar R o Python. Dicho esto … para la exploración inicial de datos y el modelado rápido, me gustan las herramientas de apuntar y hacer clic. Sin embargo, aquellos que trabajan con conjuntos de datos masivos no van a utilizar estas herramientas debido a las limitaciones de tamaño.

En mi opinión, esta es la herramienta más apropiada para resolver el problema del análisis de datos hoy en día.

No lo uso a menudo, pero estoy en I + D, por lo que muchas de las herramientas que uso todavía no existen en las plataformas. Sin embargo, conozco a varios profesionales que lo usan.