¿Cuáles son las características principales de un sistema de minería de datos a nivel empresarial?

Puede pensar en estructurar el problema en 3 pasos, cuyas implementaciones dependerían de la vertical a la que apunta:

1. Ingestión de datos
No subestimes esto. La compatibilidad con diferentes formatos en la industria puede ser una ventaja competitiva significativa. Es trabajo sucio. Debe comprender cómo se recopilan y almacenan los datos en su vertical.

Necesitas entender
¿Cuál es la variedad, velocidad y volumen (3 Vs) de datos y cómo manejarlos en su aplicación?
¿Cuál será el ciclo de vida de los datos?
¿Cómo está archivando datos antiguos?

2. Análisis real

¿Qué variables son importantes?

¿Qué tipos de análisis necesitan sus clientes?
Puede ser solo una herramienta de agregación, o tener características sofisticadas como regresión, tendencias / predicciones / pronósticos, agrupamiento, etc.

¿Qué tan flexible es el análisis? ¿Puede el usuario cambiar la ventana de tiempo, las variables que se analizan?

3. Visualización
¿Cuál es la mejor visualización para todos estos datos y análisis? Piensa en gráficos. La información se puede mostrar por color, forma, tamaño y posición de los objetos. Iterará aquí con comentarios de los usuarios.

¿Qué son las estadísticas de nivel superior y qué se puede expandir para profundizar más?

—-
Espero que esto ayude.

Estoy de acuerdo con lo que dijo Varun Torka y quiero aprovechar sus comentarios # 2 y # 3. Una característica que es vital para un sistema de minería de datos exitoso, pero que a menudo se pasa por alto, es la necesidad de hacer que los datos sean “de venta libre”, ya que los espectadores de los datos reciben ayuda para comprender fácilmente los datos y usarlos correctamente (como -el producto de mostrador debe ofrecer etiquetado y otras características para garantizar que su contenido se use correctamente). Hacer esto te ayudará a lograr el # 2 y # 3 que mencionó Varun Torka. Esto es especialmente esencial para los “datos de alto riesgo” utilizados para tomar decisiones con consecuencias importantes. Por ejemplo, la mayoría de los sistemas de minería de datos proporcionados a los educadores simplemente “muestran los datos”, lo que resulta en solo un 48% de precisión cuando se analizan los datos, mientras que los sistemas de minería de datos deben mostrar los datos pero también proporcionar garantías para asegurar que los datos se entiendan (y Los educadores son generalmente personas inteligentes, así que imagine los problemas de análisis de datos en otros campos). Un conjunto de estándares de sistema de datos / informes (que implica la implementación efectiva de un sistema de ayuda, documentación complementaria, visualización de datos fácil de usar, etc.) en http://www.overthecounterdata.com/s/OTCDStandards.pdf resume más de 300 estudios sobre Las mejores formas de comunicar datos. Uno de los estudios clave de los que surgieron estos estándares es el mío, el “acceso abierto” disponible en PQDT Open. ¡La mejor de las suertes! 🙂