¿Cuáles son las características principales de un sistema de minería de datos?

¿Qué es la minería de datos?
http: // … La minería de datos es la práctica de buscar automáticamente grandes cantidades de datos para descubrir patrones y tendencias que van más allá del simple análisis. La minería de datos utiliza algoritmos matemáticos sofisticados para segmentar los datos y evaluar la probabilidad de eventos futuros. La minería de datos también se conoce como Knowledge Discovery in Data
Las propiedades clave de la minería de datos son:

  • Descubrimiento automático de patrones
  • Predicción de resultados probables
  • Creación de información procesable.
  • Centrarse en grandes conjuntos de datos y bases de datos.

La minería de datos puede responder preguntas que no pueden abordarse mediante técnicas simples de consulta e informes.
http: // … Descubrimiento automático
La minería de datos se logra mediante la construcción de modelos. Un modelo usa un algoritmo para actuar sobre un conjunto de datos. La noción de descubrimiento automático se refiere a la ejecución de modelos de minería de datos.
Los modelos de minería de datos se pueden usar para extraer los datos sobre los que están construidos, pero la mayoría de los tipos de modelos se pueden generalizar a datos nuevos. El proceso de aplicar un modelo a nuevos datos se conoce como puntuación http: // ….

Una característica que es vital para un sistema de minería de datos exitoso, pero que a menudo se pasa por alto, es la necesidad de hacer que los datos sean “de venta libre”, ya que los espectadores de los datos reciben ayuda para comprender fácilmente los datos y usarlos correctamente (como -el producto de mostrador debe ofrecer etiquetado y otras características para garantizar que su contenido se use correctamente). Esto es especialmente esencial para los “datos de alto riesgo” utilizados para tomar decisiones con consecuencias importantes. Por ejemplo, la mayoría de los sistemas de minería de datos proporcionados a los educadores simplemente “muestran los datos”, lo que resulta en solo un 48% de precisión cuando se analizan los datos, mientras que los sistemas de minería de datos deben mostrar los datos pero también proporcionar garantías para asegurar que los datos se entiendan (y Los educadores son generalmente personas inteligentes, así que imagine los problemas de análisis de datos en otros campos). Un conjunto de estándares de informes / sistema de datos (que implica la implementación efectiva de un sistema de ayuda, documentación complementaria, visualización de datos fácil de usar, etc.) en Page en overthecounterdata.com resume más de 300 estudios sobre las mejores formas de comunicar datos. Uno de los estudios clave de los que surgieron estos estándares es el mío, el “acceso abierto” disponible en PQDT Open. ¡La mejor de las suertes! 🙂

More Interesting

¿Puede un desarrollador de Java entrar en big data y análisis sin ninguna experiencia previa?

¿Cómo es útil la econometría tradicional como la que se enseña en los programas de posgrado en economía para los científicos de datos en la práctica?

¿Cuál es el mejor método matemáticamente sólido para crear una tasa ponderada de participación en Facebook?

Como científico de datos, ¿es útil una clase de análisis de algoritmos?

¿Cuál es la diferencia entre los conceptos de minería de datos y Big Data?

Cómo hacer un cambio de carrera en el campo de big data y análisis

¿Tiene 36 años para emprender una carrera en ciencia de datos?

¿Qué piensa sobre la inmersión en la ciencia de datos de Galvanize en Austin?

¿Hay algún conjunto de datos biológicos periódico con respecto al tiempo y forma un bucle cuando se traza entre ellos pero no contra el tiempo? Mira el comentario!

¿Qué empresas serían consideradas estrellas en ascenso con Big Data?

¿Cómo se puede usar la ciencia de datos en la aviación?

Matemáticamente hablando, ¿cuándo los números de lotería ganadores del pasado afectan los sorteos futuros?

Quiero ser un científico de datos. ¿Qué tipo de trabajo puedo hacer para mi tesis después de aprender Hadoop?

Tengo 10 años de experiencia en mainframe. Estoy tratando de aprender Big Data Analytics. ¿Cómo procedo? No entiendo el mundo distribuido.

¿Cuál es la diferencia entre un científico de datos y un profesional de inteligencia de negocios?