¿Qué es exactamente la minería de datos y cómo la aprendo?

La minería de datos es la práctica de buscar automáticamente grandes almacenes de datos para descubrir patrones y tendencias que van más allá del simple análisis. La minería de datos utiliza algoritmos matemáticos sofisticados para segmentar los datos y evaluar la probabilidad de eventos futuros. La minería de datos también se conoce como Knowledge Discovery in Data (KDD).

fuente: CLASIFICACIÓN DE LA CALIDAD DE LA ENERGÍA QUE CONSIDERA SAGS DE VOLTAJE EN SISTEMAS DE DISTRIBUCIÓN QUE UTILIZAN EL PROCESO KDD

Las propiedades clave de la minería de datos son:

  • Descubrimiento automático de patrones
  • Predicción de resultados probables
  • Creación de información procesable.
  • Centrarse en grandes conjuntos de datos y bases de datos.

La minería de datos puede responder preguntas que no pueden abordarse mediante técnicas simples de consulta e informes. fuente: ¿Qué es la minería de datos?

Video de entrenamiento con certificación

  • Curso de minería de datos en línea – Capacitación sobre minería de datos – Udemy
  • Minería de datos y raspado web: cómo convertir sitios en datos
  • Learning Data Mining with R [Video] (curso en video de paquete)

Libros

  • Minería de datos para Business Analytics: conceptos, técnicas y aplicaciones con XLMiner 3rd Edition
  • Data Science for Business: lo que necesita saber sobre minería de datos y pensamiento analítico de datos
  • Minería de datos: herramientas y técnicas prácticas de aprendizaje automático, tercera edición (serie Morgan Kaufmann en sistemas de gestión de datos)
  • Minería de datos: el libro de texto
  • Aprendizaje de minería de datos con R (libro)

Espero que te ayude 🙂

More Interesting

Actualmente soy gerente de una reconocida empresa de análisis de datos. ¿Está bien para mí continuar en un puesto directivo, o se me considerará solo un gerente general (sin relevancia para la industria analítica) unos años más adelante, sin experiencia práctica en diferentes técnicas / tecnologías? ?

¿Por qué mi CNN proporciona una buena precisión en los datos de entrenamiento y prueba (división 80-20 del total de datos de entrenamiento) pero falla miserablemente en los datos de validación (no vistos)?

¿Cuál es la mejor universidad para la maestría en ciencias de datos en Australia?

¿Cuál es la mejor manera de convertirse en un científico de datos sin tener experiencia en ingeniería?

Al preparar el conjunto de datos para el aprendizaje automático supervisado, ¿hay alguna otra forma que no sea etiquetar manualmente el conjunto de datos de entrenamiento?

Como experto en aprendizaje automático, ¿con qué aspectos de las bases de datos y la optimización de bases de datos debería estar familiarizado?

¿Qué problemas empresariales y sociales causa el consumo de energía del centro de datos?

¿Deberían los investigadores de educación adaptar R y alejarse del software estadístico minorista (SAS, Stata, SPSS)?

Cómo convencer a una organización de la importancia de las pruebas A / B

¿Es necesario implementar algoritmos principales de aprendizaje automático desde cero al menos una vez para obtener una pasantía en ciencia de datos en una empresa prestigiosa?

¿Existe alguna diferencia entre un científico de datos y el perfil ofrecido por Mu Sigma-Trainee Decision Scientist?

¿Todavía vale la pena hacer MS en aprendizaje automático clásico o minería de datos sin un módulo en profundidad sobre aprendizaje profundo que está en tendencia?

¿Cuáles son algunos trabajos de big data en los Estados Unidos?

¿Cuál de las habilidades de ciencia de datos te paga más?

¿Cómo ayudan los grandes datos o la ciencia de datos a los equipos deportivos y otras empresas relacionadas con la industria?