¿En qué se diferencia el aprendizaje automático de la minería de datos?

El aprendizaje automático y la minería de datos son dos entidades separadas, pero están en armonía entre sí. Esa es la razón por la cual las personas usan el aprendizaje automático y la minería de datos de manera intercambiable. Pero es imprescindible comprender que el aprendizaje automático difiere ampliamente de la minería de datos. ¡A ver cómo!

Comprensión de la minería de datos

La minería de datos es el proceso de obtener información valiosa y patrones ocultos de los datos. La minería de datos no es algo nuevo. La tecnología ha estado allí pero nunca ha sido explorada. La minería de datos se usa ampliamente para grandes conjuntos de datos para identificar patrones ocultos en los datos. Es el primer paso de la ciencia de datos.

Una vez más, la gente piensa que la minería de datos es la extracción de datos. La minería de datos se produce después de la extracción de datos cuando los ha reunido. Para descubrir patrones en los datos, la minería de datos utiliza detección de anomalías, análisis de conglomerados, minería de reglas de asociación, etc.

Las organizaciones están utilizando la minería de datos para identificar la asociación entre aspectos internos como el costo, las habilidades de los empleados y los aspectos externos como el escenario económico, la competencia, etc.

Comprender el aprendizaje automático

El aprendizaje automático es la ciencia de crear algoritmos y programas que aprenden por sí mismos. Una vez diseñados, no necesitan un humano para mejorar. Algunas de las aplicaciones comunes del aprendizaje automático incluyen: búsqueda en la web, filtros de spam, sistemas de recomendación, colocación de anuncios, calificación crediticia, detección de fraude, comercio de acciones, visión por computadora y diseño de medicamentos.

Una manera fácil de entender es esto: es humanamente imposible crear modelos para cada posible búsqueda o spam, por lo que hace que la máquina sea lo suficientemente inteligente como para aprender por sí misma. Cuando automatiza la parte posterior de la minería de datos, se conoce como aprendizaje automático.

El diferenciador

La minería de datos comienza con datos no estructurados para identificar patrones ocultos en los datos. Machine Learning se basa completamente en algoritmos
Extractos de minería de datos del almacén de datos. Machine Learning lee la máquina que está relacionada con el software del sistema.
La minería de datos utiliza principalmente datos. ML utiliza técnicas de uso múltiple.
La comunidad de minería de datos tiene énfasis en aplicaciones y algoritmos. Community of ML da más énfasis a las teorías.
La minería de datos es más una investigación que utiliza métodos como Machine Learning. Machine Learning entrena a las computadoras para realizar tareas inteligentes.

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y está fuertemente orientado a la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Programa – http://www.greyatom.com/full-sta…
Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…

¿Cómo es Octave el mejor lenguaje utilizado para el aprendizaje automático?

¿Podemos obtener un intervalo de confianza para la salida de un clasificador en el aprendizaje supervisado?

¿Es c # una buena opción para el aprendizaje automático de producción?

¿Cuáles son las deficiencias del aprendizaje profundo? ¿Cuál es el mayor defecto o limitación del aprendizaje profundo?

¿Llegará un momento en que los humanos informarán a los robots inteligentes?

¿Cómo debo comenzar a aprender ‘Machine Learning usando Java’?

Minería de datos: el proceso computacional del conocimiento que se descubre a partir de grandes conjuntos de datos. Específicamente, la minería de datos es el proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles y, en última instancia, comprensibles a partir de un gran volumen de datos.

En términos generales, el aprendizaje automático y la base de datos son dos soportes para la minería de datos. La base de datos ofrece técnicas de gestión de datos, mientras que el aprendizaje automático ofrece técnicas de análisis de datos [Zho03].

La investigación tradicional de aprendizaje automático no considera los datos masivos como un objetivo. Muchas técnicas están diseñadas para manejar datos pequeños y medianos. Si estas técnicas se utilizan directamente para datos masivos, los resultados pueden ser pobres o el algoritmo puede no funcionar. Por lo tanto, la minería de datos debe realizar algunas transformaciones específicas y no triviales a estas técnicas. De hecho, los algoritmos ejecutados en tiempo polinómico pueden considerarse muy buenos en el aprendizaje automático, pero cuando se enfrentan a datos masivos, la minería de datos puede no aceptar algoritmos con complejidad de tiempo O (n ^ 3). Por lo tanto, la estructura de datos eficiente y la estrategia de programación de datos, en qué base de datos es buena, pueden usarse para transformar los algoritmos de aprendizaje automático.

Por otro lado, la minería de reglas de asociación no se investiga en el aprendizaje automático, ya que se puede resolver mediante el análisis de correlación en las estadísticas si el tamaño de los datos no es grande. El problema en la minería de reglas de asociación es totalmente por el tamaño masivo de los datos. Por ejemplo, no podemos escanear la base de datos completa demasiadas veces, la capacidad de cálculo y el almacenamiento de memoria no pueden permitir demasiados resultados intermedios, etc.

[Zho03] Zhi-Hua Zhou. Tres perspectivas de la minería de datos, 2003.

Nirali Khoda

Machine Learning relacionado con el estudio, diseño y desarrollo de los algoritmos que proporcionan a las computadoras la capacidad de aprender sin ser programados explícitamente.

La minería de datos es la extracción de conocimiento de diferentes tipos de datos.

Minería de datos Vs Inteligencia artificial Vs Aprendizaje automático – Análisis inicial

Sujoy Roychowdhury

La minería de datos está allí por mucho tiempo. Es simplemente encontrar el descubrimiento de conocimiento a partir de los datos disponibles. Si muchos clientes compran pan y leche en un supermercado y lo colocan cerca o ofrecen una oferta combinada, la infidelidad aumentará la venta. Este es el análisis de la cesta de la compra. Una forma temprana de implementación de minería de datos. La minería de datos puede ser un problema de clasificación, predicción o agrupamiento.

Al principio, los métodos como la coincidencia de diccionario, los enfoques de coincidencia de patrones basados en reglas se usaban para resolver problemas. Después de un largo tiempo de investigación, se introdujo el aprendizaje automático para resolver esto.

Los enfoques de aprendizaje automático produjeron modelos más algorítmicos, confiables y de mejor rendimiento. CRF, SVM, CNN, algoritmos genéticos hicieron algunos modelos de alto rendimiento para problemas de minería de datos.

Entonces, el aprendizaje automático es la nueva tendencia de los enfoques algorítmicos que brinda un mejor rendimiento en el problema de la minería de datos.

La minería de datos le da un problema (clasificación, reconocimiento de patrones, agrupamiento). El aprendizaje automático lo suela.

Sujoy Roychowdhury

El aprendizaje automático y la minería de datos se superponen. La minería de datos incluye herramientas de visualización, así como algoritmos de aprendizaje automático (generalmente algoritmos de aprendizaje no supervisados o semisupervisados); el aprendizaje automático incluye algoritmos supervisados, semisupervisados y no supervisados.

Stan Garfield

Desde

Computación Cognitiva e Inteligencia Artificial
Analítica e Inteligencia de Negocios

Aquí están las definiciones:

Aprendizaje automático: dar a las computadoras la capacidad de aprender sin ser programado explícitamente; un método de análisis de datos que automatiza la construcción de modelos analíticos; usando algoritmos que aprenden iterativamente de los datos para encontrar información oculta sin ser programados explícitamente dónde buscar
Minería de datos: encontrar anomalías, patrones y correlaciones dentro de grandes conjuntos de datos para predecir resultados

Stan Garfield

Si bien hay una línea fina, la minería de datos es una identificación más terminada de los patrones. El aprendizaje automático implica el uso de algoritmos para resolver problemas supervisados y no supervisados en los que identifica un patrón y lo utiliza para inferir datos nuevos. Sin embargo, se utilizan muchas técnicas de ML en la minería de datos, especialmente técnicas de ML no supervisadas

Nirali Khoda

La minería de datos se utiliza para extraer información útil al buscar patrones y también manipularla según sea necesario y encontrar una correlación entre ellos.

Ej: Qué tipo de productos compran mis clientes los domingos.

Machine Learning utiliza conjuntos de datos y luego aplica algoritmos de ML para obtener resultados que respondan algunas preguntas.

Ej: ¿Qué productos puedo recomendar a los clientes para el domingo para aumentar las ventas?

Nirali Khoda

More Interesting

¿Por qué la normalización media ayuda en el descenso del gradiente?

¿Por qué en cualquier máquina eléctrica la corriente aumenta cuando aumenta la carga de esa máquina?

¿Qué lenguaje de programación se usa para el aprendizaje automático?

¿Cómo funciona el soporte de regresión vectorial?

¿Es necesario ajustar manualmente la tasa de aprendizaje cuando uso el método de descenso de gradiente estocástico de Adam en la práctica?

En la extracción de relaciones (PNL), ¿cuál es la diferencia entre la extracción de relaciones supervisada, semi-supervisada y no supervisada?

¿Cómo podemos hacer que las redes profundas funcionen de manera eficiente en dispositivos de baja potencia (por ejemplo, teléfonos)?