¿Cuál es la diferencia entre ciencia de datos, aprendizaje automático e inteligencia artificial?

Realmente quería responder esto por mucho tiempo. Muchos científicos de datos que han trabajado conmigo o con los que he interactuado en el mercado siempre me preguntan cuándo haré algo de aprendizaje automático o IA, es genial.

El trabajo de Data Scientist es ayudar a que el problema empresarial / independiente se trabaje de manera más eficiente con la ayuda de los conocimientos de los datos. En su mayoría, los problemas de negocios en esta era se pueden resolver a través de descripciones simples o inquisitivas, ya que se mantuvo virgen de los datos en el pasado. Si no es así, uno intenta optimizarlos aún más con modelos predictivos y comienza a construir modelos prescriptivos para impulsar el negocio de manera más efectiva. La mayoría de los científicos de datos quieren saltar directamente a modelos predictivos y eso me asusta. La razón de esto es que los modelos predictivos tardan en madurar y perfeccionarse a sí mismos, mientras que los dueños de negocios no tienen mucho tiempo a mano y cierran esas actividades, la mayoría de los modelos predictivos o modelos que tienen el potencial de convertirse en buenos son asesinados con fondos inmediatamente como personas detrás de estos modelos no se aplicó un enfoque de adopción gradual al dar a las empresas ideas descriptivas / inquisitivas simples antes de perfeccionar los modelos predictivos.

Ahora, volviendo al aprendizaje automático, es una ciencia en la que la máquina / computadora está programada para aprender. ‘Aprender’ es donde la gente comienza a perderlo. El aprendizaje puede ser de un conjunto de datos estático o puede ser un aprendizaje continuo. Por ejemplo, tome un niño que comenzó a aprender a caminar al ver caminar a sus padres en lugar de evolucionar como corredor y aprender todos los días sobre cómo mejorar su carrera. La inteligencia artificial es la segunda en la que la máquina está constantemente aprendiendo de los eventos que usted alimenta, mientras que el aprendizaje automático es un término más amplio en el que el aprendizaje único de un conjunto de datos o evento también cumple con los requisitos. Las personas que hacen un modelo de predicción único para el pronóstico del tiempo basado en datos de años pasados ​​no están construyendo un sistema artificialmente inteligente sino un modelo de aprendizaje automático, mientras que las personas que hacen un modelo de predicción del pronóstico del tiempo que mejora todos los días con la entrada de nuevos datos están construyendo un modelo de inteligencia artificial que también es aprendizaje automático.

La ciencia de datos es una disciplina general de estudiar datos con métodos científicos y llegar a conclusiones viables. En realidad, se ha practicado durante cientos de años, con técnicas como la ciencia actuarial: Wikipedia, que se remonta al siglo XVII.

El aprendizaje automático es una disciplina específica para lograr que las máquinas aprendan nuevos comportamientos y resultados sin que los humanos escriban nuevas reglas. Su llegada fue un gran avance ya que todas las computadoras se basan en reglas explícitas y se definen en forma de sus instrucciones.

Prácticamente todas las computadoras actuales se basan en la arquitectura de Von-Neumann basada en la arquitectura de programas almacenados donde los programas, que son flujos de instrucciones, se almacenan en la memoria. Todos los datos a procesar también se almacenan en la memoria, pero por separado.

Tenga en cuenta que en el aprendizaje automático, todos los nuevos comportamientos aprendidos también están representados por nuevos flujos de instrucciones que podrían verse como reglas, pero la diferencia es que estas nuevas reglas son creadas por máquinas, sin intervención humana. Entonces, el aprendizaje automático se trata básicamente de la creación automática de nuevas reglas.

La Inteligencia Artificial (IA) es una disciplina general de lograr que las computadoras actúen y exhiban comportamientos inteligentes similares a los humanos. A este respecto, es más limitado que el aprendizaje automático, ya que existen otras reglas que se pueden aprender, y actualmente se están aprendiendo, que no pertenecen al comportamiento inteligente.

La IA no es un subconjunto del aprendizaje automático, ya que puede ser posible, y de hecho así es como se intentó inicialmente, lograr un comportamiento inteligente similar al humano escribiendo reglas explícitas de personas en forma de programas como sistemas expertos.

Sin embargo, rápidamente se hizo evidente que la inteligencia es demasiado compleja como para que se intente emularla y enumerarla mediante reglas explícitas, por lo que tales esfuerzos se han abandonado. En cambio, prácticamente todos los esfuerzos se han basado en técnicas de aprendizaje automático.

Hoy, leí el pequeño artículo de opinión de David (Parnas) en el CACM: The Real Risks of Artificial Intelligence. Él, por supuesto, lo pone mucho mejor de su lado. Sin embargo, mi respuesta sigue en pie.

Tenga en cuenta que David habla de la “utilidad de la física y las matemáticas” con la que estoy de acuerdo. Además, tenga en cuenta que dice que la IA no está definida (y, tal vez, incluso indefinible). ¿Yo mismo? Veo el problema del “marco” como primordial, lo cual es indecidible. Además, la “utilidad” es muy parecida a la consulta de efectividad iniciada por Eugene (Wigner): cuasi-empirismo en las matemáticas.

Y así, los problemas planteados por personas como David están siendo ignorados en una carrera loca después de los juguetes, esencialmente. Y esos juguetes son peligrosos.

—- Nota (11/10/2017) a continuación es la respuesta original –

La ciencia de datos intenta extraer oro de la basura (ver crapularidad). Como tal, es un uso incorrecto de las matemáticas (hay mucho que discutir). Se podría decir que el trabajo estimado a través de las edades en el ámbito de la estadística (y la informática) condujo a esto. Sin embargo, la matemática computacional, en su conjunto, fue un contribuyente importante.

El aprendizaje automático está lanzando una red ampliamente basada en una cantidad impía de recursos informáticos para extraer lo que podría tener sentido si tuviera una base más allá de la basura. Marvin Minsky no se maravilló de esto (incluso hasta su muerte). Sin embargo, hay pepitas aquí si se hace correctamente desde cero con una buena influencia de arriba hacia abajo (que ahora falta).

Ahora, estas cosas cambian, como en el aprendizaje automático <-> ciencia de datos. Pollo y huevo para nosotros; nosotros comemos tampoco.

La inteligencia artificial también tiene décadas de antigüedad (al igual que DS y ML). Sin embargo, tenemos algunos éxitos sustanciales de los esfuerzos en esta disciplina. Sin embargo, “¿qué es?” sigue siendo un problema abierto.

Sabes, podríamos usar mejor esos recursos informáticos. Adage: para cualquier gasto de energía de la computadora, necesitamos múltiples esfuerzos para controlar las bestias relacionadas. Sí, comencemos con la quimera de los mercados y reiniciemos en esos físicos de doctorado que montaron todo.

Y, humano en el circuito es la clave. Tengo ejemplos reales para mostrar. ¿Ética y conocimiento? Se filtraría a través de esos seres biológicos que son nuestros hermanos y hermanas. Pies al fuego.

Entonces, AI podría estar por encima de DS y ML. ¿Ahora mismo? ML lo reinante. Eso es tonto, más allá de la razón.

—-

Editar (más tarde, 10/10/17): ¿Lengua en la mejilla? Quizás un poquito. Hay otras respuestas entrando. Entonces, ¿por qué esta toma? Es lamentable que algunas prácticas modernas se denominen ciencia. ¿Dónde puede haber una postura empírica como la que esperaríamos? El problema con la ciencia de datos puede no ser tan grande como lo encontramos con la ingeniería financiera que no tiene ciencia detrás.

Quizás, alguna disciplina podría unir todo esto. Pero, ¿el campo de entrenamiento para convertirse en un experto en ciencia de datos? ¿Y esto es para el aprendizaje automático y la inteligencia artificial? Oh, la ironía (ah, eso lo aprendí de un tipo notable).

—-

Editar (18/10/2017) – Computación e ingeniería de la verdad. Esencialmente, trabajar en clojure le da al viejo una idea de cómo podríamos mejorar las cosas.

La ciencia de datos es primo de las estadísticas, que incorpora herramientas como modelos estadísticos, pruebas de hipótesis, métodos de visualización y algoritmos de aprendizaje automático. La inteligencia artificial es una rama de la informática que a veces utiliza el aprendizaje automático como una herramienta para ayudar a las computadoras y los robots a aprender de su entorno. Puedes pensar en un diagrama de Venn con dos círculos en su mayoría no superpuestos, ciencia de datos e IA. La parte superpuesta es el aprendizaje automático (y probablemente algunos métodos bayesianos en estos días).

Puedes encontrar la diferencia exacta en el siguiente video

More Interesting

¿Es necesario implementar algoritmos principales de aprendizaje automático desde cero al menos una vez para obtener una pasantía en ciencia de datos en una empresa prestigiosa?

¿Crees que las herramientas basadas en la interfaz visual podrán / pueden igualar el poder del código?

¿Cuáles son algunas ideas de proyectos de ciencia de datos de baloncesto?

¿Cómo compararía el aprendizaje de la ciencia de datos de cursos pagos como Cloudera y cursos gratuitos como Udacity y Coursera?

Cómo determinar la complejidad de una oración en inglés

¿Los científicos de datos piensan que Hadoop tiene errores?

¿Cómo se utilizan los grandes datos en la industria del petróleo y el gas? La industria del petróleo y el gas ya contaba con sistemas de adquisición de datos e informes implementados para la producción y el mantenimiento. ¿Qué nivel adicional de gestión de datos proporciona Big Data?

¿Cuál es la diferencia entre los archivos .zip, .rar, .deb y .tar?

Con experiencia en informática, ¿vale la pena aprender R y ciencia de datos?

¿Cuáles son los logros de Yahoo en el campo de Big Data?

R requiere que los datos se carguen en la RAM, ¿eso no dificulta el trabajo con grandes conjuntos de datos? En caso afirmativo, ¿cómo es R tan popular entre los científicos de datos?

¿Qué significa exactamente la ciencia de datos?

Cómo manejar grandes cantidades de datos generados a partir de varias fuentes de datos

¿Cuáles son algunos cursos de análisis de datos?

¿Qué es la agregación de datos?