¿Cuál es la diferencia entre investigación de operaciones, ciencia de datos, IA y aprendizaje automático? ¿Y cuál tiene el mejor alcance en el futuro?

Esta es una pregunta muy amplia y trataré de responderla con una vista (más simplificada) de 1000 pies.

Si bien todos estos campos se superponen más o menos dependiendo de los problemas en cuestión, también tienen algunas diferencias.

Comencemos con la IA y el aprendizaje automático. La Inteligencia Artificial está de acuerdo con Wikipedia (Inteligencia Artificial – Wikipedia):

La inteligencia artificial ( IA , también inteligencia de máquina , MI ) es un comportamiento aparentemente inteligente por parte de las máquinas, en lugar de la inteligencia natural ( NI ) de los humanos y otros animales. En ciencias de la computación, la investigación de IA se define como el estudio de “agentes inteligentes”: cualquier dispositivo que perciba su entorno y tome medidas que maximicen sus posibilidades de éxito en algún objetivo.

Coloquialmente, el término “inteligencia artificial” se aplica cuando una máquina imita las funciones “cognitivas” que los humanos asocian con otras mentes humanas, como “aprendizaje” y “resolución de problemas”.

Machine Learning es un subcampo de Inteligencia Artificial. Nuevamente, de Wikipedia (Aprendizaje automático – Wikipedia):

El aprendizaje automático es un campo de la informática que brinda a las computadoras la capacidad de aprender sin ser programado explícitamente.

Ciencia de los datos. Nuevamente de Wikipedia (Ciencia de datos – Wikipedia):

La ciencia de datos , también conocida como ciencia basada en datos , es un campo interdisciplinario sobre métodos, procesos y sistemas científicos para extraer conocimiento o ideas de los datos en varias formas, ya sea estructuradas o no, de manera similar a la minería de datos.

Y, por último, Investigación de operaciones, de Wikipedia (Investigación de operaciones – Wikipedia):

La investigación de operaciones , o investigación operativa en el uso británico, es una disciplina que se ocupa de la aplicación de métodos analíticos avanzados para ayudar a tomar mejores decisiones.

Ahora no tendría sentido que solo copie y pegue las definiciones dadas por Wikipedia, ¿no?

El aprendizaje automático es el campo en el que las personas programan algunos algoritmos que no son simples recetas de cocina (hacer esto, sino …), sino algoritmos que ajustan automáticamente (algunos de) sus parámetros y se les da cierta libertad para encontrar el camino hacia una solución. . En cierto modo, la computadora / máquina aprende a hacer las cosas a su manera (y a veces ni siquiera tenemos idea de lo que la computadora / máquina / algoritmo está haciendo exactamente).

La ciencia de datos es un campo amplio que se ocupa de los datos en general. Si esto suena vago, es normal porque realmente lo es. Ha sido una palabra de moda durante bastantes años. Esencialmente, trata de encontrar una manera de explotar los datos: ¿qué puedo hacer con mis datos (qué información puedo obtener de ellos?).

La Investigación de operaciones es la ciencia de la optimización matemática: modela un problema en “ecuaciones”, resuelve este modelo matemático y traduce las soluciones nuevamente en la configuración inicial del problema. Es una herramienta para ayudarlo a tomar decisiones: qué debo / puedo hacer para obtener esto o aquello.

Ahora, para comprender realmente las similitudes y diferencias, probablemente necesite ver esas ciencias en acción.

¿Cuál tiene el mejor alcance en el futuro? Todos tienen su importancia y es más lo que sus afinidades con ellos deben guiar su elección. Todos seguirán siendo importantes en unos años. El más popular de ellos en este momento es sin duda el aprendizaje automático. La tendencia es probablemente verlos a todos combinados. Básicamente, enfrentamos algunos problemas y hacemos lo que sea necesario para resolverlos.

Todos los campos tienen nombres que se explican por sí mismos. No obstante, hay cierta superposición y me gustaría ayudar a las personas a descubrir la diferencia.

El cerebro humano está diseñado para funcionar mejor en la memoria asociativa, entonces, ¿deberíamos resolver esto por correspondencias? Vamonos

Supongamos que está trabajando en el clásico problema de plegamiento de proteínas 3D NP completo. Tiene un banco de datos completo (PDB) además de usted. Intentarás descubrir varias combinaciones de minimización de energía para el plegamiento de proteínas.

Básicamente, estás jugando y manipulando tus datos, y en este proceso, tu máquina también coincide con patrones en tus datos. En resumen, APRENDE .

¿Viste eso? La ciencia de datos y el aprendizaje automático, que a menudo las personas usan indistintamente, no son EXACTAMENTE iguales.

La ciencia de datos es un arte de sacar conclusiones de sus datos, mediante la aplicación de herramientas estadísticas sobre los patrones obtenidos, y usarlos para otras aplicaciones del mundo real. El aprendizaje automático, por otro lado, está haciendo que la máquina haga cosas, que consideramos ‘específicas para humanos’ o ‘inteligentes’, que no es solo descubrir patrones en un conjunto de datos.

Los dos campos solo tienen una parte de coincidencia de patrones en común (también denominada aprendizaje supervisado y no supervisado en la comunidad de ML). Aunque he usado la palabra ‘solo’, esta es una parte GRANDE, y es uno de los principales impulsores comerciales para el éxito de ML.

En lo que respecta al aprendizaje automático, sus subconjuntos, y mucho menos el campo completo, son GIGANTICOS. ¿Has oído hablar de algoritmos genéticos, aprendizaje de transferencia, aprendizaje de refuerzo, bla, bla, bla?

Estos también entran en la categoría de Machine Learning. Sin embargo, estos no son industrialmente famosos a partir de ahora. Pero pronto, lo serán.

Llegando a la Inteligencia Artificial. ¿Qué te viene a la mente? Usted tiene un bot sexy, que maneja su inventario de comestibles, automáticamente determina cuándo obtener su automóvil para el servicio, en resumen, es ‘inteligente’. Pero espera, ¿no es lo mismo que estamos tratando de hacer con el aprendizaje automático?

Exactamente. Es posible que hasta ahora haya descubierto que el aprendizaje automático es solo una de las formas de lograr la inteligencia artificial. La Inteligencia Artificial como tal, es un juego completo de siguiente nivel, muy parecido a los bots que has visto en películas de ciencia ficción.

Déjame instanciar. Tienes un robot parado junto a ti. Subes a un árbol delante de él. Ahora, llamas a tu bot y le pides que trepe al árbol de la misma manera que lo hiciste. No sería capaz de hacer eso. Tendría que entrenar a su bot para trepar al árbol muchas veces. Su herramienta para esta tarea es el aprendizaje automático. ¿Llamarías a eso inteligencia? No.

¿Tienes la diferencia? ML es un ‘enfoque’ para la IA.

La investigación de operaciones es la toma de decisiones utilizando varios modelos matemáticos. La disciplina de la investigación de operaciones desarrolla y utiliza métodos matemáticos y computacionales para la toma de decisiones.

El campo gira en torno a un núcleo matemático que consta de varios temas fundamentales que incluyen optimización, sistemas estocásticos, simulación, economía y teoría de juegos, y análisis de redes.

La investigación de operaciones se conoce con diferentes nombres en diferentes organizaciones: análisis, análisis de sistemas y ciencias de gestión, entre ellas.

Primero debemos explorar diferentes campos, luego debemos hacer lo que nos intriga.

Tengo un título en investigación de operaciones y actualmente soy un científico de datos sénior, así que me gustaría dar mi perspectiva a este hilo.

Como otros han dicho, la Investigación de Operaciones (OR) se enfoca en traducir un problema comercial en un rompecabezas matemático que pueda resolverse para obtener información sobre cómo resolver el problema comercial real. Por lo general, esto significa formular algún problema de programación matemática para resolver. El resultado ideal es un conjunto de decisiones que se espera que conduzcan a un resultado óptimo.

La ciencia de datos (DS), en la medida en que se puede definir como cualquier cosa, se trata de predicción. Desea desarrollar modelos que “sigan” de cerca la realidad.

Lo interesante es que en el corazón de muchos problemas de predicción se encuentra un problema de optimización (por ejemplo, mínimos cuadrados o SVM). Además, el concepto de una “función de pérdida” es muy similar al de la función objetivo tradicional, tanto que “minimizar la pérdida” convierte efectivamente un ejercicio de ajuste del modelo en un problema de optimización.

Desde mi perspectiva, ML, DS y OR utilizan las mismas herramientas pero con diferentes énfasis. Como O mayor, también tomamos muchas probabilidades y estadísticas, por lo que el análisis estadístico y la exploración de datos son parte de la práctica de OR.

Tiendo a usar mi entrenamiento OR para responder a las preguntas de “¿y qué?”, ​​¿Por qué nos importa clasificar las fotos de gatitos y cachorros? ¿Hemos demostrado que dicho clasificador maximizará el ROI?

La parte DS está involucrada en la creación de dicho clasificador.

Escribí un artículo sobre esto en OR / MS Today en 2015 sobre cuántos de los campos en el dominio de análisis comparten un conjunto de habilidades comunes.

Los profesionales en todos esos campos son lo que solíamos llamar estadísticos. Son matemáticos aplicados que ajustan los datos en un modelo matemático que predice el comportamiento futuro de los nuevos datos. La única diferencia está en el título, los investigadores de operaciones trabajan en instituciones financieras o laboratorios, los científicos de datos trabajan en firmas de contadores o compañías de medios, los investigadores de IA trabajan en departamentos de I + D de la academia o la industria, y el aprendizaje automático es solo un subconjunto de IA. El dominio del problema dictará las matemáticas particulares que usan, pero la investigación detrás de las estadísticas se está reuniendo de tal manera que hay una promesa para la estandarización de las técnicas. Un modelo de aprendizaje profundo ahora es el mejor aproximador de funciones conocido por el hombre, así que eso es lo que todos terminan usando dentro de unos años.

La investigación de operaciones utiliza la ciencia de datos y la inteligencia artificial para un fin particular. Se enfoca en resolver problemas particulares para un fin comercial, social o académico en particular. Se basa en algoritmos matemáticos avanzados para tomar decisiones.

Data Science, como su nombre indica, se refiere a la extracción de significado de los datos. Se utilizan muchas operaciones estadísticas, así como operaciones de extracción y transformación. Esto se puede lograr usando IA, pero también se puede hacer sin IA. Por lo general, esto implica grandes datos.

AI generalmente significa una red neuronal artificial, aunque no siempre. Los árboles de decisión y otros sistemas basados ​​en el conocimiento, por ejemplo, son formas de IA. Hay mucha superposición con la ciencia de datos, pero la Inteligencia Artificial incluye un hardware especializado e incluso cierta superposición con la Biología Neural.

Los tres tienen demanda y deberían seguir siéndolo durante décadas.