¿Por qué necesitamos científicos de datos si tenemos aprendizaje automático que puede analizar y procesar datos?

La ciencia de datos es una combinación de 2 tipos de lógica, razonamiento inductivo y razonamiento deductivo. [1]

El razonamiento deductivo se parece más a la “lógica formal”: el tipo de lógica que puede aprender en la lógica de un curso universitario de primer año (y, o, etc.). Las conclusiones de este tipo de razonamiento son ciertas y no probabilísticas. En ciencia de datos, esto significa tener hipótesis de que se puede probar muy concretamente con experimentos y datos que dan como resultado resultados concretos.

El razonamiento inductivo es más una “lógica informal” o un “argumento cotidiano” que se basa en una serie de entradas que pueden no estar directamente vinculadas. En ciencia de datos, esto generalmente significa hacer inferencias basadas en la exploración de los datos y el descubrimiento de relaciones o hipótesis que tal vez desee probar.

Como resultado, el aprendizaje automático es ideal para el razonamiento deductivo una vez que se te ocurren experimentos que tienen un objetivo final claro (en el aprendizaje automático, una función objetivo se llama así porque tiene un objetivo para el que se optimiza, por ejemplo, error mínimo) . Desafortunadamente, el razonamiento inductivo también es una gran parte del oficio y requiere intuición y la capacidad de sintetizar una serie de fuentes diferentes para llegar a una conclusión probable. Sin un razonamiento inductivo, el desarrollo de hipótesis y experimentos más concretos pueden no resolver el problema comercial que pueda tener.

Si desea utilizar la ciencia de datos para resolver problemas comerciales, se necesita una buena dosis de razonamiento inductivo para una solución integral.

Espero que esto ayude 🙂

Notas al pie

[1] https://www.boozallen.com/conten…

Los científicos de datos razonan cómo se recopilaron los datos, qué tipos de datos se han recopilado, qué distribución se aproxima al resultado, cómo se utilizarán los resultados (comprender un problema, encontrar subgrupos, crear la mejor precisión predictiva …) y cuántos predictores y las observaciones existen en un conjunto de datos. Luego los unen con los supuestos matemáticos de cada modelo estadístico y algoritmo de aprendizaje automático y los objetivos del proyecto para seleccionar el algoritmo correcto para el problema y sus datos. Luego interpretan los resultados y los informan a las partes interesadas clave con sus recomendaciones basadas en los modelos. Hasta que tengamos una IA fuerte, necesitaremos científicos de datos para hacer esto, ya que las computadoras no pueden razonar a través de problemas o evaluar el éxito de un proyecto.

¿Por qué necesitas cocineros si tienes batidoras eléctricas? ¿Por qué necesitas maestros cuando tienes calculadoras científicas?

Porque esas cosas son solo herramientas, utilizadas para completar tareas específicas. Todavía necesita que alguien lea la lista de ingredientes, comprenda cómo se combinan y luego use sus conocimientos y habilidades para hornear un pastel perfecto. Todavía necesita un maestro para impartir teoría científica, para guiar su conocimiento y poder evaluar efectivamente su comprensión del material.

Es lo mismo para ML. Es una herramienta. Los científicos de datos utilizan herramientas para resolver problemas y descubrir ideas. Decir que ML eventualmente reemplazará el elemento humano por completo puede suceder, pero la industria en su conjunto aún es muy joven.

Creo que la pregunta puede ser …

¿Por qué necesitamos científicos de datos si tenemos ingenieros de aprendizaje automático?

Esto será interesante a medida que el espacio madure.

En la próxima década apuesto a que la mayoría del aprendizaje automático aplicado será realizado por ingenieros de aprendizaje automático versus científicos de datos.

La nueva frase favorita en el aprendizaje automático es “democratizar el aprendizaje automático”.

¿Podemos democratizarlo lo suficiente para que los programadores expertos de Python puedan hacer el 90% del trabajo y el resto lo hagan los consultores que son científicos de datos? Supongo que sí.

Solo el tiempo podrá responder a esta.

¿Interesado en los modelos básicos utilizados en la mayoría de los problemas de aprendizaje automático? Toma este curso gratis.

Una introducción al aprendizaje automático para ingenieros de datos

No entiendo cómo ML puede analizar y procesar datos sin datos ¿Científicos?