¿Se volverán obsoletos los científicos de datos con el surgimiento de la IA en términos de codificación, estadísticas, aprendizaje automático, gestión de bases de datos y técnicas de visualización?

Creo que su demanda disminuirá significativamente; pero tendrá menos que ver con la IA y más con los avances en las herramientas de software para la ciencia de datos.

Al final del día, eso es lo que hace el software. Automatiza tareas. Incluso tareas de desarrollo de software.

Comencé a programar en COBOL y FoxPro hace veinte años. Mi primer proyecto profesional (es decir, pago) fue para un ingenio azucarero local en Pakistán, desarrollando un software de contabilidad personalizado para ellos y capacitando a un pequeño equipo de operadores de ingreso de datos para usar el software. Me llevó más de seis meses desarrollar todo el proyecto. ¡Hoy, con SAP u Oracle, puede construir ese proyecto en seis horas! ¡Y es probable que tenga muchos menos errores también! Este ciertamente no es un ejemplo aislado. Los programadores, hace un par de décadas, tuvieron que construir sistemas completos desde cero, incluso en un lenguaje de programación de alto nivel. Los programadores de hoy en día solo necesitan unir bloques de funcionalidades listas para usar, ya sea de un único proveedor como SAP, o de varios proveedores de SDK de terceros y de código abierto.

De acuerdo, el mercado laboral para los programadores en general no ha disminuido. Esto se debe a que a medida que la tecnología seguía avanzando, las empresas seguían pidiendo más funcionalidad, y la complejidad del software seguía aumentando. Al principio estaban contentos si el software podía imprimir automáticamente una hoja de cálculo resumiendo todos sus datos contables. Ahora quieren un monitoreo en tiempo real de toda su logística y acceso al almacenamiento y computación en la nube.

Sin embargo, si nos fijamos en la mayoría de las verticales. El número de programadores necesarios para cualquier tarea / dominio dado por compañía ciertamente disminuye después de alcanzar un pico.

Data Science tampoco es inmune a este fenómeno. Data Science es solo estadística aplicada. Por supuesto, si desea aplicar estadísticas hoy, querrá usar computadoras. Así, el famoso comentario de que un científico de datos es alguien que es mejor en programación que un estadístico y mejor en estadística que un programador.

Los libros de texto o los entusiastas pueden producir definiciones anormalmente amplias de la ciencia de datos, pero si observa lo que hacen los científicos de datos en la práctica (o incluso solo mira anuncios de trabajo relevantes), se dará cuenta de que una gran parte de su tiempo se dedica a la logística: moviendo datos, tratando con almacenamiento distribuido y cómputo. El cómputo distribuido convencional no es tan antiguo, y esa es la razón de la inmadurez actual de las herramientas. Pero ciertamente pronto tendremos herramientas que pueden automatizar estas tareas logísticas. Del mismo modo, a medida que las herramientas se vuelvan más maduras y los estándares para estructurar y almacenar datos se adopten más ampliamente, será mucho más fácil visualizar y extraer inferencias de los datos.

Imagínense: si las herramientas que tratan con datos se vuelven tan fáciles de usar, que un empleado o asistente de gerente (¡o incluso un MBA!) Podría unir todas las tareas estándar de procesamiento de datos juntas, ¿para qué necesitaríamos científicos de datos especializados? La mayoría de los flujos de trabajo de DS se pueden enlatar y vender, de modo que los no expertos puedan operarlos.

Si tiene fuertes dudas sobre esto, probablemente esté combinando el trabajo de un “científico de datos” profesional de hoy, con un científico de aprendizaje automático o IA.

Claro, el día que esta IA puede:

  • Vea que el precio del producto Y repentinamente fue multiplicado por 10.
  • Y luego decide por su cuenta ir a preguntarle a la gerencia del producto qué sucedió.
  • Allí, logra aprender que esto se debe a que ya no venden unidades individuales, sino que las empaquetan por 12, promoviéndolas por ahora como 10 + 2 gratis.
  • Y ahora es capaz de reflexionar sobre cuál es el precio unitario correcto para trabajar.
  • Mientras que en el enfriador de agua (mi IA imaginaria está ejecutando una configuración refrigerada por agua sobre ruedas), el enlace minorista descubre que también hay un puesto de promoción en las tiendas, en el frente y en el centro.
  • Vuelve a su enchufe de alimentación y señala que la bandera promocional no se completa en más del 80% de las tiendas minoristas.
  • Regresa (¿pasa el cursor?) De vuelta al enlace minorista y habla sobre ello. Él sabe que esos malditos minoristas son pésimos en lo que respecta a la entrada de datos, pero no puede estar seguro.
  • Establece una llamada de Skype con el equipo de marketing para informarles que no podrá distinguir los efectos de soporte promocional de los efectos de promoción de volumen en las ventas.
  • A su vez, se intensifican, porque este es el cambio más grande que han hecho en su producto de mayor recaudación, ¡y necesitan saberlo!
  • La IA no tiene emociones, por lo que no está enojado porque no se le mantuvo informado desde el principio por algo tan importante. En cambio, simplemente no comprende a estos seres humanos irracionales.
  • La IA es lo suficientemente inteligente como para saber que están exagerando, pero también siente que es un tema políticamente sensible y un esfuerzo adicional aquí creará bastante buena voluntad con el vicepresidente de marketing en el futuro.
  • Por lo tanto, llama a los minoristas uno por uno para recopilar esa información de forma manual, haciendo un aventón con una persona del equipo de ventas para pedirles cara a cara a los propietarios de las 5 tiendas con terribles acentos telefónicos.
  • Lo conecta y puede hacer un gran análisis de lo que ahora significa todo esto.
  • Convierte eso en un powerpoint convincente, lo comparte con la gerencia y puede transmitir la esencia con una voz de robot fresca y relajada.

Sí, si es capaz de hacer todo eso, estaré muy asustado.

Así que me siento bastante seguro en este momento.

Y aunque lo anterior es un escenario ficticio, la mayor parte es una mezcla de cosas que he encontrado en los últimos años en varias compañías.

Y luego ni siquiera estamos hablando de cómo automatizar el análisis en sí. Tal vez eso esté más cerca de ser factible, pero no veo que eso se acerque lo suficientemente pronto.

Absolutamente no.

¿Se volvieron obsoletos los contadores cuando salió el software de contabilidad?

La IA es y seguirá siendo un problema específico durante las próximas décadas. Ya sea que se trate de identificar cosas en imágenes, traficar anuncios digitales, establecer precios, recomendar productos similares, reordenar el inventario o las muchas otras cosas que se le han encomendado a la IA, incluso averiguar en qué usar la IA requiere científicos de datos. Sin mencionar que administrar la IA requiere científicos de datos.

La IA también requiere mucho cuidado y alimentación de los humanos para mejorar, como otro encuestado citó a Elon Musk diciendo

Esta combinación ha sido probada en investigaciones publicadas del mundo real. The Economist publicó recientemente un artículo que muestra que la automatización completa de un proceso comercial clave con IA condujo a más contrataciones: cómo Otto de Alemania utiliza la inteligencia artificial.

Con un mejor acceso a más datos y herramientas más poderosas (como IA) para hacer cosas con él, tanto los científicos de datos como el título relacionado, analistas de negocios, solo aumentarán en número (para la diferencia, vea esta respuesta de Quora).

Sugerir que la IA reducirá la demanda de científicos de datos es como sugerir que WordPress, SquareSpace y WIX reducirían la demanda de desarrolladores web front-end. O Intuit reduciría la demanda de contadores.

Esta vez no será diferente. Espere mucha más demanda de científicos de datos.

P: ¿Los científicos de datos se volverán obsoletos con el surgimiento de la IA?

La IA no se “eleva” exactamente por sí misma. Probablemente necesite científicos de datos.

“Las personas se equivocan cuando piensan que la tecnología simplemente mejora automáticamente. No mejora automáticamente. Solo mejora si mucha gente trabaja muy duro para mejorarlo ”- Elon Musk

Probablemente serán los científicos de datos quienes desempeñarán roles clave tanto en la investigación, evolución e implementación de la IA.

Y la IA no ‘se eleva’ en un solo lugar. Para darle sentido … probablemente necesite científicos de datos.

Es muy poco probable que haya ‘un AGI’ para gobernarlos a todos. Es mucho más probable una multitud de grupos de IA con una multitud aún mayor de herramientas, API, marcos y plataformas competidoras y complementarias.

¿Y quién usará y aprovechará estas cosas? ¿Tiene sentido? ¿Ayuda a un usuario no técnico a elegir la combinación correcta? Lo has adivinado (científicos de datos).

Considere también que los datos del mañana no son los datos de hoy.

Busque científicos de datos de IoT especializados en transmisión de datos hace un par de décadas y compárelo con hoy. (El término en sí mismo probablemente solo se acuñó en 1999)

Piense en almacenar datos AR / VR / MR en las estructuras de datos y la infraestructura de datos de hoy. Piensa en cosas extrañas como los datos en el espacio y en Marte, y las incógnitas desconocidas que ni siquiera podemos concebir hoy.

Y los datos no necesitan que la IA sea valiosa.

Mucho antes de que la ciencia de datos se convirtiera en una cosa, los datos financieros se vendieron a través de Bloomberg, Nielsen recopiló y analizó datos de investigación de mercado, y las agencias de inteligencia de todo el mundo estudiaron detenidamente los datos.

La automatización de las tareas de ciencia de datos no elimina automáticamente la interpretación, el valor y la investigación de los datos.

Sin embargo, los científicos de datos de hoy probablemente se dividirán en múltiples roles, más claramente definidos.

Esto ya está sucediendo y se refleja en las respuestas aquí, la proliferación de nuevos JD en las bolsas de trabajo y la experiencia anecdótica de nuestro equipo. Los ingenieros de datos y aprendizaje automático que implementan modelos desarrollados a escala ya están aquí, un conjunto de habilidades complementarias que es algo diferente de las habilidades básicas de muchos de los científicos de datos actuales.

Busque nuevos roles como la gestión de modelos, especialistas en casos de uso específicos, como entrenadores de bots, científicos de datos que se están moviendo hacia la investigación y la política, constructores y mantenedores de plataformas de ciencia de datos, y calidad de IA (h / t Monica Anderson).


Entonces, en general, veo más una evolución del papel del científico de datos que una eliminación. Y hay muchas cosas que quizás no podamos imaginar, pero que sucederá sin embargo, requerirán el trabajo de la ciencia de datos.

Donde esos son datos, necesitará científicos de datos.

Diría que se ralentizará y los científicos de datos falsos serán eliminados; pero no, la demanda de científicos de datos no disminuirá mucho dado el aumento de la IA. Como alguien que trabaja para una empresa que intenta automatizar el flujo de trabajo de los científicos de datos, tengo una perspectiva única sobre este tema.

Lo que estoy descubriendo es que desempeñé un papel mucho más importante estratégicamente de lo que pensaba anteriormente en las organizaciones con las que trabajé. Los científicos de datos no solo tenemos que usar las herramientas que estamos tratando de automatizar; pero tenemos que conocer el mejor lugar para aplicarlos en el entorno empresarial. Este nivel de estrategia no se automatizará en el futuro cercano (ni los ejecutivos probablemente confiarían en una IA para tomar las riendas). Además, las soluciones que imponemos suelen ser personalizadas; y no en la naturaleza de los algoritmos de ML que estamos tratando de automatizar. A veces, un método simple basado en heurística funciona lo suficientemente bien (y es lo suficientemente simple como para describirlo a la gerencia) que adoptamos eso en oposición a la Regresión logística u otro algoritmo. Y ni siquiera me hagas comenzar con las consideraciones arquitectónicas para la implementación del modelo :).

Básicamente, creo que el aumento de la IA permitirá a los científicos de datos resolver más problemas en las organizaciones en las que se encuentran; pero no creo que iremos a ningún lado pronto.

Editar * Para responder un comentario (y a muchos otros les gusta en otras publicaciones similares a esta):

Bueno, para que la IA se haga cargo de la ciencia de datos, necesitaríamos una IA que pueda formular algoritmos de ML muy avanzados y complicados desde cero. Las herramientas de automatización que se están creando solo implementan los algoritmos más comunes en la actualidad. Para cuando lleguemos al punto en que las herramientas de automatización de ML puedan formular el plan estratégico que un científico de datos puede hacer, teniendo en cuenta la arquitectura del sistema, los objetivos comerciales de la organización (a menudo hay más de 1), la optimización la implementación de los objetivos de cada negocio para descubrir cuáles tienen el mayor impacto estratégico, la creación de nuevos algoritmos para adaptarse al contexto, etc. tendremos una Ai que puede apoderarse del mundo :). Entonces será un punto discutible.

Depende de lo que llames científico de datos. Para mí, las personas de aprendizaje automático intentan encontrar algoritmos más potentes para las predicciones con conjuntos de datos estándar, mientras que los científicos de datos utilizan algoritmos bastante estándar con datos personalizados. El trabajo del científico de datos es definir el objetivo, encontrar los datos relevantes, recopilarlos de manera más o menos automática, hacer la predicción correctamente y aplicar los resultados a la organización.

El aprendizaje automático seguirá siendo un campo relativamente pequeño para personas altamente calificadas, ya que se trata de encontrar algoritmos personalizados para un rendimiento extremo. La cantidad de problemas que valen suficiente dinero para contratar personas para encontrar algoritmos personalizados no es tan alta. La ciencia de datos será un campo en crecimiento ya que tiene una cantidad infinita de problemas que pueden abordarse con datos y algoritmos de aprendizaje automático estándar. Al principio, la ciencia de datos era principalmente estadística aplicada, mañana usará más datos y algoritmos de aprendizaje automático más potentes, pero no cambia el objetivo.

Como siempre en la sociedad industrial, las tareas complejas serán estandarizadas para ser utilizadas por personas menos calificadas. Los investigadores son personas que prueban nuevas formas de hacer las cosas. Los ingenieros son aquellos que aplican los métodos de vanguardia a nuevos problemas y necesitan entender cómo funciona la teoría para encontrar el método apropiado para su problema. Los técnicos modifican la configuración para problemas con objetivos y métodos ya definidos, necesitan comprender cómo funciona ese método específico para configurar correctamente la máquina. Los operadores presionan el botón y lo hacen funcionar como magia y necesitan saber qué hace el botón y cuándo presionarlo.

Aprendizaje automático para personas analfabetas tecnológicas

Lo que también sucede es que personas calificadas en otros campos actúan como operadores una vez que la tecnología se ha estandarizado lo suficientemente bien. Estoy seguro de que en una década o dos, un consultor de una escuela de negocios usará el futuro Excel para decir “Obtenga todas las estadísticas económicas mundiales de la nube” y “Aplique un algoritmo predictivo” y “Predecir la satisfacción del cliente para esto o esto estrategia”. Y auge, en unas pocas horas de trabajo probando una docena de estrategias, el consultor tendrá diagramas de flujo para poner un PowerPoint para la próxima reunión. Funcionará como magia porque los ingenieros de aprendizaje automático tendrán algoritmos de aprendizaje potentes completamente estandarizados, mientras que los científicos de datos tendrán una recopilación y formateo de datos estandarizados. Al igual que el consultor de negocios de hoy sabe cómo hacer una regresión lineal en Excel sin tener ninguna idea sobre las matemáticas detrás de una regresión lineal simple.

Como todos los trabajos, se dividirá en pedazos y se destrabará. Los científicos de datos de hoy son más o menos consultores de escuelas de negocios que también conocen las matemáticas y la programación. En el futuro, el trabajo de un científico de datos tal como lo conocemos hoy desaparecerá y se dividirá en varias partes, un trabajo para la recopilación de datos, un trabajo para definir los objetivos, un trabajo para probar diferentes hipótesis, etc. Los científicos de datos de hoy eventualmente se convertirán en directores de ingeniería en corporaciones que proporcionan una pieza simple de software que tiene algo que ver con la ciencia de datos. “Haaaaa, en los viejos tiempos, cuando comencé mi carrera, lo hacía todo desde cero en Python, los niños no saben nada en estos días, los profesores no enseñan nada en la universidad, los niños no tienen idea de los métodos para fusionar datos sin filtrar y cómo escribir una propagación básica hacia atrás usando una biblioteca matricial. En mis días, pasaba horas y horas formateando mis datos de Kaggle, leía blogs cada noche para aprender nuevos trucos, ahora solo hacen googlePredict.addSource (googlePredict.sources.ciaWorldFactbook) .addSource (userData) .addTarget (userTarget) .buildModel ().predecir(). Este nuevo graduado que contraté, me preguntó por qué no se compilaba sin llamar a buildModel () y que la documentación para buildModel () era incomprensible y que siempre dejamos los parámetros predeterminados de todos modos. Jaaaa, creo que los humanos se están volviendo más tontos cada década. No entienden cómo era la vida antes de ser inteligentes ”. Unos años más tarde, el método buildModel () se convirtió en un parámetro en el método predict () ya que siempre dejamos los parámetros predeterminados, especificando que las fuentes de datos externas también se eliminaron ya que se incluyen todas las bases de datos públicas mundiales. La primera vez que llame a predict () puede demorar unos minutos, hay algunas cosas compiladas en tiempo de ejecución. Mi inteligente dice que la gente realizó doctorados completos sobre uno de esos parámetros de predicción en el pasado.

El aumento de la IA es la razón por la cual Data Scientist se ha convertido en una ocupación y por qué tiene tanta demanda.

Es poco probable que los científicos de datos se vuelvan obsoletos hasta que obtengamos un aumento de la Inteligencia Artificial General, es decir, IA con habilidades generales. Por el momento, eso parece un sueño muy lejano.

El aprendizaje automático es el arte de hacer que las computadoras aprendan sin ser programadas explícitamente, pero hasta ahora, todavía tenemos que decirles a las computadoras lo que queremos que aprendan. Hasta que las computadoras puedan comenzar a razonar sobre eso, siempre habrá una necesidad de personas que entiendan los datos. El aprendizaje no supervisado es el santo grial del aprendizaje automático, pero todavía está en su infancia.

Estoy planeando trabajar como científico de datos durante los próximos 30 a 40 años, y no me veo obsoleto en ese período de tiempo, pero podría estar equivocado …

En primer lugar, la ciencia de datos (en general, Estadística) no se trata solo del aprendizaje automático y la codificación, sino que hay mucha historia detrás. Todos los métodos estadísticos, incluidos los de aprendizaje automático, se basan en matemáticas detalladas y algunos supuestos. Cada conjunto de datos tiene su propia historia detrás y, por lo tanto, para descubrir esa historia, uno necesita tener intuitivamente la idea de qué conjunto de métodos usar. En ese sentido, un buen estadístico / científico de datos es como un artista que con su meticulosa habilidad en matemática y codificación puede prever / intuir perspectivas sobre los datos que pueden no ser muy aparentes.

El panorama de la ciencia de datos se está transformando muy rápido con el advenimiento de una gran cantidad de datos en una gran cantidad de campos y, por lo tanto, un científico de datos debe ser capaz de desarrollar métodos adecuados para la situación y justificarlos matemáticamente (esta parte no siempre es fácil) . Ya se trate de datos para pronósticos de negocios o datos de fMRI o ensayos clínicos, existe un amplio margen para utilizar los métodos ya desarrollados y buscar herramientas más finas / mejores. Una ilustración fácil sería la relación entre la ciencia forense y el trabajo de detective. El surgimiento de las herramientas forenses modernas y la ciencia forense ayudan a los investigadores / detectives de una manera profunda, pero eso no significa que los investigadores / detectives estén perdiendo sus trabajos, sino que un buen detective que utiliza sus habilidades y herramientas forenses llega a la raíz del problema de manera muy eficiente. . Un científico de datos / estadístico es como un detective experto que utiliza las herramientas de aprendizaje automático u otros métodos estadísticos para tratar de encontrar la historia más profunda en los conjuntos de datos. Una automatización capaz de realizar estas cosas no solo reemplazará el trabajo de los científicos de datos, sino que también invadirá el espacio de profesiones donde la intuición y la imaginación son clave para el éxito.

¿Eso crees? ¿Quién sabe? El puesto de científico de datos tiene una responsabilidad nueva y próxima y una demanda y reconocimiento del mercado. La profesión como organización con personas trabajando juntas, escribiendo publicaciones, contribuyendo proyectos y negociando como sindicatos o compañías aún no se ha dado cuenta ni se ha desarrollado. El auge de la IA provoca cambios en el uso de máquinas, la contratación de personas y la aplicación del trabajo en las comunidades. El problema no sugiere una disminución crítica de la demanda de científicos de datos dentro de una década, pero esto puede cambiar a medida que se conozcan los desarrollos en IA y la profesión y organización del científico de datos muestre más trabajo. Como mercado, AI alberga muchos estudios en ciencias de la computación e inversiones tangibles por parte de las empresas, además de emplear a muchos profesionales que dominan los datos, las computadoras, los sistemas y las empresas, instituciones y comunidades. A medida que la IA con estos sistemas simbólicos cambia, las personas también deben cambiar. Para responder completamente a la pregunta sobre la calidad de la seguridad laboral de los científicos de datos y las cifras estimadas de empleo , así como sobre el riesgo monetario , una empresa de consultoría, una compañía de seguros o una empresa de investigación necesita realizar un estudio y proporcionar proyecciones.

Probablemente no.

Creo que sería todo lo contrario. Los científicos de datos serán impulsados ​​por IA.

Las tareas de limpieza y formateo de datos serán más fáciles en el futuro, permitiendo a los científicos de datos centrarse en algo realmente importante: obtener sentido de los datos.

No pronto. Es posible que tengamos diferentes herramientas, pero buena suerte para que una computadora presente los hallazgos a un CEO o comprenda los problemas de integridad de datos en el corto plazo …

More Interesting

Quiero escribir un trabajo de investigación sobre inteligencia artificial, ¿qué debo hacer para comenzar?

¿Qué pasaría si los robots reemplazan a nuestros políticos?

¿Cuáles son los algoritmos clásicos de aprendizaje automático similares a los modelos de secuencia a secuencia?

¿Está Deepmind de Google muy cerca de desarrollar inteligencia artificial a nivel humano?

¿Qué es la conciencia y en qué se diferencia de la inteligencia?

¿Podría una IA ser elegida Presidente de los Estados Unidos?

¿Sería posible construir una copia virtual de Nueva York en la que 7 millones de IA realicen sus vidas cotidianas e incluso se puedan abrir puertas?

Si llegamos a AGI (inteligencia general artificial), ¿comenzaremos un nuevo tipo de esclavitud?

¿El robot AI Luna de Luis Arana es real o es una estafa para recaudar fondos?

¿Cuáles son los argumentos a favor de la idea de que una IA entrenada en un 'archivo mental' (conversaciones, pruebas de personalidad, etc.) imitaría suficientemente la conciencia del propietario del archivo mental?

Cuando lleguemos a la inteligencia artificial general, ¿cómo determinaremos si es sensible o no?

¿Cuál es el estado actual de la investigación de inteligencia artificial?

¿Qué le sucede a la IA cuando se le asigna una tarea imposible o una en la que ambas opciones violan su programación?

¿Cómo beneficiará la inteligencia artificial al mundo de los profesionales de TI en Sudáfrica en el futuro?

¿Cómo se forma el concepto de self en redes neuronales biológicas como el cerebro?