¿Es demasiado tarde para sumergirme en Data Science, ya que se están desarrollando poderosas herramientas de aprendizaje automático y ya hay muchos científicos de datos hábiles?

No, todavía es temprano.

La ciencia de datos como profesión todavía está en pañales. El término Data Scientist fue acuñado por DJ Patil y Jeff Hammerbacher hace menos de diez años.

Según casi todas las encuestas, incluida una reciente de McKinsey [1], la demanda de científicos de datos supera con creces la oferta.

Mejor aún, la demanda solo aumentará. La adopción ha sido lenta en muchas industrias. Aunque los gigantes tecnológicos de Silicon Valley están prosperando en la ciencia de datos, todavía es difícil convencer a los líderes de las industrias conservadoras de que el análisis avanzado tendrá un impacto real en sus negocios. Una vez que inevitablemente se suban al carro, la ciencia de datos se convertirá en una de las profesiones definitorias del siglo XXI.

Las herramientas de aprendizaje automático son cada vez más avanzadas, pero aún están muy lejos de ser realistas para reemplazar el trabajo humano. Las herramientas de ML no llegan al núcleo de lo que hacen los científicos de datos, que es comprender los datos y encontrar formas innovadoras de utilizarlos.

Notas al pie

[1] La era de la analítica: competir en un mundo basado en datos

Hola:

No es tarde para nada.

En mi opinión, todavía se requerirán expertos en Data Scientist y ML dentro de 20 años. Las principales razones de mi creencia se enumeran a continuación:

  • La IA no significa que todo lo que las máquinas harán, sino que la IA se puede representar mejor como “Inteligencia Aumentada” , es decir, Man + Machine para resolver los problemas comerciales mejor y más rápido
  • Incluso con los avances que hemos logrado en ML a lo largo de los años, en ciertos casos hay problemas que un estudiante de segundo grado puede resolver más rápido que una máquina. Por ejemplo, identificar a una persona mirando la cara de la persona.
  • Cualquier problema o pregunta que requiera contexto social tomará más tiempo para que una máquina lo resuelva.
  • Particularmente con respecto a la analítica de texto, hay dos desafíos principales. Primero es la “ambigüedad”. Esto significa que la misma palabra puede significar muchas cosas. El segundo es “Variabilidad”. Indicando lo mismo se puede decir de muchas maneras diferentes.
  • La experiencia en ontología y dominio es absolutamente fundamental para que cualquier algoritmo de ML / AI tenga un alto nivel de precisión. En términos generales, los algoritmos de ML / AI desarrollados para una industria pueden no ser directamente adaptables para otra industria.

Espero que esto ayude.

Descargo de responsabilidad: Las opiniones expresadas aquí son únicamente las del escritor en su capacidad privada.

No, no es tarde para nada. De hecho, este es el mejor momento para saltar a los reinos de la ciencia de datos.

El dominio de la ciencia de datos todavía está en sus primeras etapas. Existen múltiples encuestas que señalan el hecho de que el requisito para trabajos de ciencia de datos excede el número de científicos de datos disponibles que toman puestos de trabajo. Siempre hay una escasez de científicos de datos en todas las industrias.

Lo mejor es que esta demanda de profesionales de la ciencia de datos solo aumentará con el tiempo. Hay muchas empresas e industrias que son un poco reacias a adoptar el enfoque de la ciencia de datos, pero es solo cuestión de tiempo. Una vez que estén convencidos de que la ciencia de datos puede ayudarlos a hacer crecer sus múltiples negocios, felizmente seguirán el camino de la “ciencia de datos”. Entonces, la profesión de la ciencia de datos se convertirá en la profesión más solicitada en todo el mundo.

Por lo tanto, es el mejor momento para obtener un trabajo de ciencia de datos y crecer con el crecimiento de esta industria.

Definitivamente no es demasiado tarde, pero el listón es mucho más alto. En 2011, podría obtener un trabajo de ciencia de datos de nivel de entrada simplemente conociendo SQL y pudiendo aplicar algoritmos de aprendizaje automático listos para usar. Hoy en día, se espera que tenga un importante historial de estadísticas y análisis, y esté listo para escribir software listo para producción en grandes conjuntos de datos.

Mucha gente parece creer que puede pasar unos meses estudiando y luego obtener un trabajo de ciencia de datos, desafortunadamente, se necesita mucho más que eso. La cantidad de conocimiento que necesita es equivalente a un título en Estadística o un campo relacionado. Si aún no tiene el conocimiento previo necesario, debe esperar dedicar alrededor de mil horas de práctica y estudio antes de obtener un trabajo de nivel de entrada.

Si eso te parece divertido, ¡adelante! Si no estás seguro, puedes probar un concurso de Kaggle. Incluso si no desea convertirse en un Científico de Datos, aprender los conceptos básicos será bastante útil para una variedad de objetivos.