¿Data Science es el futuro de la programación y la habilidad de aprender de los aspirantes a programadores?

No. La programación es solo un proceso de escribir programas. Nada más y nada menos.

Puede ser simplemente un programador ordinario o especializarse en ciertos dominios:

  • programador de bajo nivel (controladores, sistemas operativos, módulos especializados)
  • programador de juegos
  • microcontroladores / programador FPGA
  • Programador PLC
  • programador de sistemas embebidos
  • programador de soluciones empresariales (de alto nivel) (todos estos complejos sistemas de nivel corporativo basados ​​en Java, .NET, etc.)
  • programador de aplicaciones web
    • programador de fondo
    • programador front-end
  • programador de aplicaciones móviles
  • programador estadístico (SAS, R) → esto está relacionado con la ciencia de datos
  • mantenedor de sistemas antiguos (COBOL, Oberon, Fortran)
  • Programador de oficina (Sharepoint, VBA)
  • Programador de aprendizaje automático → esto está relacionado con la ciencia de datos

o si es solo otro aspecto especializado de la programación

Ni siquiera lo llamaría así. Es algo completamente diferente de la programación, hecho por personas totalmente separadas de los programadores (matemáticos, estadísticos y similares). También se hace a menudo en lenguajes que están totalmente separados de los lenguajes que usan los programadores (por ejemplo, MATLAB).

Dicho esto, los programadores necesitan saber otras cosas además de la programación, ya sea algún conocimiento específico de la industria o cosas como la ciencia de datos. Entonces, como programador, ¡probablemente sea una muy buena idea aprender esas cosas! Solo lo he usado una vez en un solo proyecto en los últimos 5 años, pero cuando lo necesitas, lo necesitas. E incluso si su conocimiento es limitado en comparación con un científico de datos real, a veces puede ser útil saber cómo usar las herramientas, incluso si realmente no comprende cómo funcionan (por supuesto, teniendo en cuenta que el mal análisis es peor que ninguno).

¿Qué significa Data Science para ti?

Mucho se ha dicho sobre la ciencia de datos y su importancia en el mundo corporativo actual. En el mundo corporativo, casi todas las decisiones se toman en base a un análisis cuidadoso y científico de los datos. Los datos se han generado en petabytes y Exabyte a diario. Los datos solo van a crecer, eso también a un ritmo extremadamente rápido. Entonces, una cosa es segura de que Data Science no es una burbuja que explotará en algún momento, sino que irá mucho más avanzada y más rápida en los próximos días. En este artículo descubrirá qué son estos “datos” y qué es la “ciencia de datos” y qué significa para usted.

La ciencia de datos se puede definir como una combinación de varios métodos, procesos y sistemas científicos para extraer información de los grandes conjuntos de datos (que de otro modo estaría oculto). Desde el surgimiento de Internet, ha habido un aumento constante en el aumento de datos, y la introducción de plataformas de redes sociales como Facebook, Twitter, Instagram, etc., junto con los teléfonos inteligentes avanzados ha contribuido enormemente en la generación de datos. . Independientemente de lo que haga un individuo en las plataformas de redes sociales, comparta una publicación, publique un comentario, como un anuncio, e incluso una simple búsqueda se registra y agrega a la enorme cantidad de datos.

Todo está en línea hoy. De la lista de amigos de las personas, el comportamiento de compra, las imágenes, lo que les gusta y lo que no les gusta, su opinión sobre una cosa o tema en particular, etc. Todos estos detalles (datos) sobre las personas pueden analizarse científicamente y utilizarse para crear un mejor entorno en línea. Desde sugerir los libros, películas y videos que podrían gustarles, o sugerir un artículo que podría estar interesado en comprar.

Un ejemplo incluiría, Netflix, utiliza los datos de millones de usuarios con respecto a las películas y los programas que han visto, los actores que les gustan y el tipo de películas que les gustan. Después de ejecutar un algoritmo avanzado (parte de la ciencia de datos) en estos datos, vienen con la lista de películas o programas que un individuo estará más interesado en ver y comienzan a “sugerirles” estas películas.

Es posible que ya haya notado lo mismo en YouTube, cuando ve pocos videos en YouTube; comienza automáticamente sugiriéndote más videos según lo que viste. Esto puede parecer muy simple, pero hay algoritmos complejos que se ejecutan en segundo plano que lo hacen posible.

Los datos pueden haber recorrido un largo camino, pero la verdad es que apenas ha comenzado. Existe un enorme potencial en el campo de la ciencia de datos y campos relacionados como el aprendizaje automático y la inteligencia artificial. Si está interesado en saber más sobre ciencia de datos, no dude en escribir a [correo electrónico protegido]

No. La programación es un enfoque excelente cuando el problema se entiende bien y se limpia. Es decir, cuando hay un enfoque claro para resolver un problema con un enfoque algorítmico.

La ciencia de datos / aprendizaje automático es más adecuada cuando nadie comprende exactamente cómo resolver un problema desordenado con las herramientas relativamente simples pero poderosas de la informática.

Cuando tienes un martillo, todo parece un clavo …

“Data Science” es el nuevo “Cloud Computing”.

“Cloud Computing” solía llamarse “hosting”.

“Ciencia de datos” es solo una palabra de moda que implica la programación con un enfoque en datos y estadísticas.

Soy autodidacta, lo que significa que aprendí de los libros en lugar de la opinión de los profesores sobre los libros.

Dicho esto, no seas como la mayoría de los programadores “autodidactas”. Si está interesado en DATA y lo que puede aprender de él, aprenda matemáticas, estadísticas, un lenguaje de programación MUY bien, SQL y R. Quizás haga un campamento de arranque para ello.

Me gusta que la palabra de moda finalmente permita que las personas que están enfermas de “desarrollo web” hagan algo más interesante.

“Ciencia de datos” no es lo mismo que “Aprendizaje automático”

Data Science es un campo que implica el uso de datos para resolver problemas.

Machine Learning es una técnica especializada para derivar reglas a partir de datos que pueden ser útiles en Data Science.

Entonces, no, Machine Learning no es más “el futuro de la programación” que “cliente gordo” es el futuro de la programación. Es una técnica especializada que existe para resolver un tipo específico de problema.

No va a construir un sitio web, ni a usarse para implementar un juego, o ejecutar una transacción financiera, ni ninguna de las miles de otras cosas que involucran programación (excepto explorar las reglas que están potencialmente incrustadas en un conjunto de datos).

Una de las cosas maravillosas de la programación es que hay tantos temas que aborda. Entonces, si Machine Learning es interesante para usted, no dude en lanzarse a él. Pero si lo pone a dormir, no se preocupe por no tenerlo en su kit de herramientas. Realmente no necesita saber más de lo que es y para qué sirve, por lo que puede reconocer cuándo debe aplicarse.

Para obtener una descripción razonable del aprendizaje automático, consulte: Aprendizaje automático – Wikipedia

Si bien Data Science es una “cosa”, el término que se usa generalmente es solo una palabra de moda más sexy para Business Analytics, que anteriormente formaba parte de EIS (Executive Information Systems). Ser propietario de una copia de SPSS no lo convierte en un Científico de Datos … es más probable que siga siendo un Ecologista o un Investigador de Mercado.

Dicho esto, una buena comprensión de NumPy (o R) es útil como profesional de la programación y, a medida que los sensores de IoT (etc.) escupen cantidades cada vez mayores de datos inútiles, la demanda de personas que pueden convertir eso en información útil solo aumentará. Simplemente no te dejes llevar por el bombo publicitario.

No absolutamente no. La ciencia de datos es uno de los muchos dominios problemáticos. Así es el aprendizaje automático . Lo mismo ocurre con el procesamiento del lenguaje natural y el Internet de las cosas y la computación numérica y la realidad virtual y la computación en la nube, etc. Hay cientos de dominios problemáticos y ningún dominio domina a todos los demás. Ningún dominio problemático es el futuro de la programación.

Las habilidades de programación son para resolver problemas técnicos. No son específicos de ninguna aplicación en particular. Debe aprender bien estas habilidades para poder aplicarlas a cualquier dominio problemático.

Dicho esto, la ciencia de datos y el aprendizaje automático son sin duda dos de las áreas “más candentes” de la informática actual. Este tipo de tendencias tienden a ser una moda y una moda. Es casi seguro que la ciencia de datos y el aprendizaje automático no estarán “de moda” dentro de diez años. La industria de TI es demasiado rica en posibilidades para establecerse en una o dos áreas durante ese largo período.

Data Science se trata de combinar análisis, intuición y experimentación relacionados con los datos, para obtener información que ayude a administrar un negocio. No es un trabajo de programación, aunque algunos miembros de un equipo de Data Science pueden ser programadores de Python o R. No es un trabajo de Machine Learning, aunque algunos equipos de Data Science pueden emplear Machine Learning para ayudarlos a obtener información. No es un trabajo de Big Data, aunque parte de Data Science se realiza en Big Data (también puede “hacer” Data Science en datos muy pequeños).

Entonces no. Data Science no es el futuro de la programación, ni es una habilidad que hay que aprender. Si te interesa, ¡adelante!

La ciencia de datos siempre fue una de las áreas más lucrativas de la programación.