¿Qué hace que un problema de ciencia de datos sea interesante para usted?

Impacto potencial: específicamente el efecto que un esfuerzo de modelado u otro análisis puede tener en un negocio u organización. Este impacto potencial puede expresarse financieramente en un entorno empresarial o en términos alternativos al impactar a organizaciones u otras entidades que es más probable que encuentre en el modelo de partes interesadas (impactos sociales, ambientales, etc. ).

Por ejemplo, si un posible cliente tiene la necesidad de algún tipo de modelado predictivo, digamos prediciendo qué prospectos se convertirán, entonces, cuanto mayor sea el impacto en términos de posibles costos evitados o ingresos obtenidos, más interesante me parece el problema. Alternativamente, se podría realizar un análisis que permita a las organizaciones / sociedades / individuos comprender mejor los problemas o resolver problemas donde el impacto se expresa de manera diferente (como personas alimentadas, pozos excavados o enfermedades prevenidas).

Además, crear soluciones elegantes a partir de problemas de datos complejos o desordenados también es atractivo. Hay una sensación de satisfacción al presentar soluciones digeribles a las empresas que realmente pueden entender y adoptar.

Data Science es emocionante por varias razones:

  • La intuición es siempre 50/50. Sus suposiciones obtienen mucha más credibilidad cuando las respalda con las ideas. Su suposición obtiene aún más credibilidad si sus ideas son gráficas y se entienden fácilmente.
  • Obtiene ideas que de lo contrario no pensaría que existen a partir de los datos que parecen no tener nada más. La pregunta más común que escucho de las compañías es “Vea si puede encontrar algo en nuestros datos”.
  • Impacto potencial de la información sobre las decisiones que podrían afectar a muchas personas y millones de dólares en capital.

Complejidad y dificultad, ¡cualquiera sea la forma que puedan tomar! Es extra si el problema es un problema no resuelto en el campo 🙂

More Interesting

¿Cómo podrían relacionarse dos conjuntos de datos y datos completamente diferentes para generar datos completamente nuevos y un conjunto de datos, y cómo el lenguaje de programación, las herramientas de modelado de datos y Excel me ayudan a realizar dicho análisis de datos?

¿Es R una opción correcta para hacer un análisis predictivo en un conjunto de datos con más de 100K registros? Si no, ¿cuál es?

¿Cuáles son los desafíos en el procesamiento de grandes cantidades de datos (2017)?

¿Cuáles son los mejores cursos de ciencia de datos en iTunes U?

¿Qué deben saber los estudiantes graduados sobre los trabajos de la industria como científicos?

Para el análisis de datos, ¿cuál es mejor, SAS o Hadoop? Soy ingenuo en la programación pero estoy pensando en darle una oportunidad.

¿Cómo manejan los científicos de datos las situaciones en las que es difícil obtener resultados verídicos?

¿Qué tan difícil es ser admitido en el campo de entrenamiento de ciencia de datos de Insight?

¿Cuál es la diferencia entre Python y las herramientas de minería de datos como Knime y Rapid Miner?

¿Cuáles son las principales aplicaciones (de la vida real) de la minería de datos y la ciencia de datos utilizadas en el mundo práctico de hoy?

Cuando observamos el muestreo, ¿por qué necesitamos 30 datos?

¿Qué es Big Data y por qué la gente lo aprende?

¿Quién es el ganador del desafío ImageNet LSVRC-2016? ¿Cuál es su enfoque?

¿Qué tan grandes fueron las primeras computadoras? ¿Por qué eran tan grandes?

¿Qué clases debo tomar en Oxford para convertirme en científico de datos?