¿Cuál es la diferencia entre estadística computacional y ciencia de datos?

Según las definiciones que uso, la estadística computacional es un subconjunto de la ciencia de datos. Dependiendo de lo que estoy haciendo, por ejemplo, mi “rol” actual como científico de datos de consultoría, casi todo el trabajo que hago sería etiquetado como estadística computacional hace 10 años. Por supuesto, hace 10 años, algo de lo que hago no sería posible, pero una buena parte de eso todavía se llamaría estadística computacional si así fuera.

En caso de que se esté preguntando, fuera de las estadísticas computacionales, últimamente ha habido algún trabajo teórico de información (parte del trabajo de ciencia de datos), algo de ingeniería de datos (tal vez trabajo de ciencia de datos), y hace un tiempo hubo una serie de pequeñas pruebas claras que hice para alguien con respecto a la validez de la estimación (definitivamente no es un trabajo estándar de ciencia de datos, pero es muy útil, ya que salvó a mi cliente de una gran cantidad de recopilación de datos innecesarios. La teoría es definitivamente útil en la práctica, solo asegúrese de que sus suposiciones sean válidas).

La estadística computacional es un subconjunto de la ciencia de datos, posiblemente la más importante. Se puede describir libremente como “estadísticas tradicionales que usan computadoras”.

La ciencia de datos incluye una serie de otros elementos que no están dentro del alcance de las estadísticas computacionales, en particular:

  • Aprendizaje automático (aunque algunos también incluirían esto)
  • Análisis de big data
  • El aspecto comercial

Si bien la estadística computacional es una subárea de computación científica que sigue el rigor científico, los científicos de datos generalmente se contentan con aceptar cualquier método que proporcione el mejor valor comercial.

La estadística computacional es una forma de hacer estadísticas. Desde el punto de vista de la disciplina, generalmente está restringido dentro del departamento de Estadística. No se encuentra mucho en el mundo corporativo. No hay muchos trabajos con esta descripción.

Data Science es una asignatura interdisciplinaria que combina estadística e informática. Desde el punto de vista de la disciplina, es en el departamento de estadística o informática. Se encuentra mucho en el mundo corporativo. Hay más trabajos con esta descripción.

La estadística computacional, o computación estadística, es la solución computacional de problemas estadísticos. Es el área de la ciencia computacional (o computación científica) específica de la ciencia matemática de la estadística.

La ciencia de datos es un campo interdisciplinario sobre métodos, procesos y sistemas científicos para extraer el conocimiento o las percepciones de los datos en diversas formas, estructuradas o no, generalmente se refiere a la generación inductiva de reglas a partir de grandes conjuntos de datos.

Relacionado en algunos casos, la ciencia de datos a menudo puede emplear los métodos de estadística computacional; son áreas diferentes y conjuntos de problemas diferentes pero superpuestos.