¿Hay alguna manera de comprimir una gran cantidad de datos a un tamaño muy pequeño como en una bomba zip?

Si. Haga un archivo de 1 terabyte de todos los bytes cero y comprímalo. Casi cualquier compresor producirá un pequeño archivo. Los mejores compresores como RAR, 7ZIP o ZPAQ deberían producir archivos más pequeños que ZIP.

Si el compresor usa LZ77, codificará una cadena grande de n bytes idénticos como un solo byte literal seguido de un código de coincidencia con un desplazamiento de 1 y una longitud de n – 1. Dependiendo de los detalles del formato, puede haber un límite en la longitud máxima de coincidencia, por lo que pueden requerirse múltiples códigos de coincidencia que resulten en una peor compresión Para ZIP, el límite es de 32 KB y la relación de compresión es de aproximadamente 1000 a 1. Los otros compresores tienen límites mucho más altos y mejores relaciones.

Si comprende el formato comprimido, puede escribir códigos de coincidencia directamente en el archivo sin tener que crear un archivo de 1 TB para comenzar. O si tiene suficiente espacio en disco, puede crearlo con este programa g ++.

#include
int main () {
ARCHIVO * f = fopen (“archivo grande”, “wb”);
para (int i = 0; i <1000; ++ i) {
fseeko (f, 999999999, SEEK_CUR); // o _fseeki64 () en MSVC
putc (0, f);
}
}

Ciencia de datosdatos

Related Content

¿Cuáles son las perspectivas laborales para un estudiante internacional después de una maestría en ciencia de datos o análisis de datos en los Estados Unidos?

Cómo comenzar a analizar datos usando R

# redes de computadoras (CSE) Tengo una duda sobre el enfoque de capas. Los datos reales se transfieren a través de la capa física, pero ¿por qué todas las otras capas, como el transporte o la red, también transfieren datos en diferentes formas, como paquetes o segmentos? ¿Qué tipo de datos es ese?

¿Cuál es la diferencia entre ciencia de datos, aprendizaje automático e inteligencia artificial?

¿Cuáles son las diferencias en una maestría en ingeniería eléctrica (procesamiento de señales / aprendizaje automático) y una maestría en informática (aprendizaje automático)?

¿Cómo se usan los conceptos de probabilidad y estadística en la ciencia de datos?

¿Desde dónde puedo aprender sobre ciberseguridad?

More Interesting

Cómo desechar datos a través de Python

Al ejecutar una prueba A / B, ¿durante cuánto tiempo ejecuta el experimento?

¿Qué campo debo elegir, redes informáticas o ciencia de datos? Amo los dos.

¿Qué es la secuencia de clics?

¿Hay empresas o startups que ofrecen Apache Mahout o similar como un producto, distribución o servicio empaquetado?

Ya no estoy dispuesto a ir a los Estados Unidos para obtener una maestría. ¿Dónde debería estudiar ciencia de datos y aprendizaje automático?

Cómo prepararse para una entrevista de ciencia de datos o aprendizaje automático en una gran empresa tecnológica

¿En qué área de las matemáticas debo mejorar para entrar en una carrera de ciencias de datos, cálculo o matemáticas discretas?

Cómo usar Kaggle, si soy un principiante en el campo de la ciencia de datos y el aprendizaje automático

¿El comercio de alta frecuencia y la ciencia de datos comparten muchas similitudes?

¿Cuál es la diferencia entre el curso de MSc Business Analytics y MSc Data Science en UCL? ¿Cuál es más adecuado para convertirse en un científico de datos?

¿Quiénes son los principales competidores de AlchemyAPI?

¿Debo hacer un master en ciencia de datos o ir a un campo de entrenamiento?

¿Puedo solicitar puestos de trabajo en Data Science si he aprendido el campo con MOOC?

¿Cuál es el historial de la base de datos?

Web Analytics