No.
La compresión se trata de encontrar la redundancia en los datos. Si no hay redundancia, entonces no puede comprimirla en absoluto.
Por ejemplo, la secuencia de números del 1 al 1 billón podría escribirse enumerándolos 1, 2, 3, 4, 5, 6,… 1000000000000. Puede escribirlo en ascii, en binario o en código
- Soy un estudiante de biología / psicología, pero quiero entrar en ciencia de datos y aprendizaje automático. Soy un senior, así que no estoy en condiciones de volver a declarar mi especialidad. ¿Cuál sería una buena pista para mí aprender sobre ciencia de datos y programación, y eventualmente conseguir un trabajo en investigación / programación?
- ¿Cuáles son algunas aplicaciones modernas de clasificación en minería de datos?
- ¿Cómo utilizan los bancos la minería de datos?
- ¿Cuáles son los mejores programas de maestría en ciencias de datos en la India?
- ¿Qué cursos debemos seguir para convertirnos en científicos de datos?
- Si escribe eso en ASCII, tomará aproximadamente 11 TB (longitud promedio de número 9 caracteres más dos para la coma y el espacio, multiplicado por un billón).
- Si escribe eso en binario, tomará aproximadamente 4 TB (4 bytes por número por billón).
- Si lo escribe en código, tomará aproximadamente 20 bytes (dependiendo del lenguaje de programación).
Esa es una relación de compresión de casi un billón a uno entre la representación ingenua y más eficiente. Esta eficiencia solo es posible debido a la redundancia en el problema. Si baraja aleatoriamente los datos antes de pedir que se almacenen, ya no podrá comprimirlos.