Un desarrollo muy prometedor en el campo de la compresión de datos sin pérdida es el Algoritmo de compresión de Burrows-Wheeler (BWCA), introducido en 1994 por Michael Burrows y David Wheeler. El algoritmo recibió una atención considerable debido a su velocidad de ejecución similar a Lempel-Ziv y su rendimiento de compresión cercano a los algoritmos PPM de última generación. Se basa en una permutación de la secuencia de entrada, la Transformación Burrows-Wheeler (BWT), también llamada Clasificación de bloques, que agrupa símbolos con un contexto similar. En la versión original, esta permutación fue seguida por una transformación de movimiento al frente (MTF) y una etapa final de codificación de entropía (EC). Las versiones posteriores utilizaron diferentes algoritmos que vienen después de la transformación de Burrows-Wheeler, ya que las etapas posteriores a la transformación de Burrows-Wheeler también tienen una influencia significativa en la tasa de compresión.
¿Cómo mejora BWT la compresión?
Related Content
¿Cuál es la prueba intuitiva más simple del algoritmo de ruta más corta de Dijkstra?
Al estudiar los efectos visuales, ¿terminaré en el set o detrás de una computadora?
¿Cuáles son las diferencias entre simulación y emulación?
¿Qué pasa si el aprendizaje automático se aplica a la física?
Los compresores universales como el LZ77 son asintóticamente óptimos. (LZ77 y LZ78 – Wikipedia), lo que significa que a medida que la longitud del texto, [math] n \ rightarrow \ infty, [/ math] la compresión se vuelve óptima. Sin embargo, en el peor de los casos, LZ77 / LZ78 tiene tasas de convergencia muy lentas, que es [matemáticas] O (\ frac {\ log \ log n} {\ log n}) [/ matemáticas]. Por lo tanto, en cierto sentido, BWT permuta los datos en un formato que tiene mejores asintóticos, sin embargo, aún no puede superar el límite fundamental de la entropía (como BWT es una transformación reversible, por lo tanto, la “información” sigue siendo la misma).
El segundo factor importante es que los datos generalmente comprimidos (como el texto en inglés) no corresponden a una distribución estacionaria. Por lo tanto, incluso si LZ77 es óptimo para fuentes estacionarias ( http://web.stanford.edu/class/ee …), BWT puede superar el rendimiento de LZ77 debido a la no estacionariedad.
Una cosa interesante a tener en cuenta es que la mayoría de las versiones BWT utilizadas en la práctica, de hecho, no han demostrado ser óptimas en general, y por lo tanto no son compresores universales como LZ77 / LZ78. Puedes leer más sobre lo mismo aquí: ( http://citeseerx.ist.psu.edu/vie …)
More Interesting
¿El trabajo humano se vuelve menos efectivo cada día en relación con la inteligencia artificial?
¿Qué es un flujo de trabajo general para abordar un problema de aprendizaje automático?
¿Cuál es la diferencia entre un modelo de datos y un esquema de base de datos?
¿Cómo debo comenzar mi preparación para el GATE 2018 en mecánica desde hoy sin entrenamiento?
Si Microsoft lanza bash para Windows 10, ¿eso sería un fin para Linux?
¿Por qué hay tantos libros de un solo libro?
Sin la ayuda del otro, ¿pueden las computadoras y el arte adoptar mutuamente la identidad del otro?
¿Qué podemos hacer para reconstruir la sucursal de CSE en NIT, Jamshedpur?
¿Qué se puede hacer en una computadora sin conexión a Internet?
¿Cuál es la diferencia entre un kernel y un shell?
¿Es completo un sistema computacional de Turing si y solo si no se puede detener-decidir?
¿Alguien en Quora ha usado una supercomputadora para cosas informáticas normales?
¿Cuándo hará AI que todos los humanos sean inoperables en la fuerza laboral?
¿Qué tan importante es la interpretabilidad para un modelo en Machine Learning?