¿Cuál es el mejor algoritmo / software de compresión hasta ahora? ¿Cómo funciona (vista simple y abstracta) y qué se puede mejorar?

La familia de compresores PAQ es probablemente el estado actual de la compresión de datos en general.

Funcionan como un conjunto de varios modelos diferentes de compresión de datos. Desde simples predicciones basadas en caracteres hasta el reconocimiento de tablas.

PAQ funciona poco a poco, la clave para la compresión de datos es poder predecir el siguiente bit en función de los bits anteriores. Si puede hacerlo perfectamente, entonces tendría un compresor perfecto porque una vez que sepa la probabilidad del próximo 1/0, puede usar la codificación aritmética para representar esa probabilidad de manera óptima. La codificación óptima es un problema resuelto. El problema no resuelto y realmente no tratable es cómo modelar datos para obtener esas probabilidades “perfectas”.

Como mencioné al principio de mi respuesta, PAQ calcula la probabilidad del siguiente bit combinando las probabilidades de diferentes modelos de compresión.

Luis

Todo lo que necesitas saber está aquí. Compresión de datos explicada