¿Hay algún algoritmo de compresión de texto con pérdida?

Hay filtros con pérdida que puede aplicar al texto que harán que el texto se comprima más pequeño. Por ejemplo: elimine algunos o todos los signos de puntuación, elimine todos o espacios en blanco adicionales, conviértalos en un solo caso (todo en mayúsculas o todos más bajos), reemplace los caracteres decorados como ö con o. Todos estos son filtros con pérdidas que, cuando se combinan con un compresor basado en diccionario (como zip, gzip, etc.) probablemente generarán archivos comprimidos más pequeños.

… y en el lado del receptor recuperar los datos.

Si quiere recuperar el mismo texto que tenía antes de la compresión con pérdida, no. Eso es, por definición, lo contrario de lo que logra la compresión con pérdida. La compresión con pérdida desecha los datos, a menudo datos que cree que podría no perderse, para reducir el tamaño del conjunto de datos. Una vez que lo tira, no puede recuperarlo. Los algoritmos de compresión que pueden reconstruir los datos originales como se llamaron “sin pérdidas”.

Comprimí (parcialmente) una parte de la otra respuesta (puede que haya comprimido demasiado, pero entiendes la idea, si puedes “descomprimir” tienes tu respuesta …):

“Por dfntn lssy cmprssn es cmprssn tht cnnt rcvr los datos. Por lo tanto, no puede haber lo que pides ”.

Un mundo sin vocales

Ver también otra forma: ¿Puedes leer esto?

Por definición, la compresión con pérdida es una compresión que no puede recuperar los datos. Por lo tanto, no puede haber lo que pides.

La compresión con pérdida no se utiliza para el texto porque, sobre todo, no queremos perder nada cuando comprimimos el texto. Queremos poder descomprimirlo y recuperar el texto original.