2012-02-25

7z vs zip na przykładzie plików tekstowych

Kwantowomechaniczne pakiety obliczeniowe tworzą dane wyjściowe w postaci plików tekstowych. Niekiedy są to pliki bardzo duże - kilka/kilkanaście/kilkadziesiąt MB czystego tekstu. Ostatnio postanowiłem zrobić porządki w katalogach (by zaoszczędzić trochę przestrzeni dyskowej) i skompresować niektóre katalogi zawierające duże pliki tekstowe. Postanowiłem przy okazji sprawdzić który z dwóch rozpowszechnionych formatów - zip i 7z, charakteryzuje się lepszą kompresją plików tekstowych.

Rozmiar bez kompresji (MB)Archiwum zip (MB)Archiwum 7z (MB)Archiwum rar (MB)
Katalog 1 (tylko pliki tekstowe)193,738,82,43,5
Katalog 2 (tylko pliki tekstowe)633,7128,65,98,5
Katalog 3 (pliki tekstowe i binarne)699,6153,399,7144,4

Wyniki są trochę zaskakujące, ponieważ dla czystych plików tekstowych kompresja 7z pozwala stworzyć archiwum o rozmiarze ~100 razy mniejszym niż rozmiar plików nieskompresowanych (i kilka razy mniejszym niż archiwum zip).

Aktualizacja: Za namową Ominousa dodałem także kolejny popularny format kompresji - rar.