Тема: Создание архива данных. Извлечение данных из архива

Все кто использует компьютер для работы и обычны пользователи используют для своих нужд определенный набор программ. Есть программы распространенные, есть не очень. Но есть одна программа, которую используют практически все, это программа . О ней и пойдет речь в этой статье.

Программа Винрар радует не только безупречной надежностью и удобным интерфейсом, а также тем, что пробную версию можно скачать бесплатно. Это стоит сделать хотя бы для того, чтобы оценить все преимущества данного архиватора.

Разнообразие поддерживаемых форматов.

Как известно, современные версии архиватора Винрар позволяют архивировать файлы в двух форматах: рар и зип. Помимо этого, открывать и распаковывать приложение может гораздо больше типов файлов: ACE, Z, 7Z, BZ2, GZ, ARJ, CAB, JAR, TAR, LZH, UUE и ISO. Некоторые из указанных форматов встречаются достаточно редко, и тут уж не обойтись без использования именно этого архиватора, поскольку другим такая задача может оказаться не под силу.

Шифрование с целью безопасности.

Еще одно важное преимущество программы Винрар – возможность шифрования файлов благодаря применению алгоритма AES. Здесь используется ста двадцати восьми битный ключ, что само по себе уже является достаточно неплохой защитой. Помимо этого, хэш-пароль с алгоритмом SHA-1 дополнительно защищает файл таким образом, что взломать его практически невозможно.

Возможность работать с большими файлами.

Винрар является и лидером по объему файлов, с которыми он может работать. Максимальный размер может достигать 8,589 миллиардов гигабайт. Такие объекты используются уже не на домашних, а на специализированных компьютерах, тем не менее, данный архиватор может их успешно обработать. Даже если размер файлов, которым требуется сжатие, значительно меньше указанного, все равно предпочтителен для архивирования именно Винрар, поскольку эта программа обеспечивает оптимальное сочетание объема и скорости работы.

Использование многотомных и самораспаковывающихся архивов.

В относительно новых версиях программы пользователи получили возможность создавать многотомные и, что особенно удобно, самораспаковывающееся архивы. Эта функция очень пригодится в том случае, если файл необходимо открыть на таком компьютере, где архиватор не установлен.

Защита от повреждений.

К тому же, архивируемые файлы достаточно надежно защищены на случай повреждения. Для этого программа запрашивает дополнительную информацию, которая и используется для восстановления данных. Безусловно, такая возможность полезна и при работе с домашним персональным компьютером, и просто незаменима в рабочих ситуациях, значительно сокращая время, затрачиваемое на восстановление информации.

Поддержка имен

Дополнительное удобство

Наконец, немаловажным дополнением является поддержка программой командной строки, что позволяет полноценно сжимать и разархивировать файлы в случае неисправностей мыши или же дисплея.

Таким образом, Винрар является одним из лучших современных архиваторов, с множеством функций, облегчающих пользователю работу по архивированию и распаковыванию файлов. Не стоит забывать и об удобном и интуитивно понятном интерфейсе, который остался практически неизменным с момента выхода первой версии программы. Постоянное усовершенствование архиватора просто не оставляет для пользователей необходимости заниматься поиском альтернатив. С начала девяностых годов двадцатого века уже выросло целое поколение пользователей Винрар, не желающих изменять своим привычкам. Скачивая пробную версию программы бесплатно, можно оценить все ее преимущества, ведь установка ее особых усилий не требует, а удалить при желании можно всегда.

Тема: Создание архива данных. Извлечение данных из архива. Атрибуты файла и его объем

Цель: изучение принципов архивации файлов, функций и режимов работы наиболее распространенных архиваторов, приобретение практических навыков работы по созданию архивных файлов и извлечению файлов из архивов.

Теоретические сведения к лабораторной работе

Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Архивация предназначена для создания резервных копий используемых файлов, на случай потери или порчи по каким-либо причинам основной копии (невнимательность пользователя, повреждение магнитного диска, заражение вирусом и т.д.).

Для архивации используются специальные программы, архиваторы, осуществляющие упаковку и позволяющие уменьшать размер архива, по сравнению с оригиналом, примерно в два и более раз.

Архиваторы позволяют защищать созданные ими архивы паролем, сохранять и восстанавливать структуру подкаталогов, записывать большой архивный файл на несколько дисков (многотомный архив).

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив. Программы большого объема, распространяемые на дискетах, также находятся на них в виде архивов.

Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации.

Выигрыш в размере архива достигается за счет замены часто встречающихся в файле последовательностей кодов на ссылки к первой обнаруженной последовательности и использования алгоритмов сжатия информации.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Для того чтобы воспользоваться информацией, запакованной в архив, необходимо архив раскрыть или распаковать. Это делается либо той же программой-архиватором, либо парной к ней программой-разархиватором.

Разархивация (распаковка) — процесс восстановления файлов из архива в первоначальном виде. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в обычно создаются в форме.ЕХЕ-файла.

Архиваторы, служащие для сжатия и хранения информации, обеспечивают представление в едином архивном файле одного или нескольких файлов, каждый из которых может быть при необходимости извлечен в первоначальном виде. В оглавлении архивного файла для каждого содержащегося в нем файла хранится следующая информация:

  1. имя файла;
  2. сведения о каталоге, в котором содержится файл;
  3. дата и время последней модификации файла;
  4. размер файла на диске и в архиве;
  5. код циклического контроля для каждого файла, используемый для проверки целостности архива.

Архиваторы имеют следующие функциональные возможности :

  1. Уменьшение требуемого объема памяти для хранения файлов от 20% до 90% первоначального объема.
  2. Обновление в архиве только тех файлов, которые изменялись со времени их последнего занесения в архив, т.е. программа-упаковщик сама следит за изменениями, внесенными пользователем в архивируемые файлы, и помещает в архив только новые и измененные файлы.
  3. Объединение группы файлов с сохранением в архиве имен директорий с именами файлов, что позволяет при разархивации восстанавливать полную структуру директорий и файлов.
  4. Написания комментариев к архиву и файлам в архиве.
  5. Создание саморазархивируемых архивов, которые для извлечения файлов не требуют наличия самого архиватора.
  6. Создание многотомных архивов– последовательности архивных файлов. Многотомные архивы предназначены для архивации больших комплексов файлов на дискеты.

Задание №1.

  1. В операционной системе Windows создайте папку Archives по адресу С:\ТЕМР . Создайте папки Pictures и Documents по адресу С:\ТЕМР\Archives .
  2. Найдите и скопируйте в папку Pictures по два рисунка с расширением * .jpg и * .bmp .
  3. Сравните размеры файлов *.bmp и *.jpg . и запишите данные в таблицу_1.
  4. В папку Documents поместите файлы *.doc (не менее 3) и запишите их исходные размеры в таблицу_1.


Задание №2. Архивация файлов WinZip

  1. Запустите WinZip 7. (Пуск →Все программы → 7-Zip→7 ZipFileManager ).
  2. С:\ТЕМР\Archives\Pictures. Зима. jpg . Выполните команду Добавить (+) .
  3. Введите имя архива в поле Архив – Зима. zip и убедитесь, что в поле Формат архива установлен тип Zip .
  4. Установите в поле Режим изменения : добавить и заменить.
  5. В раскрывающемся списке ОК .
  6. Сравните размер исходного файла с размером архивного файла. Данные запишите в таблицу_1.
  7. Создайте архив Зима1. zip , защищенный паролем. Для ввода пароля в диалоговом окне Добавит к архиву в поле Введите пароль: ведите пароль, в поле Повторите пароль: подтвердите пароль. Обратите внимание на флажок Показать пароль. Если он не установлен, пароль при вводе не будет отображаться на экране, а его символы будут заменены подстановочным символом "*". Это мера защиты пароля от посторонних. Однако в данном случае пользователь не может быть уверен в том, что он набрал пароль правильно. Поэтому при не установленном флажке система запрашивает повторный (контрольный) ввод пароля. Щелкните на кнопке ОК - начнется процесс создания защищенного архива.
  8. Выделите архив Зима1. zip , выполните команду Извлечь. В появившемся диалоговом окне Извлечь в поле Распаковать в: выберите папку-приемник - С:\ТЕМР\Archives\Pictures\Зима1\.
  9. Щелкните на кнопке ОК . Процесс извлечения данных из архива не запустится, а вместо него откроется диалоговое окно для ввода пароля.
  10. Убедитесь в том, что ввод неправильного пароля не позволяет извлечь файлы из архива.
  11. Убедитесь в том, что ввод правильного пароля действительно запускает процесс.
  12. Удалите созданный вами защищенный архив и извлеченные файлы.
  13. Создайте самораспаковывающийся ZIP-архив. Для этого установите курсор на имя архива Зима. zip , выполните команду Добавить (+).
  14. Введите имя архива в поле Архив – Зима.7 z и убедитесь, что в поле Формат архива установлен тип 7 z .
  15. Установите в поле Режим изменения : добавить и заменить.
  16. Установите флажок Создать SFX -архив .
  17. В раскрывающемся списке Уровень сжатия: выберите пункт Нормальный. Запустите процесс архивации кнопкой ОК .

Задание №3. Архивация файлов WinRar

  1. Запустите WinRar (Пуск →Все программы → WinRar ).
  2. В появившемся диалоговом окне выберите папку, в которой будет создан архив: С:\ТЕМР\Archives\Pictures.
  3. Установите курсор на имя графического файла Зима. jpg .
  4. Выполните команду Добавить . В появившемся диалоговом окне введите имя архива Зима.rar. Выберите формат нового архива - RAR , метод сжатия - Обычный . Убедитесь, что в группе Параметры архивации ни в одном из окошечек нет флажков. Щелкните на кнопке ОК для создания архива. Во время архивации отображается окно со статистикой. По окончании архивации окно статистики исчезнет, а созданный архив станет текущим выделенным файлом.
  5. Аналогичным образом создайте архивы для файлов Рябина. bmp , Документ1. doc , Документ2. doc , Документ3. doc . Сравнительные характеристики исходных файлов и их архивов занести в таблицу_1.
  6. Создайте самораспаковывающийся RAR – архив, включающий в себя текстовые и графические файлы.
  7. Определите процент сжатия файлов и заполните таблицу_1. Процент сжатия определяется по формуле , где S– размер архивных файлов, S o– размер исходных файлов.

Таблица _ 1

Архиваторы

Размер исходных файлов

WinZip

WinRar

Текстовые файлы:

1. Документ1. doc

2. Документ2. doc

3. Документ3. doc

Графические файлы:

1. Зима. jpg

2.Рябина. bmp

Процент сжатия текстовой информации (для всех файлов)

Процент сжатия графической информации (для всех файлов)


Задание №4. Ответить на вопросы:

  1. Что называется архивацией?
  1. Для чего предназначена архивация?
  1. Какой файл называется архивным?
  1. Что называется разархивацией?
  1. Какая информации хранится в оглавлении архивного файла?
  1. Какие функциональные возможности имеют архиваторы?

Задание №5. Сделать вывод о проделанной лабораторной работе:

РЕФЕРАТ

по дисциплине «Информатика»

по теме: «Архиваторы»

1. Теоретические положения использования архиваторов

2. Основные возможности программы WinRar.

2.1 WinRAR – Общие сведения

2.2 Ограничения WinRAR

2.3 Интерфейс WinRAR

2.4 Режимы управления файлами и архивами

2.5 Режим Мастера

2.6 Использование контекстных меню

2.7 Поддержка технологии перетаскивания

3. Тестовые примеры использования WinRar

Библиографический список

Программы архивации являются обязательным инструментом в работе с компьютером. Хранение и передача данных немыслимы без их использования.

Основным преимуществом архиваторов является значительное уменьшение требуемого для хранения информации места на диске. В некоторых случаях экономия дискового пространства может достигать 90%. Это достигается путем использования специальных алгоритмов сжатия данных. Как следствие уменьшается количество сетевого трафика, необходимого для передачи заархивированных файлов. Как правило, программы архивации предоставляют возможность настраивать алгоритм сжатия, выбирая компромисс между степенью сжатия и скоростью архивации. Чем сильнее сжатие, тем медленнее происходит процесс архивации.

Жесткие диски хранят данные секторами по 512 байт, файловая система хранит данные «кусочками» – кластерами размером от 512 байт и до 64 Кбайт (размер всегда кратен 512 байтам). Чем больше размер кластера – тем больше производительность файловой системы, но возрастают и потери места на диске.

Потеря происходит из-за того, что маленькие файлы в любом случае занимают не менее 1 кластера. Например, файл в 2 Кбайта при размере кластера в 32 Кбайта приведет к потере 30 Кбайт места на диске.

Файловый архив может содержать сколько угодно много различных файлов. Если маленькие файлы помещают в архив, эти потери от округления занимаемого файлом места на диске до кластера исчезают.

Кроме того, архиваторы предоставляют средства проверки целостности архива. Благодаря этому всегда можно удостовериться, не нарушен ли архив при хранении или передаче по сети.

Архив может быть самораспаковывающимся. Самораспаковывающийся (SFX, от англ. SelF-eXtracting) архив – это архив, к которому присоединен исполняемый модуль. Этот модуль позволяет извлекать файлы простым запуском архива как обычной программы. Таким образом, для извлечения содержимого SFX-архива не требуется дополнительных внешних программ. SFX-архивы, как и любые другие исполняемые файлы, обычно имеют расширение.EXE.

SFX-архивы удобны в тех случаях, когда нужно передать кому-то архив, но вы не уверены, что у адресата есть соответствующий архиватор для его распаковки. Возможно также использовать SFX-архивы для распространения своих собственных программ.

Архив может быть многотомным – состоять из нескольких файлов (томов), размер которых не превышает заданного количества байт (например емкости дискеты). Для того чтобы работать с таким архивом, нужно открыть в архиваторе первый файл многотомного архива, и программа-архиватор будет обращаться к другим томам по мере необходимости.

Непрерывный архив – это архив RAR, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Непрерывная архивация поддерживается только в формате RAR, для формата ZIPтакого типа архива не существует.

Непрерывная архивация значительно увеличивает степень сжатия, особенно при добавлении в архив значительного количества небольших файлов с похожим содержимым. Однако следует иметь в виду, что у непрерывной архивации есть и некоторые недостатки:

· обновление непрерывных архивов (т.е. добавление файлов в уже существующий архив или их удаление) происходит медленнее, чем обычных;

· чтобы извлечь один файл из непрерывного архива, приходится анализировать все предыдущие заархивированные файлы, поэтому извлечение отдельных файлов из середины непрерывного архива происходит медленнее, чем извлечение из обычного архива. Однако если из непрерывного архива извлекаются все или несколько первых файлов, то в этом случае скорость распаковки практически равна скорости распаковки обычного архива;

· если в непрерывном архиве какой-либо файл окажется поврежденным, то не удастся извлечь и все файлы, следующие после него. Поэтому при сохранении непрерывного архива на ненадежном носителе (например, на дискете) рекомендуется добавлять информацию для восстановления.

Непрерывные архивы предпочтительнее использовать в тех случаях, когда:

· архив предполагается редко обновлять;

· планируется чаще распаковывать весь архив, нежели извлекать из него один или несколько файлов;

· нужно достичь более плотной степени сжатия, даже в ущерб скорости упаковки.

Многотомные и самораспаковывающиеся архивы также могут быть непрерывными. [ 3]

Еще одной важной функцией архивирования является возможность защиты паролем помещенных в архив файлов. Если архив защищен паролем, то извлечь из него файлы можно только указав пароль, использованный при создании архива. Современные архивы обладают высокой криптостойкостью, но это не дает 100% гарантий, если используются слабые пароли. Необходимо использовать длинные не распространенные пароли. Журнал «Хакер» по поводу паролей пишет: «И самое главное, не забывайте их, а то вам никто не поможет. Предположим, что ваш пароль состоит из 5 символов и каждым символ может быть английской заглавной или строчной буквой, или цифрой. Тогда каждый символ может быть любым из 64. Следовательно, количество всех возможных комбинаций равно 64 в степени 5, то есть 1073741824. Программа FCrackZip имеет скорость перебора 400000 паролей в секунду. Значит, все пароли из нашего примера можно перебрать с ее помощью приблизительно за 45 минут. А если пароль состоит из 6 символов, то все комбинации можно перебрать за 47 часов. Страшно даже подумать сколько займет перебор пароля из 15 символов. А если при этом еще увеличить количество возможных значений, например, до 255, то вообще сложно вообразить себе цифру, выражающую количество лет нужных для перебора. Выбирайте пароли как можно длиннее и как можно не логичней. И не забывайте их!»

WinRAR– это 32-разрядная версия архиватора RAR для Windows, мощного средства создания архивов и управления ими. Существует несколько версий RAR для разных операционных систем, в частности, RAR для Windows, Linux, DOS, OS/2, UNIX.

· RAR для Windows поставляется в двух вариантах:

· версия с графическим интерфейсом пользователя (GUI) – WinRAR.exe;

· консольная версия – Rar.exe, запускаемая из командной строки и работающая в текстовом режиме. Консольную версию RAR удобно использовать для вызова из пакетных файлов (BAT и CMD), для запуска из приглашения DOS и др.

Некоторые отличительные особенности WinRAR следующие:

· полная поддержка архивов RAR и ZIP;

· использование оригинального высокоэффективного алгоритма сжатия данных;

· наличие графической оболочки с поддержкой технологии перетаскивания (drag & drop);

· возможность использования интерфейса командной строки;

· управление архивами других форматов (CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2, JAR, ISO);

· поддержка метода непрерывного (solid) архивирования, при котором может быть достигнута на 10-50% более высокая степень сжатия, чем дают обычные методы, особенно если упаковывается значительное количество небольших файлов однотипного содержания;

· поддержка многотомных архивов;

· создание самораспаковывающихся (SFX) обычных и многотомных архивов с помощью стандартного или дополнительных модулей SFX;

· возможность восстановления физически поврежденных архивов;

· возможность создания и использования томов для восстановления, позволяющих воссоздавать недостающие части многотомных архивов.

· поддержка кодировки Unicode в именах файлов;

· наличие других дополнительных функций, например, шифрования данных и имён файлов в архиве, добавления архивных комментариев, ведения протокола ошибок и пр.

Количество файлов, которое можно добавить в архив, зависит от объёма доступной памяти и длины имён файлов. Для добавления одного файла в архив RAR требуется ориентировочно 128 байт памяти. Например, для архивации миллиона файлов необходимо около 128 Мбайт памяти. WinRAR тестировался в работе с более чем 10 миллионами файлов.

Максимальный размер архива RAR, равно как и любого файла в архиве RAR, практически не ограничен – он составляет 8 эксабайт (что равнозначно 8 589 934 591 Гбайт или 9 223 372 036 854 775 807 байт). Обратите внимание, что создавать архивы размером свыше 4 Гбайт можно только на дисках с файловой системой NTFS, поскольку более старые файловые системы не поддерживают таких объёмных файлов.

Размер архива ZIP, равно как и любого файла в архиве ZIP, не может превышать 4 Гбайт.

В целом архивный формат RAR значительно лучше оптимизирован для сложных задач с использованием большого количества файлов и гигабайтных дисковых пространств.

Меню WinRAR содержит следующие пункты: «Файл», «Команды», «Избранное», «Параметры» и «?» (Справка).

Ещё один элемент интерфейса – панель инструментов. Она находится ниже меню и выше списка файлов. Кнопки на панели инструментов повторяют пункты из меню «Команды» (у всех пунктов в этом меню есть «горячие клавиши» для быстрого доступа). Во время просмотра содержимого архива некоторые кнопки могут быть отключены, если их функции неприменимы к архиву. Можно выбрать отображаемые кнопки, убрать текст с кнопок или уменьшить их размер в диалоге «Общие параметры» или щелкнув правой кнопкой мыши на панели инструментов.

Какие существуют архиваторы и чем они отличаются?

Следует различать собственно программу-архиватор, формат архивов и методы сжатия. Даже один и тот же метод сжатия может иметь варианты реализации. Например, существует более десятка программ-архиваторов, которые могут создавать архивы в формате ZIP. В свою очередь данные в формате ZIP могут быть сжаты различными методами: Deflate, Deflate64, BZip2. Метод Deflate имеет несколько реализаций с разной скоростью и степенью сжатия (разница порядка 5%). С помощью этого метода архиватор 7-zip позволяет создавать архивы в формате ZIP и 7Z.

Обычно архиваторы могут создавать архивы в собственном эксклюзивном формате с использованием своих оригинальных методов. Например, архиватор RAR позволяет создавать архивы RAR. В формате архива и методах сжатия заключаются основные преимущества того или иного архиватора.

В простейшем случае архиватор позволяет только упаковать или распаковать один файл. Кроме собственно сжатия данных, современные архиваторы обеспечивают некоторые дополнительные функции. Можно выделить несколько основных:

  • сжатие некоторых файлов и целых директорий;
  • создание самораспаковывающихся (SFX) архивов. То есть для распаковки архива программа-архиватор не требуется;
  • изменение содержимого архива;
  • шифрование содержимого архива;
  • информация для восстановления архива при частичном повреждении и возможность восстановления поврежденных архивов;
  • разбивка архива на несколько частей или томов;
  • консольная версия программы для работы из командной строки;
  • графическая (GUI) версия программы.

Стоит отметить, что, несмотря на формальное наличие, реализация каждой дополнительной функции может быть выполнена на совершенно разном уровне.

Кроме различий в функциональности, можно разбить архиваторы на две группы: асимметричные и симметричные. Асимметричные архиваторы требуют для операции распаковки значительно меньше времени и оперативной памяти, чем для операции упаковки. Это позволяет быстро получать содержимое архива на маломощных компьютерах. Симметричные архиваторы требуют для операций упаковки и распаковки одинаковое время и объем оперативной памяти. Использование таких архиваторов на широком парке компьютеров или для оперативного доступа к содержимому архива ограничено. Известный архиватор RAR в качестве основного использует асимметричный словарный метод сжатия, а для текстов может использовать симметричный PPM-метод. Таким образом, распаковка архивов RAR, сжатых с максимальной степенью сжатия, может быть невозможна на компьютерах с ограниченным объемом оперативной памяти. Все или почти все передовые архиваторы с высокой степенью сжатия являются симметричными.

Точной статистики по распространенности архиваторов у меня нет. Я выскажу свою субъективную точку зрения на основе личного опыта. Безусловно, самым распространенным архиватором являются ZIP и его модификации. По своей распространенности он значительно превосходит ближайших конкурентов. Следом идут RAR и ACE. В последние годы встречается архиватор 7-zip. Других архиваторов и архивов лично мы не встречали. Исключение составляют некогда популярные ARJ и LHA. В данный момент они не актуальны из-за очень низкой степени сжатия.

Несмотря на очень скромные данные о распространенности архиваторов, их существует большое множество. Основная масса относится к категории экспериментальных и архиваторов с ограниченной функциональностью. Тем не менее каждый их них позволяет выполнять собственно процедуру сжатия данных. Меньшая распространенность увеличивает вероятность ошибок в программе. К ним стоит относиться с некоторой осторожностью. Например, при проведении тестирования была найдена ошибка в архиваторе WinRK (PWCM), которую, однако, оперативно исправили.

Тестирование максимальной степени сжатия

В данном тестировании главной целью было определить лучший по степени сжатия архиватор. Скорость сжатия была второстепенна.

Для разностороннего тестирования и выявления сильных и слабых сторон использовалось несколько наборов данных, требующих различных подходов и методов для хорошего сжатия. Их размер выбран достаточно большим, чтобы архиваторы с большим размером словаря или более эффективно использующие оперативную память могли показать свое преимущество. В сжатом при помощи ZIP виде они занимают размер в районе 15 MB.

Для каждого набора данных обычно можно подобрать наиболее оптимальные параметры сжатия. Однако в этом тестировании для всех наборов данных использовались единые параметры и методы, дающие в среднем лучшие результаты исходя из наличия 512 MB оперативной памяти. Такой подход является компромиссным. С одной стороны, можно оценить эффективность на разных типах данных, хотя некоторые архиваторы и не покажут максимальной степени сжатия. С другой стороны, в реальности приходится сжимать целые папки с разнообразными данными, а специфические значения параметров могут влиять как положительно, так и отрицательно на сжатие данных в целом. Кроме того, подбор оптимальных параметров не так прост, занимает много времени и в реальной жизни выполняется редко.

Стоит подчеркнуть, что выбор исходных данных очень сильно влияет на результаты тестирования. Например, при использовании текстовых (TXT,HTML,DOC,LOG) и мультимедиа (WAV) данных архиватор 7-zip (LZMA) покажет худшие результаты, чем RAR, который имеет специальные методы для таких типов данных. Использование несжимаемых данных (JPG, PDF) покажет мизерную разницу между архиваторами с плохой и хорошей степенью сжатия. Кстати, многие файлы могут содержать как сжимаемую информацию, так и не- сжимаемую. В том числе файлы в формате DOC и PDF.

Сильное влияние оказывает и подбор оптимальных параметров сжатия. Например, по данным www.maximumcompression.com, используещего оптимальные параметры сжатия для каждого набора данных, разница между 7-zip и RAR около 3%, что значительно меньше разницы, полученной в данном тестировании.

Тестовая система

Тестирование производилось на системе: процессор - Athlon XP 2800+, оперативная память - 512 MB.

Набор данных

Данные

Размер

Сжатие ZIP

bak

54.4 MB, 13 файлов

Набор резервных копий. Резервные копии конфигураций (настроек) 1С:Предприятие. Размер файлов от 3 MB до 9 MB. Файлы имеют блочную структуру (compound) и содержат довольно много похожих и одинаковых блоков.
dat

41.5 MB, 4 файла

Сложный набор разнообразных данных. Файлы, содержащие информацию об игровых уровнях (картах) в играх Half-Life 2 и UnrealTurnament 2003.
dbf

69.1 MB, 8 файлов

Файлы баз данных. Файлы таблиц из юридической программы и базы данных 1С:Предприятие небольшого предприятия.
exe

25.3 MB, 3 файла

Исполняемые файлы. Исполняемый файл из игры Half-Life 2, а так же динамическая библиотека и исполняемый файл из пакета MS Office XP.
med

25.5 MB, 27 файлов

Мультимедиа файлы. Несколько файлов изображений в формате PSD, несколько текстур из игр Half-Life 2 и Unreal Tournament 2003 во внутреннем формате, несколько файлов несжатого звука WAV из игры Half-Life 2.
txt

41.4 MB, 472 файла

Текстовые файлы. Текстовые файлы в формате HTML на русском языке (16.5 MB), исходные коды на языках программирования JAVA, Delphi, Python (24.8 MB). Размер файлов от 20 MB.

Архиваторы

Под архиватором понимается программа-архиватор, формат архива и метод сжатия в комплексе. Далее по тексту для выделения этой совокупности используется курсив.

Были выбраны наиболее интересные и яркие с моей точки зрения архиваторы. Для этого протестированы наиболее распространённые архиваторы и лучшие архиваторы по данным http://techlabs.by/click.php?url=http://www.maximumcompression.com/ . Некоторые архиваторы были протестированы, но в итоговые результаты не попали. В том числе 7-zip (PPMd), Compressia, DGCA, DURILCA, EPM, PPMonstr, StuffIt, SBC, WinRK (PPMZ), WinRK (ROLZ). Некоторые архиваторы были отброшены после первых предварительных тестов. Это обусловлено более низкими результатами, без каких либо существенных преимуществ. Тем не менее, такие архиваторы, как Compressia, DURILCA, EPM, WinRK (PPMZ) являются одними из лучших по степени сжатия. Такой малоизвестный архиватор DGCA обладает почти идентичной степенью сжатия, скоростью и функциональностью с RAR, за исключением возможности изменять содержимое архива. При этом он является асимметричным, бесплатным и требует меньше оперативной памяти. Отмечу, что DGCA совершенно другой архиватор, который имеет свои недостатки.

Так как не все протестированные архиваторы поддерживают возможность сжатия папок, для них набор данных предварительно преобразовывался в архив ZIP с нулевой степенью сжатия.

Архиватору Slim немного подыграли. Дело в том, что этот неплохой архиватор может сжимать целые папки, но не использует непрерывный режим сжатия. В результате на тестовом наборе txt он показал сравнительно плохой результат. Если же использовать архив ZIP с нулевой степенью сжатия, тогда на тестовых наборах exe и med степень сжатия получалась значительно хуже. Это объясняется тем, что архиватор Slim использует специальные методы для некоторых форматов файлов. Архив ZIP хоть и содержит несжатые файлы, для Slim представляется только как архив ZIP. Таким образом, для архиватора Slim тестовый набор txt и bak предварительно преобразовывался в архив ZIP с нулевой степенью сжатия.

Архиватор

Версия

Параметры

7zip Format=7z, Compression level=Ultra, Compression method=LZMA, Dictionary size=32 MB, Word size=255
ACE Compression=maximum, Solid=on, V2.0=on, Dictionary=4096 KB
PAQAR Compression option=6
RAR Compression method=best, Solid=on, Advanced compression parameters=(Все включено или авто), Text compression memory to use=128 MB, Dictionary=4096 KB
Slim Use of memory=400 MB
Squeez Format=SQX, Compression rate=maximum, Dictionary size=4096 KB, Multimedia compression=on, EXE compression=on
UHARC Compression mode=PPM, Dictionary size=32768 KB
WinRK Compression method=PWCM, Model size=400 MB
WinUDA Mode-3
ZIP Format=ZIP, Compression method=Deflate, Word size=255

Функциональность и характеристики архиваторов

Указаны характеристики и функциональность только для выбранных параметров. При использовании других параметров эти характеристики могут сильно измениться. Например, WinRK при использовании стандартного метода PPMZ позволяет создавать самораспаковывающиеся (SFX) архивы. Требования к оперативной памяти в основном определены выбранными параметрами и могут быть уменьшены.

7zip ACE PAQAR RAR Slim Squeez UHARC WinRK WinUDA ZIP
Сжатие директорий
Создание самораспаковывающихся (SFX) архивов
Изменение содержимого архива
Шифрование
Восстановление архива
Разбивка архива на части
Консольная версия
Графическая (GUI) версия
Асимметричность
Требования к оперативной памяти, MB
Бесплатность
  1. Не поддерживается непрерывный режим. Архиватор не эффективен при сжатии большого числа маленьких файлов.
  2. Архиватор 7-zip не поддерживает cоздание самораспаковывающихся (SFX) архивов ZIP , однако такая возможность имеется во многих других архиваторах, которые могут создавать архивы ZIP.
  3. Архиватор WinRK не имеет отдельной консольной версии, однако существует возможность работы с архиватором из командной строки.
  4. Архиватор WinUDA имеет консольную версию, но она использует более старый метод сжатия и создаёт несовместимые с графической (GUI) версией архивы.
  5. Архиватор UHARC не имеет отдельной версии с графической оболочкой. Однако существует полнофункциональная сторонняя оболочка WinUHA.
  6. Основной метод сжатия архиватора RAR - асимметричный словарный метод. Однако при максимальном сжатии может использоваться и используется симметричный метод для сжатия текста (PPM).
  7. Если установить автоматическое определение размера оперативной памяти для текстового сжатия, то на тестовых данных и тестовой системе для архиватора RAR требовалось всего 64 MB, а степень сжатия ухудшалась незначительно.
  8. В большинстве архиваторов для создания архивов ZIP требуется значительно меньше оперативной памяти.

Практическое задание

Тема: Создание архива данных. Извлечение данных из архива. Атрибуты файла и его объем

Цель: изучение принципов архивации файлов, функций и режимов работы наиболее распространенных архиваторов, приобретение практических навыков работы по созданию архивных файлов и извлечению файлов из архивов.

Оборудование и материалы: практическое задание, компьютер,архиваторы WinZip, WinRar.

Теоретические сведения к практическомузаданию

Архивация (упаковка) - помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде.

Архивация предназначена для создания резервных копий используемых файлов, на случай потери или порчи по каким-либо причинам основной копии (невнимательность пользователя, повреждение магнитного диска, заражение вирусом и т.д.).

Для архивации используются специальные программы, архиваторы, осуществляющие упаковку и позволяющие уменьшать размер архива, по сравнению с оригиналом, примерно в два и более раз.

Архиваторы позволяют защищать созданные ими архивы паролем, сохранять и восстанавливать структуру подкаталогов, записывать большой архивный файл на несколько дисков (многотомный архив).

Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив. Программы большого объема, распространяемые на дискетах, также находятся на них в виде архивов.

Архивный файл - это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации.

Выигрыш в размере архива достигается за счет замены часто встречающихся в файле последовательностей кодов на ссылки к первой обнаруженной последовательности и использования алгоритмов сжатия информации.

Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 - 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей - 60 - 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

Для того чтобы воспользоваться информацией, запакованной в архив, необходимо архив раскрыть или распаковать. Это делается либо той же программой-архиватором, либо парной к ней программой-разархиватором.

Разархивация (распаковка) - процесс восстановления файлов из архива в первоначальном виде. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.

Самораспаковывающийся архивный файл - это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в обычно создаются в форме.ЕХЕ-файла.

Архиваторы, служащие для сжатия и хранения информации, обеспечивают представление в едином архивном файле одного или нескольких файлов, каждый из которых может быть при необходимости извлечен в первоначальном виде. В оглавлении архивного файла для каждого содержащегося в нем файла хранится следующая информация:

    • имя файла;

      сведения о каталоге, в котором содержится файл;

      дата и время последней модификации файла;

      размер файла на диске и в архиве;

      код циклического контроля для каждого файла, используемый для проверки целостности архива.

Архиваторы имеют следующие функциональные возможности :

    1. Уменьшение требуемого объема памяти для хранения файлов от 20% до 90% первоначального объема.

      Обновление в архиве только тех файлов, которые изменялись со времени их последнего занесения в архив, т.е. программа-упаковщик сама следит за изменениями, внесенными пользователем в архивируемые файлы, и помещает в архив только новые и измененные файлы.

      Объединение группы файлов с сохранением в архиве имен директорий с именами файлов, что позволяет при разархивации восстанавливать полную структуру директорий и файлов.

      Написания комментариев к архиву и файлам в архиве.

      Создание саморазархивируемых архивов, которые для извлечения файлов не требуют наличия самого архиватора.

      Создание многотомных архивов– последовательности архивных файлов. Многотомные архивы предназначены для архивации больших комплексов файлов на дискеты.

Задание №1

Подготовьте объекты необходимые при архивации.

Порядок выполнения задания №1

    В операционной системе Windows создайте папку Archives по адресу Мои документы\Техникум\Техникум\1курс\Группа\Фамилия\ТЕМР . Создайте папки Pictures и Documents по адресу

Мои документы\Техникум\Техникум\1курс\Группа\Фамилия\Archives .

    Найдите и скопируйте в папку Pictures по два рисунка с расширением *.jpg и *.bmp .

    Сравните размеры файлов *.bmp и *.jpg . и запишите данные в таблицу_1.

    В папку Documents поместите файлы *.doc (не менее 3) и запишите их исходные размеры в таблицу_1.

Задание №2

Выполните архивацию файлов и извлечение файлов из архива, используя программу WinZip

Порядок выполнения задания №2

    Запустите WinZip 7. (Пуск →Все программы → 7-Zip→7 ZipFileManager ).

    В появившемся диалоговом окне выберите папку, в которой будет создан архив: Мои документы\Техникум\Техникум\1курс\Группа\Фамилия\Archives\Pictures. Установите курсор на имя графического файла Зима. jpg . Выполните команду Добавить (+) .

    Введите имя архива в поле Архив Зима. zip и убедитесь, что в поле Формат архива установлен тип Zip .

    Установите в поле Режим изменения : добавить и заменить.

    В раскрывающемся списке Уровень сжатия: выберите пункт Нормальный. ОК .

    Сравните размер исходного файла с размером архивного файла. Данные запишите в таблицу_1.

    Создайте архив Зима1. zip , защищенный паролем. Для ввода пароля в диалоговом окнеДобавит к архиву в поле Введите пароль: ведите пароль, в поле Повторите пароль: подтвердите пароль. Обратите внимание на флажокПоказать пароль. Если он не установлен, пароль при вводе не будет отображаться на экране, а его символы будут заменены подстановочным символом "*". Это мера защиты пароля от посторонних. Однако в данном случае пользователь не может быть уверен в том, что он набрал пароль правильно. Поэтому при не установленном флажке система запрашивает повторный (контрольный) ввод пароля. Щелкните на кнопке ОК - начнется процесс создания защищенного архива.

    Выделите архив Зима1. zip , выполните командуИзвлечь. В появившемся диалоговом окнеИзвлечь в поле Распаковать в: выберите папку-приемник - Мои документы\Техникум\Техникум\1курс\Группа\Фамилия\Archives\Pictures\Зима1\.

    Щелкните на кнопке ОК . Процесс извлечения данных из архива не запустится, а вместо него откроется диалоговое окно для ввода пароля.

    Убедитесь в том, что ввод неправильного пароля не позволяет извлечь файлы из архива.

    Убедитесь в том, что ввод правильного пароля действительно запускает процесс.

    Удалите созданный вами защищенный архив и извлеченные файлы.

    Создайте самораспаковывающийся ZIP-архив. Для этого установите курсор на имя архива Зима. zip , выполните команду Добавить (+).

    Введите имя архива в поле Архив Зима.7 z и убедитесь, что в поле Формат архива установлен тип 7 z .

    Установите в поле Режим изменения : добавить и заменить.

    Установите флажокСоздать SFX -архив .

    В раскрывающемся списке Уровень сжатия: выберите пункт Нормальный. Запустите процесс архивации кнопкой ОК .

    Аналогичным образом создайте архивы для файлов Рябина.bmp , Документ1.doc , Документ2.doc , Документ3.doc . Сравнительные характеристики исходных файлов и их архивов занести в таблицу_1.

Задание №3

Выполните архивацию файлов, используя программуWinRar,и определите процент их сжатия.

Порядок выполнения задания №3

Таблица _ 1

Архиваторы

Размер исходных файлов

Текстовые файлы:

1. Документ1.doc

2. Документ2.doc

3. Документ3.doc

Графические файлы:

1. Зима.jpg

2.Рябина.bmp

Процент сжатия текстовой информации (для всех файлов)

Процент сжатия графической информации (для всех файлов)

Задание №4

Ответьте на контрольные вопросы к практическомузаданию

Задание №5

1. Сделайте вывод о проделанном практическомзадании.

2. Сдайте отчет преподавателю.

Контрольные вопросы

    Что называется архивацией?

    Для чего предназначена архивация ?

    Какой файл называется архивным?

    Что называется разархивацией ?

    Какая информации хранится в оглавлении архивного файла?

    Какие функциональные возможности имеют архиваторы?