Архивация (сжатие) необходима не только для экономии места в памяти, но и для надежного хранения копий ценной информации, а также для быстрой передачи информации по сети на другие ЭВМ. Кроме того, возможность отказа магнитных носителей информации, разрушающее действие вирусов заставляет пользователей делать резервное копирование ценной информации на другие (запасные) носители информации.
Процесс записи файла в архивный файл называется архивированием (упаковкой, сжатием), а извлечение файла из архива – разархивированием (распаковкой).
Упакованный (сжатый) файл называется архивом. Архив содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве. В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:
· сведения о каталоге, в котором содержится файл;
· дата и время последней модификации файла;
· размер файла на диске и в архиве;
· код циклического контроля для каждого файла, используемый для проверки целостности архива.
Что такаое архивация, зачем нужна, отправка почты — урок 26
Архивация информации – это такое преобразование информации, при котором объем информации уменьшается, а количество информации остается прежним.
Степень сжатия информации зависит от типа файла, а также от выбранного метода упаковки. Степень (качество) сжатия файлов характеризуется коэффициентом сжатия Kc, который определяется как отношение объема сжатого файла Vc к объему исходного файла Vo, выраженное в %:
Чем меньше Kc, тем выше степень сжатия.
Все используемые методы сжатия информации можно разделить на 2 класса:
‑ Упаковка без потерь информации (обратимый алгоритм) – можно точно восстановить исходную информацию по имеющейся упакованной информации.
‑ Упаковка с потерей информации (необратимый алгоритм) – распакованное сообщение будет отличаться от исходного.
В настоящее время разработано много алгоритмов архивации без потерь. Однако все они используют, в основном, 2 простые идеи.
1. Метод Хаффмана (1952) – основан на учете частот символов. Часто встречающиеся символы кодируются короткими последовательностями битов, а более редкие символы – длинными последовательностями битов. К каждому сжатому архиву прикладывается таблица соответствия имеющихся символов и кодов, заменяющих эти символы.
К маленькому файлу прикладывать таблицу кодировки не выгодно, т.к. она займет места больше, чем сам файл. Чем длиннее файл, тем выгоднее этот метод. Метод Хаффмана эффективен для упаковки текстов.
2. Метод RLE (Run Length Encoding) – основан на выделении повторяющихся фрагментов. В сообщениях часто встречаются несколько подряд идущих одинаковых байтов, а некоторые последовательности байтов повторяются многократно. При упаковке такие места можно заменить командами вида: «повторить данный байт n раз» или «взять часть текста длиной k байт, которые встречалась m байтов назад». При упаковке графической информации чаще встречается первая ситуация, при упаковке текстов – вторая.
Программы-архиваторы, их назначение и возможности.
Урок по Архивации
Назначение архиваторов — сжатие (архивирование) информации – приведение ее к виду, при котором уменьшается избыточность ее представления.
Существует большое количество программ-архиваторов. В списке наиболее популярных можно отметить ZIP, RAR, 7-Zip (произносится севэн зип), ARJ. Первые две – платные, а две других бесплатные. Впрочем, в операционной системе Windows с файлами формата Zip можно работать без установки программы-архиватора.
Алгоритмы и методы архивации
Разработано и реализовано большое количество различных алгоритмов архивации данных без потери информации, при которых при разархивации данные будут восстановлены в исходном виде.
К примеру, самый простой алгоритм сжатия данных (running) основан на замене повторяющихся битов (в тексте может иметься последовательность одинаковых символов, в графическом файле − закрашенная одним цветом область и так далее). Например, в тексте подряд идут 10 пробелов, которые кодируются 10-ю байтами. При архивации они заменяются 3-мя байтами (первый байт − кодирует заменяемый символ; второй байт − специальный байт «флажка» архивации, который указывает на необходимость развернуть первый байт в последовательность байтов; третий байт указывает количество повторяющихся байтов).
Сжатие может быть с частичной потерей информации. Такие методы можно применять, например, к аудио, видео данным и к изображениям. Примеры форматов сжатия: MP3, MPG? JPG.
К базовым функциям, которые выполняют большинство современных программ-архиваторов, относятся:
— извлечение файлов из архивов;
— создание новых архивов;
— добавление файлов в имеющийся архив;
— создание самораспаковывающихся архивов;
— создание распределенных архивов на носителях малой емкости;
— тестирование целостности структуры архивов;
— полное или частичное восстановление поврежденных архивов;
— защита архивов от просмотра и несанкционированной модификации.
Дата добавления: 2019-01-14 ; просмотров: 766 ; Мы поможем в написании вашей работы!
Источник: studopedia.net
Современные программы архивации, их возможности
Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файла путем сжатия хранимой в них информации.
Архивация (упаковка) — помещение (загрузка) файлов в архивный файл в сжатом или несжатом виде.
Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, как они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память.
Программы-упаковщики (или архиваторы) позволяют помещать копии файлов в архив и извлекать файлы из архива, просматривать оглавление архива и тестировать его целостность, удалять файлы, находящиеся в архиве, и обновлять их, устанавливать пароль при извлечении файлов из архива и др. Разные программы архивации отличаются форматом архивных файлов, скоростью работы, степенью сжатия, набором услуг (полнотой меню для пользователя), удобством пользования (интерфейсом), наличием помощи, собственным размером.
В настоящее время применяется несколько десятков программ-архиваторов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики. Из числа наиболее популярных программ можно выделить: ARJ, PKPAK, LHA, ICE, HYPER, ZIP, PAK, ZOO, EXPAND, разработанные за рубежом, а также AIN и RAR, разработанные в России.
Наиболее высокоэффективными являются архиваторы RAR, ACE, AIN, ARJ. Они обеспечивают наибольшую степень сжатия информации и имеют наиболее высокую скорость работы. Архиватор RAR имеет удобный графический интерфейс и позволяет читать текстовые файлы, находящиеся как в rar-архиве, так и в arj и zip-архивах. Архиватор AIN имеет русскоязычный интерфейс.
Ахиваторы WinRAR-95 и WinZIP работают только в среде Windows-95/98/2000. Они необходимы при работе с длинными и русскими именами файлов в Windows-95/98/2000. В настоящее время именно эти архиваторы применяются чаще всего.
Работа архиваторов ARJ, PKZIP, LHA и др. автоматизирована с помощью оболочек Norton Commander 4.0, 5.0, DOS Navigator, Windows Commander и др. Для этих архиваторов имеются специальные программы просмотрщики архивных файлов ARCVIEW и AVIEW.
Основным для всех архиваторов является режим работы в командной строке. Архиватор RAR может использовать для работы своё собственное меню. Некоторые архиваторы для извлечения файлов из архива используют отдельные программы-распаковщики, например PKUNZIP, PKXARC.
Степень упаковки архива зависит от типа архивируемых файлов, их числа и размера, выбранной программы архивации и установленных в ней ключей, вида архива. Текстовые файлы в упакованном виде занимают гораздо меньше места, чем программы (exe и com файлы). Степень упаковки в среднем равна 2-3, но иногда она достигает нескольких десятков.
Кроме того, существуют упаковщики exe и com файлов PKLITE, DIET, LZEXE, EXEPACK, AINEXE и др. Упакованные exe и com файлы имеют те же расширения (exe и com) и сохраняют свою способность к исполнению, в отличие от архивных файлов. Они занимают значительно меньше места на диске, чем неупакованные файлы.
Обычно упаковка и распаковка файлов выполняются одной и той же программой, но в некоторых случаях это осуществляется разными программами, например программа PKZIP производит упаковку файлов, а PKUNZIP-распаковку файлов.
Многие программы-архиваторы производят распаковку файлов, выгружая их на диск, но имеются и такие, которые предназначены для создания упакованного исполняемого модуля (программы). В результате такой упаковки создается программный файл с теми же именем и расширением, который при загрузке в оперативную память самораспаковывается и сразу запускается. Вместе с тем возможно и обратное преобразование программного файла в распакованный формат. К числу таких архиваторов относятся программы PKLITE, LZEXE, UNP.
Сжатие информации в архивных файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Алгоритмы подобного сжатия информации реализованы в специальных программах-архиваторах (наиболее известные из которых arj/arjfolder, pkzip/pkunzip/winzip, rar/winrar) применяются определенные. Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.
Архиватор RAR служит мощным средством для создания и ведения архивов. Преимущества RAR особенно заметны при архивировании исполняемых модулей (.EXE), объектных файлов (.OBJ), больших текстовых файлов и т.д.
Популярные программы-упаковщики — PKZIP/ PKUNZIP (версии 2.04g) и ARJ (версия 2.30) обеспечивают высокую скорость работы и большую степень сжатия информации. При этом PKZIP/PKUNZIP выделяются непревзойденной скоростью работы и обеспечивают (при указании режима -ЕХ) наивысшую степень сжатия. Программа ARJ дает почти такую же степень сжатия, отличается разнообразным сервисом и умеет создавать архивы, располагающиеся на нескольких дискетах.
Имена архивных файлов программ PKZIP/PKUNZIP и ARJ обычно имеют следующие расширения:
.ZIP — для архивных файлов программ PKZIP/PKUNZIP;
.ARJ — для архивных файлов программы ARJ (у многотомных
архивов продолжения архива имеют расширения .А01,.А02 и т.д.).
Программы PKZIP/PKUNZIP и ARJ имеют большое количество функций, выбор нужных функций выполняется в командной строке при вызове программ.
Программы PKZIP и ARJ позволяют указывать пароль при помещении файлов в архив. При этом помещаемые в архив файлы зашифровываются с помощью этого пароля, поэтому их нельзя будет извлечь из архива, не указав того же пароля. И если Вы будете хранить пароль в тайне, то никто не сможет извлечь из архива файлы.
При выборе инструмента для работы с упакованными файлами и архивами следует учитывать два фактора: эффективность, т. е. оптимальный баланс между экономией дисковой памяти и производительностью работы, и совместимость, т. е. возможность обмена данными с другими пользователями.
Источник: vuzlit.com
Использование программ-архиваторов
Программы-архиваторы предназначены для создания компьютерных файлов-архивов (рис. 8.1), т. е. файлов, которые содержат первичную информацию в сжатом виде. При этом в архив могут переноситься не только отдельные файлы, но и целые наборы файлов и папок, каждая которых может иметь достаточно сложную структуру.
Рис. 8.1. Схема процесса обработки информации архиватором
Механизм архивирования основан на том, что при записи архива происходит замена повторяющихся битовых цепочек, содержащихся в структуре файлов, на единичную запись такой цепочки с указанием координаты ее расположения относительно начала файла. Таким образом, файл-архив можно в определенном смысле сравнить с таблицей размещения файлов, только в архивированном файле вместо имен файлов записаны битовые цепочки, а вместо координат размещения файлов на диске — координаты размещения этой цепочки в исходном файле.
В результате процесса архивирования образуется файл-архив, представляющий собой не совокупность файлов, а единый файл, во внутренней структуре которого за счет обработки может содержаться достаточно большой объем информации.
Для восстановления информации в исходном виде необходима обратная процедура обработки файла-архива программой-архиватором, после которой исходная совокупность файлов и папок восстанавливается в первоначальном виде, повторяя исходную структуру.
Наиболее часто в настоящее время используются архиваторы WinRAR и WinZip. Выбор архиватора зависит только от предпочтений пользователя, поскольку практически все современные архиваторы работают достаточно эффективно и обладают интерфейсом мастера, что позволяет повысить удобство их использования.
Программа WinRAR может создавать архивы форматов RAR и ZIP, программа WinZip — только архивы ZIP.
К преимуществам ZIP-архивов следует отнести скорость их создания, поскольку ZIP-архивирование происходит быстрее, чем создание архивов RAR. Кроме этого, архивы ZIP популярны, поскольку большинство архивов, распространяющихся через Интернет, имеют именно такой формат.
Формат RAR в большинстве случаев имеет существенно большую эффективность с точки зрения степени сжатия, чем ZIP, особенно в режиме создания непрерывных архивов.
Помимо полной поддержки форматов RAR и ZIP, архиватор WinRAR поддерживает основные операции с архивами форматов CAB, ARJ, LZH, TAR, GZ, АСЕ, UUE, BZ2, JAR и ISO (образами дисков), которые создаются другими программами-архиваторами.
Обычно архиваторы достаточно эффективно сжимают информацию:
• исполняемые файлы (с расширением .ехе и .сот) — до 50 % первоначального объема;
- • текстовые документы (с расширением .txt) — до 25 % исходного размера;
- • графические файлы сжимаются неодинаково — для некоторых из них удается достичь эффективности сжатия до 70—80 %, другие в объеме практически не сокращаются.
Тем не менее иногда пользователь выдвигает особые требования к процессу архивирования информации, устанавливая больший приоритет для скорости процесса или его эффективности в аспекте степени сжатия данных.
В этом случае следует помнить, что скорость создания архива обратно пропорциональна степени сжатия информации. Чем сильнее требуется сжать информацию, тем дольше это будет делать программа-архиватор.
Не менее важное достоинство формата RAR — поддержка работы с многотомными архивами, поскольку существует несколько разновидностей архивов.
Многотомный архив — архив, состоящий из нескольких частей-томов. Том — это фрагмент многотомного архива, состоящего из нескольких частей. Тома поддерживаются только в формате архиватора WinRAR. С помощью архиватора WinZIP создать многотомный архив нельзя.
Обычно тома используются для сохранения большого архива на нескольких сменных носителях или в случае ограничения объема информации, передаваемой по сети (часто устанавливают предельный объем сообщений, передаваемых по корпоративной почте). По умолчанию все тома RAR-архива получают расширение .гаг, но к заданному имени архива для всех томов добавляются номера составляющих его частей (в виде дополнения имени компонентами .partOl, .part02, .рагЮЗ и т. д. до .part255). Уже созданные многотомные архивы не допускают изменения, т. е. в них нельзя добавлять, обновлять или удалять файлы. Для распаковки томов необходимо начинать извлечение с первого тома, а в ходе процесса разархивирования необходимо строго соблюдать последовательность томов. Если тома находятся на несменном носителе (например, на жестком диске), то сначала рекомендуется переписать все тома в одну папку, что позволит сократить восстановление информации благодаря отсутствию дополнительных запросов программы о расположении следующего тома архива.
Самораспаковывающийся архив (SFX, от англ. SelF-eXtracting) — это архив, к которому присоединен исполняемый модуль. Этот модуль позволяет извлекать файлы простым запуском архива как обычной программы. Таким образом, для извлечения содержимого SFX-архива не требуется дополнительных внешних программ, в данном случае — архиватора.
Тем не менее WinRAR может работать с SFX-архивом так же, как и с любым другим, поэтому если пользователь не хочет запускать SFX-архив (например, когда нельзя гарантировать, что в нем нет вирусов), то для просмотра или извлечения его содержимого можно использовать WinRAR. SFX-архивы, как и любые другие исполняемые файлы, обычно имеют расширение .exe.
SFX-ap- хивы удобны в тех случаях, когда нужно передать кому-то архив, но нет уверенности, что у адресата есть соответствующий архиватор для его распаковки (весьма актуальным часто является не только использование одного архиватора, но и необходимость использования версий программ одного уровня). Кроме того, SFX-архивы можно использовать для распространения своих собственных программ. Например, дистрибутив WinRAR базируется на GUI SFX-модуле RAR Default.sfx. Размер SFX-архива несколько больше, чем размер такого же RAR-архива.
Непрерывный архив — это архив RAR, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует. Метод сжатия для архивов RAR (обычный или непрерывный) выбирается пользователем. Непрерывная архивация значительно увеличивает степень сжатия, особенно при добавлении в архив значительного количества небольших файлов с похожим содержимым. Однако следует иметь в виду, что у непрерывной архивации есть и некоторые недостатки:
- • обновление непрерывных архивов (т. е. добавление файлов в уже существующий архив или их удаление) происходит медленнее, чем обычных;
- • чтобы извлечь один файл из непрерывного архива, приходится анализировать все предыдущие заархивированные файлы, поэтому извлечение отдельных файлов из середины непрерывного архива происходит медленнее, чем извлечение из обычного архива; однако если из непрерывного архива извлекаются все или несколько первых файлов, то в этом случае скорость распаковки практически равна скорости распаковки обычного архива;
- • если в непрерывном архиве какой-либо файл окажется поврежденным, то не удастся извлечь и все файлы, следующие после него; поэтому при сохранении непрерывного архива на йенадежном носителе (например, на дискете) рекомендуется добавлять информацию для восстановления.
Непрерывные архивы предпочтительнее использовать в следующих случаях:
- • архив редко обновляется;
- • планируется чаще распаковывать весь архив, нежели извлекать из него один или несколько файлов;
- • необходимо достичь более высокой степени сжатия, даже в ущерб скорости упаковки.
Многотомные и самораспаковывающиеся архивы также могут быть непрерывными.
В RAR-архив возможны добавление информации восстановления (это необходимо для восстановления физически поврежденного файла-архива) и блокировка архива для предотвращения модификации важных данных, помещенных в архив.
Тома для восстановления представляют собой особые файлы с расширением .rev, создаваемые WinRAR и предназначенные для воссоздания отсутствующих томов в многотомном архиве. Тома для восстановления можно использовать только с многотомными архивами.
Данная возможность особенно полезна при резервном копировании или, например, при отправке многотомного архива в сетевую конференцию, когда до некоторых подписчиков дошли не все тома. В подобной ситуации повторная отправка томов для восстановления может быть более экономичной с точки зрения количества пересылаемых файлов, чем отправка обычных томов.
С помощью каждого тома для восстановления можно воссоздать один отсутствующий том RAR-архива. Например, если архив состоит из 30 томов, и для него создано 3 тома для восстановления, это позволит воссоздать любые 3 отсутствующие тома. Если rev-файлов меньше, чем отсутствующих томов, воссоздание архива невозможно. Общее количество обычных томов и томов для восстановления не может превышать 255, а томов для восстановления должно быть меньше, чем томов RAR-архива.
Если поврежден сам том для восстановления, результат воссоздания будет непредсказуемым. В этом случае даже возможно, что воссозданный том также окажется поврежденным, причем во время воссоздания никаких предупреждающих сообщений об этом формироваться не будет.
Имена томов для восстановления содержат важную для воссоздания информацию (общее число обычных томов и томов для восстановления, а также номер конкретного тома для восстановления). После создания нельзя изменять имена ни обычных томов, ни томов для восстановления, иначе впоследствии RAR не сможет их воссоздать.
Источник: studref.com