Программы архивирования данных относятся к программному обеспечению

В настоящее время применяется несколько десятков программ-архиваторов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики. Из числа наиболее популярных программ можно выделить: Zip (и его модификация WinZip), WinRAR, Arj (и его разновидности), G-Zip, 7-Zip.

Программы-архиваторы позволяют создавать и такие архивы, для извлечения файлов из которых не требуются какие-либо программы, гак как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися. Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа обычно создаются в формате ЕХЕ-файла.

Многие программы-архиваторы производят распаковку файлов, выгружая их на диск, но имеются и такие, которые предназначены для создания упакованного исполняемого модуля (программы). В результате такой упаковки создается программный файл с теми же именем и расширением, который при загрузке в оперативную память самораспаковывается и сразу запускается. Вместе с тем возможно и обратное преобразование программного файла в распакованный формат. К числу таких архиваторов относятся программы Upx, PKLITE, LZEXE.

Тема 15. Архивация файлов. Программное обеспечение

Ппрограмма EXPAND, входящая в состав утилит операционной системы Windows, применяется для распаковки файлов программных продуктов, поставляемых фирмой Microsoft.

Способы управления программой-архиватором

Управление программой-архиватором осуществляется одним из следующих способов:

  • с помощью командной строки, в которой формируется команда запуска, содержащая имя программы-архиватора, команду управления и ключи ее настройки, а также имена архивного и исходного файлов;
  • с помощью встроенной оболочки и диалоговых панелей, появляющихся после запуска программы и позволяющих вести управление с использованием меню и функциональных клавиш, что создает для пользователя более комфортные условия работы;
  • с помощью контекстного меню Проводника в операционной системе Windows.

ТЕСТОВЫЕ ВОПРОСЫ К ТЕМЕ 8

  1. Программно обеспечивают согласованность работы периферийный устройств с процессором –это

C. операционная система

D. прикладная программа

E. система программирования

  1. Программы, которые позволяют обнаруживать файлы, зараженные одним из нескольких компьютерных вирусов, называют

A. программы -вирусы

B. завирусованные файлы

E. программы- архиваторы

  1. Назначение программ архивации файлов?

A. Создание архива текстовых файлов.

B. Создание архива использованных файлов

C. Сохранение информации об изменениях в файлах

D. Сокращение размера файлов при их сохранении на диске

E. Сравнение размеров и дат создания файлов

Как собирать согласия на рекламные рассылки и обработку персональных данных правильно

A. Auto CAD, Corel Draw.

C. Ads Test, Doctor Web, Kaspersky KAV.

E. MS Excel, MS Word, MS Access.

  1. Основные группы вируса:

A. Опасный, безопасный.

B. Студенческий, загружаемый.

C. Резидентный, нерезидентный.

D. Системный, файловый.

  1. Какая программа из ниже перечисленных является антивирусной:
  1. Что такое Архивирование:
    1. Для устранения неудобств и для увеличения скорости работы с файлами, записанными на диске по фрагментам.
    2. Сохранение копии файлов с первоначальным их сжатием.
    3. Процесс предварительного сжатия файлов с помощью программы архивации данных, для уменьшения занимаемого места на диске.
    4. Программа проверки диска.
    5. Программа для лечения вирусов на диске.
    1. Программы-доктора или фаги.

    A. распаковывают вирусы и размножают

    B. обнаруживают новые файлы

    C. архивируют зараженные программы

    D. лечат зараженные программы или диски, вычленяя из зараженных программ тело вируса

    E. уничтожают завирусованные программы

    1. Вирусы, которые активизируются при запуске на выполнение «зараженной программы» и проявляются сразу и не записываются в оперативную память называются:

    Источник: arhivinfo.ru

    Архивация данных

    В наш век, когда компьютеры являются неотъемлемой частью любой организации и на них обрабатываются огромные базы данных, особо актуально стоит проблема защиты данных. При хранении и обработке информации на компьютере возможна ее порча (или потеря) по самым разным причинам. Это может произойти из-за физической порчи магнитного диска, неправильной корректировки или случайного уничтожения файлов, разрушения информации компьютерным вирусом и т.д. Для уменьшения потерь в таких ситуациях следует иметь копии используемых файлов и систематически их обновлять.

    Для их создания можно просто скопировать файлы, но при этом понадобится большое количество дополнительных носителей информации (например, для копирования файлов с жесткого диска размером 140 МБ необходимо 100 дискет стандартного формата 3,5″, каждая из которых имеет емкость 1,4 МБ). В таком огромном количестве дискет даже разобраться довольно сложно, поэтому весьма значительной будет трудоемкость создания и обновления архива. Конечно, можно использовать носители больших объемов (например, компакт-диски объемом 650 или 700 МБ). Однако зачастую и этого уже недостаточно, так как объем используемой информации давно превысил эти пределы.

    В связи с этими причинами для создания копий ценной информации употребляются специализированные программы, которые можно разделить на два класса:

    программы резервного копирования, соединяющие несколько файлов (и каталогов) в единый файл (примером использования такой технологии может служить формат tar); программы-упаковщики (архиваторы), сокращающие объем исходных файлов в результате их компрессии (сжатия).

    Сжатие информации в архивных файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов в виде коэффициента повторения соответствующих символов. Алгоритмы подобного сжатия информации реализованы в специальных программах — архиваторах.

    Архиватор — это специальная программа, позволяющая работать с архивными файлами, т.е. запаковывать (сжимать) исходные файлы в архив и распаковывать (восстанавливать) их из архивов.

    В отличие от программ резервного копирования архиваторы позволяют сжимать информацию в памяти компьютера с помощью специальных математических методов. При этом создается копия файла меньшего размера, что дает возможность разместить на диске больше информации. Кроме того, в одном архиве может храниться сразу несколько различных объектов (файлов или папок).

    Архивный файл (архив) — это специальный файл, в котором по определенным алгоритмам сжатия упакован один или несколько различных объектов (папки, текстовые или табличные документы, рисунки, фотографии, программы или другие файлы) с целью более рационального размещения на диске (или для передачи другим пользователям, в том числе по каналам связи).

    Архивный файл занимает в несколько раз меньше места (иногда в 10—100 раз!), поэтому может быть свободно размещен на носителе небольшого объема (например, дискете) или быстрее отправлен по электронной почте. Именно по этой причине архивы широко используются для передачи информации в сети Интернет, так как благодаря сжатию информации повышается скорость ее передачи.

    Как и любой другой файл, в файловой системе компьютера каждый архив имеет строго заданный тип (расширение). Наиболее часто встречаются следующие архивные файлы:. zip, . гаг, . cab, . ar j и др. Для каждого из них существуют свои архиваторы (zip, Rar, Ar j и др.), однако есть и универсальные программы, работающие со многими типами архивов (например, WinRar).

    Читайте также:
    Как изменить программу по умолчанию

    Подавляющее большинство современных форматов записи данных содержат их в виде, удобном для быстрого манипулирования и удобного прочтения пользователями. При этом данные занимают больший объем, чем действительно требуется для их хранения. По этой причине появились алгоритмы сжатия данных (алгоритмы архивации), которые устраняют избыточность данных. Все алгоритмы архивации делятся на две группы:

    алгоритмы сжатия без потерь, при использовании которых можно восстановить данные без малейших изменений; алгоритмы сжатия с потерями, которые удаляют из потока данных информацию, незначительно влияющую на суть данных или вообще невоспринимаемую человеком (такие алгоритмы сейчас разработаны только для звуковых и видеоданных).

    Естественно, преимущество отдается первой группе алгоритмов, среди которых выделяются два основных метода архивации без потерь.

    Алгоритм Хаффмана (Huffman) ориентирован на сжатие не связанных между собой последовательностей байт. Он основан на том, что некоторые символы из стандартного (256-символьного) набора кодовой таблицы ASCII могут встречаться в произвольном тексте чаще среднего периода повтора, а другие, наоборот, реже.

    Следовательно, если для записи распространенных символов использовать короткие последовательности бит (длиной меньше 1 байта), а для записи редких символов — более длинные, то суммарный объем файла уменьшится. Например, в русском тексте очень часто встречаются буквы «а», «е», «и», «о» (объем каждой буквы равен 8 бит), поэтому их можно заменить цифрами 0, 1, 2, 3, для кодирования которых достаточно 2 бит (00, 01, 10, 11). Следовательно, коэффициент сжатия будет равен 25% (или сжатие в 4 раза). Конечно, общий коэффициент сжатия будет больше, так как необходимо кодировать и другие символы, на которые потратится более 2 бит.

    Алгоритм Лемпеля-Зива (Lempel-Ziv) ориентирован на сжатие связанных между собой и повторяющихся последовательностей байт (любые виды текстов и графических изображений). Классический алгоритм LZ77 формулируется следующим образом: «Если в прошедшем ранее выходном потоке уже встречалась подобная последовательность байт, причем запись о ее длине и смещении от текущей позиции короче, чем сама эта последовательность, то в выходной файл записывается ссылка на нее (смещение, длина), а не сама последовательность». Например, фраза из 24 символов «КОЛО КОЛ О КОЛО_

    КОЛОКОЛЬНИ» закодируется в последовательность из 13 символов: «КОЛО(—4,3)_(—5,4)0_(—14,7)ЬНИ». Следовательно, коэффициент сжатия будет около 54% (или сжатие в 1,85 раза). Аналогично сжимаются изображения — большие области одного цвета заменяются ссылкой (цвет, длина). Поэтому графические файлы очень хорошо сжимаются (в десятки — сотни раз)!

    Выбор метода архивации зависит от разработчика той или иной программы. В настоящее время существует огромное множество программ для сжатия данных, при этом некоторые популярные архиваторы используют объединение этих двух методов — алгоритм LZH.

    При выборе инструмента для работы с упакованными файлами (архивами) следует учитывать два фактора:

    эффективность — оптимальный баланс между экономией дисковой памяти и производительностью работы; совместимость — возможность обмена данными с другими пользователями.

    Существует два показателя, характеризующих эффективность работы любого архиватора:

    коэффициент сжатия, отражающий отношение размера архивного (сжатого) файла к исходному:

    коэффициент уменьшения (иногда его удобнее использовать), показывающий, во сколько раз архивный файл меньше исходного:

    Кроме используемой программы (со своим методом сжатия) степень сжатия также зависит и от типа исходного файла. Наиболее хорошо сжимаются графические и текстовые файлы (Ксж может достигать 5—40%), меньше сжимаются файлы исполняемых программ (Ксж порядка 60—90%), а архивные файлы практически не сжимаются. Это объясняется тем, что множество программ-архиваторов используют для сжатия варианты алгоритма LZ77, суть которого заключается в особом кодировании повторяющихся последовательностей байт (символов). Частота встречаемости таких повторов наиболее высока в текстах и точечной графике, но практически сведена к нулю в архивах.

    Сегодня фактор совместимости более важен, так как по достигаемой степени сжатия конкурирующие архивные форматы различаются лишь на проценты (а не в разы), а вычислительная мощность современных компьютеров делает время обработки архивов не столь существенным показателем, как раньше. Поэтому при выборе инструмента для работы с архивами важнейшим критерием для большинства пользователей (во всяком случае, тех, для кого обмен большими массивами данных представляет насущную проблему) является способность программы «понимать» наиболее распространенные архивные форматы, даже если эти форматы не самые эффективные. На самом деле, сейчас наиболее распространены (по крайней мере, в России) два формата: . zip (чаще используется) и . гаг (сильнее упаковывает файлы).

    В настоящее время существует несколько десятков архиваторов, которые отличаются перечнем функций и параметрами работы, однако лучшие из них имеют примерно одинаковые характеристики (например WinRar и WinZip, которые работают в среде Windows, имеют удобный интерфейс и множество сервисных функций). Из числа наиболее популярных можно выделить зарубежные программы Ar j и Zip, а также российские разработки Ain и Rar. В состав операционных систем DOS и Windows входит утилита Expand, применяемая для распаковки файлов программных продуктов корпорации Microsoft.

    Обычно упаковка и распаковка файлов выполняются одной и той же программой, но в некоторых случаях это осуществляется разными программами (например, утилита Pkzip производит упаковку файлов, a PkUnzip — их распаковку). Многие архиваторы производят распаковку файлов, выгружая их на диск, но имеются и такие, которые предназначены для создания упакованного исполняемого модуля (программы). В результате такой упаковки создается программный файл с тем же именем и расширением, который при загрузке в оперативную память самораспаковывается и сразу запускается (к числу таких архиваторов относятся программы PkLite, LzExe, Unp).

    Также архиваторы различаются улучшенными реализациями алгоритмов сжатия, что, соответственно, влияет на повышение степени сжатия исходных объектов. Так, некоторые архиваторы (например, Rar) дополнительно включают средство создания непрерывных архивов (solid archive), при использовании которого (только в своем формате . гаг) может быть достигнута более высокая степень сжатия (плотнее на 10—50%), чем дают обычные методы (особенно если упаковывается значительное количество небольших файлов однотипного содержания). Создается особая структура организации архива с повышенной степенью сжатия — в таких архивах все файлы сжимаются как один поток данных (областью поиска повторяющихся последовательностей символов является вся совокупность файлов, загруженных в архив).

    Читайте также:
    Программа для обновления системы компьютера

    Непрерывные архивы предпочтительнее использовать в трех случаях:

    • предполагается редко обновлять архив;

    • • планируется чаще распаковывать весь архив, нежели извлекать из него один или несколько файлов;
    • • нужно достичь более плотной степени сжатия, даже в ущерб скорости упаковки.

    Однако у непрерывной архивации есть три недостатка:

    • • обновление непрерывных архивов (добавление файлов в уже существующий архив или их удаление из него) происходит медленнее, чем обновление обычных архивов;
    • • извлечение отдельных файлов из середины или конца непрерывного архива происходит медленнее, чем извлечение из обычного архива (приходится анализировать все предыдущие заархивированные файлы). При этом скорость распаковки всех или нескольких первых файлов практически равна скорости распаковки обычного архива;
    • • при повреждении какого-либо файла в непрерывном архиве не удастся извлечь и все последующие файлы. Поэтому такие архивы необходимо сохранять только на надежных носителях (или добавлять специальную информацию для восстановления).

    Некоторые архиваторы (например, Rar) поддерживают (только в своем формате . гаг) специальный тип информации для восстановления, наличие которой позволяет восстановить данные из архива даже в случае его физического повреждения (например, из-за сбоя диска или вследствие любых других причин). Эта информация может содержать до 524 288 (2 19 ) секторов для восстановления (до 256 МБ данных). Если поврежденные данные составляют непрерывный участок, то каждый сектор восстановления может восстановить 512 байт поврежденной информации. В случае многократного повреждения это значение может снизиться.

    Некоторые архиваторы (например, Rar) позволяют создавать (только в своем формате . гаг) многотомные архивы, состоящие из нескольких взаимосвязанных частей (томов). Обычно тома используются для сохранения большого архива на нескольких дискетах или других сменных носителях. Для распаковки такого архива необходимо сначала переписать все тома в одну папку (если они находятся на несменном носителе, например жестком диске) и начать извлечение файлов с первого тома.

    Некоторые архиваторы (например, Rar) позволяют создавать само- распаковывающиеся (SelF-eXtracting — SFX) архивы, к которым присоединен исполняемый модуль распаковки, позволяющий извлекать файлы простым запуском архива как обычной программы (без использования самого архиватора). Архивы такого типа обычно создаются в формате программных файлов (.ехе). Вместе с тем можно работать с SFX-архивом точно так же, как и с любым другим, поэтому если вы не хотите запускать SFX-архив, то для просмотра или извлечения его содержимого можно использовать программу-архиватор (например,

    Потребность в архивации связана с необходимостью резервного копирования данных на диски с целью сохранения ценной информации и программного обеспечения компьютера для зашиты от повреждения и уничтожения (умышленного или случайного, под действием компьютерного вируса). Однако архивация не является панацеей от всех бед. Так, архивация зараженного вирусом файла не только не избавляет файл (и компьютер) от вируса, но и способствует его дальнейшему распространению. Бывают случаи, когда при успешном удалении вируса из системы она вновь заражается из-за использования зараженной архивной версии какой-либо программы.

    Источник: bstudy.net

    Архивация данных

    * Данная работа не является научным трудом, не является выпускной квалификационной работой и представляет собой результат обработки, структурирования и форматирования собранной информации, предназначенной для использования в качестве источника материала при самостоятельной подготовки учебных работ.

    Министерство образования РФ.

    Новгородский государственный университет имени Ярослава Мудрого.

    Кафедра математики и информатики.

    Лабораторная работа №6

    по дисциплине «Информатика»

    Винник Людмила Ивановна

    Целью работы является изучение основных видов программ-архиваторов, алгоритмов архивации данных, приобретение практических навыков их использования.

    2. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ

    2.1 Применение архиваторов

    Раньше в вычислительных машинах для хранения больших объемов информации в течение длительного времени использовались накопители на магнитных лентах, которые обладали колоссальной емкостью, а сжатие информации на диске было нерациональным решением, так как работа с ней в таком виде отнимала драгоценное машинное время. Необходимость в архиваторах возникла, когда появились персональные компьютеры, и для хранения в них информации использовались дискеты и жесткие диски первоначально небольшой емкости. Повышение скорости работы процессоров персональных компьютеров в середине 80-х годов позволило создать утилиты, сжимающие информацию в два раза.

    С развитием компьютера стали увеличиваться и объемы информации хранимой в нем, что в свою очередь привело к развитию технологий по хранению этой информации в сжатом виде, то есть в архивах. Для этого было придумано множество программ осуществляющих архивацию информации.

    Архиваторы в основном использовались для резервного копирования и переноса информации. При хранении копий файлов в сжатом виде они занимают меньше места, к тому же удобнее оперировать с одним или несколькими файлами, чем с большим количеством файлов и директорий. Не потеряли архиваторы актуальности и теперь, однако требования, предъявляемые пользователям к этой категории программных продуктов, существенно изменились. Если раньше едва ли не самым важным было требование по максимальному сжатию информации, хотя бы в силу дороговизны на тот момент носителей информации — в первую очередь распространялись архиваторы, удовлетворяющие именно этому требованию, то теперь ситуация значительно изменилась и на первое место встают простота и удобство в использовании.

    Еще одним немаловажным требованием, предъявляемым к архиваторам при переносе информации, была его распространенность, т. е. чтобы при передаче информации не приходилось в придачу передавать и сам архиватор

    2.2 Понятие процесса архивации файлов

    Одним из наиболее широко распространенных видов сервисных программ являются программы, предназначенные для архивации, упаковки файлов путем сжатия хранимой в них информации.

    Сжатие информации — это процесс преобразования информации, хранящейся в файле, к виду, при котором уменьшается избыточность в ее представлении и соответственно требуется меньший объем памяти для хранения.

    Сжатие информации в файлах производится за счет устранения избыточности различными способами, например за счет упрощения кодов, исключения из них постоянных битов или представления повторяющихся символов или повторяющейся последовательности символов в виде коэффициента повторения и соответствующих символов. Применяются различные алгоритмы подобного сжатия информации.

    Сжиматься могут как один, так и несколько файлов, которые в сжатом виде помещаются в так называемый архивный файл или архив.

    Архивный файл — это специальным образом организованный файл, содержащий в себе один или несколько файлов в сжатом или несжатом виде и служебную информацию об именах файлов, дате и времени их создания или модификации, размерах и т.п.

    Целью упаковки файлов обычно являются обеспечение более компактного размещения информации на диске, сокращение времени и соответственно стоимости передачи информации по каналам связи в компьютерных сетях. Кроме того, упаковка в один архивный файл группы файлов существенно упрощает их перенос с одного компьютера на другой, сокращает время копирования файлов на диски, позволяет защитить информацию от несанкционированного доступа, способствует защите от заражения компьютерными вирусами.

    Читайте также:
    Как установить программу на посудомоечной машине электролюкс

    Степень сжатия зависит от используемой программы, метода сжатия и типа исходного файла. Наиболее хорошо сжимаются файлы графических образов, текстовые файлы и файлы данных, для которых степень сжатия может достигать 5 — 40%, меньше сжимаются файлы исполняемых программ и загрузочных модулей — 60 — 90%. Почти не сжимаются архивные файлы. Программы для архивации отличаются используемыми методами сжатия, что соответственно влияет на степень сжатия.

    Архивация (упаковка) — помещение (загрузка) исходных файлов в архивный файл в сжатом или несжатом виде. Разархивация (распаковка) — процесс восстановления файлов из архива точно в таком виде, какой они имели до загрузки в архив. При распаковке файлы извлекаются из архива и помещаются на диск или в оперативную память;

    Архиваторы — это программы, позволяющие создавать и обрабатывать архивные копии файлов. При этом архивные копии имеют меньший размер, чем оригиналы. С помощью специальных алгоритмов сжатия из файлов удаляется вся избыточная информация, а при применении обратных алгоритмов распаковки архивная копия восстанавливается в первоначальном виде.

    Программы-архиваторы позволяют создавать и такие архивы, для извлечения из которых содержащихся в них файлов не требуются какие-либо программы, так как сами архивные файлы могут содержать программу распаковки. Такие архивные файлы называются самораспаковывающимися.

    Самораспаковывающийся архивный файл — это загрузочный, исполняемый модуль, который способен к самостоятельной разархивации находящихся в нем файлов без использования программы-архиватора.

    Самораспаковывающийся архив получил название SFX-архив (SelF-eXtracting). Архивы такого типа в MS DOS обычно создаются в форме .ЕХЕ-файла.

    Большие по объему архивные файлы могут быть размещены на нескольких дисках (томах). Такие архивы называются многотомными. Том — это составная часть многотомного архива. Создавая архив из нескольких частей, можно записать его части на несколько дискет.

    Сжатие информации — проблема, имеющая достаточно давнюю историю, гораздо более давнюю, нежели история развития вычислительной техники, которая (история) обычно шла параллельно с историей развития проблемы кодирования и шифровки информации.

    Все алгоритмы сжатия оперируют входным потоком информации, минимальной единицей которой является бит, а максимальной — несколько бит, байт или несколько байт.

    Целью процесса сжатия, как правило, есть получение более компактного выходного потока информационных единиц из некоторого изначально некомпактного входного потока при помощи некоторого их преобразования.

    Основными техническими характеристиками процессов сжатия и результатов их работы являются:

    * степень сжатия (compress rating) или отношение (ratio) объемов исходного и результирующего потоков;

    * скорость сжатия — время, затрачиваемое на сжатие некоторого объема информации входного потока, до получения из него эквивалентного выходного потока;

    * качество сжатия — величина, показывающая на сколько сильно упакован выходной поток, при помощи применения к нему повторного сжатия по этому же или иному алгоритму.

    2.3. Алгоритмы архивации данных

    Все способы сжатия можно разделить на две категории: обратимое (сжатие без потерь) и необратимое сжатие.

    Под необратимым сжатием подразумевают такое преобразование входного потока данных, при котором выходной поток, основанный на определенном формате информации, представляет, с некоторой точки зрения, достаточно похожий по внешним характеристикам, на входной поток объект, однако отличается от него объемом.

    Такие подходы и алгоритмы используются для сжатия, например данных растровых графических файлов с низкой степенью повторяемости байтов в потоке. При таком подходе используется свойство структуры формата графического файла и возможность представить графическую картинку приблизительно схожую по качеству отображения (для восприятия человеческим глазом) несколькими (а точнее n) способами.

    Поэтому, кроме степени или величины сжатия, в таких алгоритмах возникает понятие качества, т.к. исходное изображение в процессе сжатия изменяется, то под качеством можно понимать степень соответствия исходного и результирующего изображения, оцениваемая субъективно, исходя из формата информации. Для графических файлов такое соответствие определяется визуально, хотя имеются и соответствующие интеллектуальные алгоритмы и программы. Необратимое сжатие невозможно применять в областях, в которых необходимо иметь точное соответствие информационной структуры входного и выходного потоков. Данный подход реализован в популярных форматах представления видео и фото информации, известных как JPEG и JFIF алгоритмы и JPG и JIF форматы файлов.

    Обратимое сжатие всегда приводит к снижению объема выходного потока информации без изменения его информативности, т.е. — без потери информационной структуры.

    Более того, из выходного потока, при помощи восстанавливающего или декомпрессирующего алгоритма, можно получить входной, а процесс восстановления называется декомпрессией или распаковкой и только после процесса распаковки данные пригодны для обработки в соответствии с их внутренним форматом.

    Перейдем теперь непосредственно к алгоритмическим особенностям обратимых алгоритмов и рассмотрим важнейшие теоретические подходы к сжатию данных, связанные с реализацией кодирующих систем и способы сжатия информации.

    2.3. 1 Алгоритмы сжатия без потерь

    2.3.1.1. Сжатие способом кодирования серий (RLE)

    Наиболее известный простой подход и алгоритм сжатия информации обратимым путем — это кодирование серий последовательностей (Run Length Encoding — RLE).

    Суть методов данного подхода состоит в замене цепочек или серий повторяющихся байтов или их последовательностей на один кодирующий байт и счетчик числа их повторений.

    44 44 44 11 11 11 11 11 01 33 FF 22 22 — исходная последовательность

    03 44 05 11 01 01 01 33 01 FF 02 22 — сжатая последовательность

    Первый байт указывает сколько раз нужно повторить следующий байт

    Если первый байт равен 00, то затем идет счетчик, показывающий сколько за ним следует неповторяющихся данных.

    Данные методы, как правило, достаточно эффективны для сжатия растровых графических изображений (BMP, PCX, TIF, GIF), т.к. последние содержат достаточно много длинных серий повторяющихся последовательностей байтов.

    Недостатком метода RLE является достаточно низкая степень сжатия.

    2.3.1.2 Алгоритм Хаффмана

    Сжимая файл по алгоритму Хаффмана первое что мы должны сделать — это необходимо прочитать файл полностью и подсчитать сколько раз встречается каждый символ из расширенного набора ASCII.

    Если мы будем учитывать все 256 символов, то для нас не будет разницы в сжатии текстового и EXE файла.

    После подсчета частоты вхождения каждого символа, необходимо просмотреть таблицу кодов ASCII и сформировать бинарное дерево.

    Рейтинг
    ( Пока оценок нет )
    Загрузка ...
    EFT-Soft.ru