Каталог расширений

Популярные теги

3gp       avi       fb2       jpg       mp3       pdf      

Как называется сжатый файл


Как называется сжатый файл

Автор Евгения Гибадуллина задал вопрос в разделе ВУЗы, Колледжи

что представляет собой сжатый файл? и получил лучший ответ

Ответ от Андрей Чудновец[мастер]
Архив — файл, содержащий в себе информацию из одного или нескольких сжатых, других файлов. Является результатом работы программы-архиватора.
Сжатие данных (англ. data compression) — алгоритмическое преобразование данных, производимое с целью уменьшения их объёма. Применяется для более рационального использования устройств хранения и передачи данных. Синонимы — упаковка данных, компрессия, сжимающее кодирование, кодирование источника. Обратная процедура называется восстановлением данных (распаковкой, декомпрессией) .
Сжатие основано на устранении избыточности, содержащейся в исходных данных. Простейшим примером избыточности является повторение в тексте фрагментов (например, слов естественного или машинного языка) . Подобная избыточность обычно устраняется заменой повторяющейся последовательности ссылкой на уже закодированный фрагмент с указанием его длины. Другой вид избыточности связан с тем, что некоторые значения в сжимаемых данных встречаются чаще других.
Источник:

Урок 4: Архивация и сжатие файлов

Что такое архивация и сжатие файлов

Сколько существуют компьютеры, столько их обладателям не хватает памяти на внутренних и съёмных дисках для размещения своих данных. Стремительный рост объёмов дисков не решает эту проблему. Если 10 лет назад нам не хватало 20 мегабайт на винчестере, то сегодня точно так же не хватает 20 гигабайт.

Размеры используемых нами программ и данных растут вместе с ростом объёмов винчестеров. Мы уже можем себе позволить хранить на винчестере библиотеку из нескольких десятков тысяч книг. Но музыкальных произведений можем хранить на винчестере пока несколько сот часов звучания, а видеофильмов – всего несколько десятков часов просмотра. Поэтому проблема архивирования или сжатия данных остаётся так же актуальна, как и 10, и 20 лет назад.

Как же происходит сжатие информации?

Приведём, как обычно, грубую, но понятную аналогию. Сжатие данных похоже на производство сухого молока или сухофруктов. То есть, это – процесс удаления воды, которую затем можно добавить, чтобы предать продукту первоначальный вид.

А какая в данных может быть вода? Это вода информационная. В данных встречается много повторов. Это можно использовать для сжатия данных.

Например, сжатие текстовых файлов происходит приблизительно так. Составляется таблица встречающихся в тексте слов и выражений. Затем всем словам и выражениям в этой таблице даются номера. И весь текст в файле заменяется номерами из таблицы слов и выражений. Такой способ позволяет уменьшить размер текстового файла в 2-3 раза. Иногда текст сжимается и в 10 раз, если в нём много повторов.

Программа, переводящая текстовый файл в "сжатый" вид, называется упаковщиком. А полученный в результате сжатия файл называется упакованным или сжжатым файлом.

Очень часто сжатые файлы называют архивами или архивными файлами, что, если подходить строго к терминологии, неверно. Изначально архивами назывались файлы, специально созданные во время процессов резервного копирования. В ходе такого процесса создавался один файл, который содержал в себе несколько исходных файлов и папок. Это и был архив. Никакого сжатия при этом не производилось. Подобная ситуация до сих пор существует в операционной системе Linux, где архивация данных и сжатие данных являются двумя независимыми процессами. В операционной системе MS-DOS, а затем и в MS Windows программы сжатия данных с самых первых своих версий стали поддерживать как сжатие, так и архивацию данных, то есть создавали сжатый файл, содержащий не один, а несколько исходных (архивируемых) файлов и папок. С той поры в этих операционных системах понятие "архивация" означает и архивацию (сбор в один файл-архив) , и одновременное сжатие данных.

Поскольку архивный файл записан не в текстовом формате, с ним не могут работать редакторы текстов. Перед открытием архивного файла редактором текстов этот файл необходимо разархивировать. Разархивацию производит та же самая программа – архиватор. После разархивации текстовый файл приобретает точно такой же вид и размер, как и до архивации.

Архиваторы текстов могут архивировать также файлы программ. Только программы гораздо меньше сжимаются, чем текст.

Упаковщики, применяемые для сжатия текстов и программ, не могут эффективно сжимать звуковые, графические или видео файлы. Для их сжатия были разработаны другие, более сложные, алгоритмы. Правда, после распаковки полученные файлы немного отличаются от оригиналов (такое сжатие называется сжатием с потерями). Но этого не улавливает обычное человеческое ухо и не замечает обычный глаз на экране монитора.

Краткая история архиваторов

Насколько я помню, первым популярным архиватором данных был архиватор под названием «ARJ». Он создавал архивные файлы с аналогичным расширением «ARJ». Это было ещё в конце 80-х – начале 90-х годов прошлого века. Такие файлы до сих пор ещё встречаются. Обычно они набраны в ДОСовской кодировке.

Затем появились два самых популярных на сегодняшний день на территории СНГ архиватора: «RAR» и «ZIP». Сейчас они представлены программами «WinRAR» и «WinZIP». Причём, программа «WinRAR» умеет создавать как «RAR», так и «ZIP» архивы. А разархивировать «WinRAR» умеет архивы полутора десятков форматов. В этом смысле «WinRAR» является для нас универсальным и удобным архиватором (но не бесплатным).

А как же другие, не текстовые данные?

Рассмотрим графические файлы. Незаархивированная графика – это рисунок, состоящий из множества разноцветных точек. В таком формате для каждой точки рисунка или фотографии задаётся цвет. Графический файл такого рисунка имеет расширение «BMP». Но такие файлы обладают довольно солидным размером. Даже небольшая фотография в формате «BMP» будет иметь размер в несколько мегабайт. То есть, она не поместится на дискету, и по сети Интернет передать её будет нелегко.

Для уменьшения размера графического файла его сжимают специальными математическими методами. Таким образом графический файл можно уменьшить в размере в 20-30 раз. Сжатый графический файл нельзя полностью восстановить. При распечатывании на хорошем принтере будет заметно ухудшение качества рисунка. Но на экране монитора этого видно не будет.

Наиболее распространённые форматы сжатия изображения – это «GIF» и «JPEG» (или «JPG»). Создать такие форматы графических файлов может, например, графический редактор «ФотоШоп» или уже знакомый нам «ФайнРидер». Чем глубже сжатие рисунка, тем больше теряет он в качестве.

Гораздо позже появились эффективные методы сжатия звука. Если Вы зайдёте на обычный музыкальный компакт-диск, то обнаружите там файлы с расширением «CDA». В таких файлах содержится несжатый цифровой звук. Такие файлы имеют очень большой размер. На компакт-диск помещается 80 минут музыки в незаархивированном виде. Сжатие звуковых файлов потребовало специальных исследований человеческого слуха. Оказалось, что часть звуков можно убрать из звукового файла, и это будет незаметно для слуха человека.

Самый распространённый формат сжатого звука – это «MPEG3» (или «MP3»). Его создают специализированные редакторы звука и программмы-перекодировщики из других звуковых форматов. Проигрывание на компьютере сжатых звуковых файлов в формате «MP3» требует мощности процессора не менее 100 мегагерц. Можно сжимать звуковой файл в десятки раз. Но при большом сжатии начинает безвозвратно теряться качество звука.

Видеофильм объединяет в себе звук и графику. Помимо звука – это ещё 24 кадра на каждую секунду. Отсюда понятны огромные размеры файлов с видеофильмами и необходимость их сжатия.

При появлении компакт-дисков художественный фильм не помещался на один диск. Эту задачу решил сжатый формат «MPEG4». Показ сжатого видео ещё больше повышает требования к мощности процессора. Для проигрывания MPEG4 уже недостаточно 200 мегагерц.

Надеюсь, Вас не будет пугать в дальнейшем большое количество форматов для текстовых, графических, звуковых и видео файлов. Обычно это сжатые или заархивированные данные. Для их просмотра нужно воспользоваться программой, знающей алгоритм разархивации файлов данного типа. Операционная система Windows XP содержит в себе программы для просмотра данных, записанных в различных форматах.

Упаковщик WinRAR

WinRAR применяется для упаковки текстов и программ. Причём, архив WinRAR может содержать как файлы, так и папки. WinRAR позволяет добавлять файлы и папки в архив и извлекать их оттуда.

Если на Вашем компьютере установлен упаковщик WinRAR и Вы откроете нажатием Enter архивный файл, то для обработки архива запустится программа WinRAR и раскроется её окно.

Курсор при этом попадёт в большое окно типа Просмотр списка , в котором будет отражено содержимое архива. Вы увидите все файлы и папки, упакованные в архиве. Перемещаться по архиву можно по правилам работы с Моим компьютером . Более того, мы можем выйти из текущего архива в родительскую папку и войти в любой другой архив, имеющийся на компьютере.

WinRAR имеет меню, в котором содержатся команды для работы с архивами.

Но мы подробнее остановимся на более простом способе работы с упаковщиком WinRAR .

Работа с упаковщиком WinRAR через контекстное меню

Когда мы устанавливаем на компьютере WinRAR , в контекстное меню внедряются некоторые команды этой программы. Это как раз и есть самые необходимые нам для обычной работы команды по созданию и распаковке архива.

Распаковка файлов

Допустим, курсор выделяет архив под названием Литература.rar , и мы вызываем контекстное меню нажатием комбинации Shift+F10 . Мы найдём в контекстном меню 3 команды:

  1. Извлечь файлы ,
  2. Извлечь в текущую папку ,
  3. Извлечь в Литература .

По команде Извлечь в текущую папку содержимое архива будет извлечено в ту же папку, где находится сам архивный файл. Этого нельзя будет сделать, если мы открыли архив на компакт-диске. Такой архив сначала нужно скопировать на винчестер.

По команде Извлечь в Литература в той же папке, где находится архив Литература.rar , будет создана папка с именем Литература . И уже во внутрь папки Литература будет извлечено содержимое архива Литература.rar . Так удобно распаковывать архив, содержащий много папок и файлов, чтобы они не перемешивались с содержимым текущей папки.

По команде Извлечь файлы будет открыт диалог Путь и параметры извлечения . В этом диалоге можно создать или выбрать папку для извлечения содержимого архива, а также установить различные дополнительные параметры процесса извлечения файлов из архива.

В любом случае, после извлечения файлов сам архив остаётся в неизменном виде.

Если у Вас установлена англоязычная версия программы WinRAR , то все команды и диалоговые окна будут представлены на английском языке.

Упаковка файлов и папок в общий архив

Если Вы хотите упаковать несколько файлов и папок в один общий архив, то предварительно их нужно выделить. Затем нужно вызвать контекстное меню комбинацией Shift+F10 . Среди пунктов контекстного меню Вы найдёте две интересные нам команды архивации.

Вторая из команд автоматически создаст rar-архив и занесёт в него выделенные Вами файлы и папки. Если был выделен один файл или одна папка, то rar-архив получит имя этого файла или этой папки. Если было выделено несколько файлов и папок, то rar-архив получит имя текущей папки, в которой расположены все выделенные только что Вами объекты.

Первая же из команд в контекстном меню называется Добавить в архив . Она вызывает многостраничный диалог под названием Имя и параметры архива . Рассмотрим его чуть подробнее.

Всё самое главное находится в этом диалоге на вкладке Общие , куда мы сразу и попадём.

При открытии диалога курсор находится в строке редактирования с памятью под названием Имя архива . Понятно, что здесь мы можем сменить имя создаваемого архива.

Следующей в порядке табуляции расположена кнопка Обзор . Нажав эту кнопку, мы сможем выбрать другую папку для создания архива, отличную от текущей папки.

Дальше мы попадём на группу радиокнопок под названием Формат архива . Здесь есть два варианта: rar-архив и zip-архив.

Дальше идёт комбинированный список, позволяющий выбрать метод сжатия. Более глубокое сжатие немного уменьшит размер архивного файла, но сильно увеличит время архивации.

Следующим расположен очень интересный список под названием Разделить на тома размером (в байтах) . Мы можем задать размер тома вручную или выбрать его из заготовленного списка. Здесь отражается очень важное свойство программы WinRAR . Она умеет разбивать архивный файл на несколько архивных файлов одинакового размера. Это позволяет разбить архив на куски, которые умещаются на дискете. Тогда Вы сможете унести в коробке дискет большой архивный файл. Честно говоря, с появлением Сидирайтеров и блоков флэш-памяти это свойство rar-архивов понемногу начинает утрачивать своё значение.

Из остальных флажков выделим только один. Он называется Создать SFX-архив . Вот это действительно важный флажок. Если его установить, WinRAR создаст самораспаковывающийся архив. Это значит, что вместо файла с расширением .RAR будет создан файл с расширением .EXE . А фактически в rar-архив встраивается программа по его распаковке. Запуск самораспаковывающегося архива на выполнение приводит к его распаковке. Это позволяет нам без труда распаковывать архив на компьютере, на котором не установлен соответствующий архиватор. По принципу самораспаковывающихся архивов устроены инсталляционные пакеты большинства приложений.

Если мы выберем создание самораспаковывающегося SFX-архива, то на вкладке Дополнительно активизируется кнопка Параметры SFX . Эта кнопка вызывает диалог, в котором можно задать путь для распаковки архива и установить, какие программы должны выполниться до и после распаковки архива. Практически – это возможность создать полноценный инсталляционный пакет. Представьте себе. Запущенный с компакт-диска самораспаковывающийся архив распаковывается на диск C: . После этого из вновь созданной папки запускается на выполнение программа, которая выполняет установку и настройку нашего пакета программ.

Пожалуй, это – всё, что нужно знать, чтобы начать уверенно и быстро работать с архивными данными.

Обзор урока

Программы-упаковщики или архиваторы позволяют упаковывать текстовые файлы и программы, высвобождая нам дополнительную память на встроенных и внешних дисках. Благодаря этому объём дисков как бы увеличивается.

Разные типы данных сжимаются разными программами по разным алгоритмам.

Универсальная программа для сжатия текстовых файлов и файлов программ – это WinRar . WinRAR умеет создавать самораспаковывающиеся и многотомные rar-архивы, а также обычные zip-архивы. Можно задавать путь для распаковки самораспаковывающегося архива.

Кроме того, WinRAR умеет распаковывать архивы многих других архиваторов.

Для работы с WinRAR не обязательно вызывать эту программу явно. После выделения группы файлов и папок можно воспользоваться контекстным меню. Здесь будут присутствовать все основные команды по архивации и разархивации данных.

Самый популярный формат сжатых графических изображений – это .GPEG . Для звука – это формат .MP3 , а для видео – MP4 .

Проигрывание на компьютере сжатых звуковых файлов и просмотр видеофайлов требует больших вычислительных ресурсов.

Задания к уроку

Установите на своём компьютере упаковщик данных WinRAR .

Создайте в корне диска D: или в каком-нибудь другом месте временную папку. Назовите её Литература . Скопируйте в эту папку несколько файлов и папок по Вашему усмотрению.

Выделите курсором папку Литература . Вызовите контекстное меню. Создайте архив Литература.rar , воспользовавшись командой Добавить в Литература.rar". Воспользовавшись диалогом свойств, сравните размеры папки Литература и архива Литература.rar .

Вызовите диалог создания архива для папки Литература , воспользовавшись командой Добавить в архив из контекстного меню. Исправьте имя архива с Литература на Библиотека . Измените формат архива с RAR на ZIP .. После создания архива Библиотека.zip сравните его размер и размер архива Литература.rar .

Вызовите диалог свойств папки Литература . Запомните размер этой папки. Для папки Литература воспользуйтесь командой Добавить в архив из контекстного меню. В диалоге создания архива задайте размер тома так, чтобы архив состоял из двух или трёх частей. Не забывайте, что размер тома задаётся в байтах, а не в килобайтах. Установите флажок создания самораспаковывающегося архива. Особо любознательные могут в Свойствах SFX архива установить в качестве пути для распаковки корень диска C: . Создайте многотомный самораспаковывающийся архив. Определите размер и название каждой из его частей. Сравните общий размер самораспаковывающегося архива и обычного rar-архива.

Создайте Новую папку и перенесите туда путём вырезания и вставки все созданные Вами архивы. Распакуйте архив Литература.rar командой Извлечь в Литература из контекстного меню. Распакуйте архив Библиотека.zip командой Извлечь в Библиотека из контекстного меню. Распакуйте самораспаковывающийся многотомный архив, запустив на выполнение файл Литература,part1.exe . Обследуйте Новую папку . Найдите три варианта восстановления папки Литература из трёх различных архивов.

Вызовите в явном виде программу WinRAR , открыв архив Литература.rar . Просмотрите содержимое архива при помощи курсорных клавиш. Оставаясь в окне программы WinRAR , выйдите за пределы архива Литература.rar при помощи клавиши BackSpace . Скопируйте в буфер обмена какой-нибудь файл или папку. Войдите вновь в архив Литература.rar , как входят в папку (Нажатием Enter ), и вставьте вовнутрь архива скопированный файл или папку. Проверьте, что архив пополнился новым содержимым. Таким же образом вставьте в архив Литература.rar файл из какого-нибудь другого архива. Удалите какой-нибудь файл из архива Литература.rar , воспользовавшись меню Файл программы WinRAR или клавишей Del .

Список горячих клавиш к уроку

Горячие клавиши Windows

Shift+F10 – вызвать контекстное меню

Alt+Enter – вызвать диалог свойств

Горячие клавиши JAWS

Insert+Серый минус – Перейти к JAWS-курсору и совместить его с системным курсором.

Серый плюс – вернуться к системному курсору

Горячие клавиши WinRAR

Control+C – скопировать объект в буфер обмена

Control+V – вставить объекты из буфера обмена в архив

Архив — файл, содержащий в себе информацию из одного или нескольких сжатых, других файлов. Является результатом работы программы-архиватора.

Сжатие данных (англ. data compression) — алгоритмическое преобразование данных, производимое с целью уменьшения их объёма. Применяется для более рационального использования устройств хранения и передачи данных. Синонимы — упаковка данных, компрессия, сжимающее кодирование, кодирование источника. Обратная процедура называется восстановлением данных (распаковкой, декомпрессией) .

Сжатие основано на устранении избыточности, содержащейся в исходных данных. Простейшим примером избыточности является повторение в тексте фрагментов (например, слов естественного или машинного языка) . Подобная избыточность обычно устраняется заменой повторяющейся последовательности ссылкой на уже закодированный фрагмент с указанием его длины. Другой вид избыточности связан с тем, что некоторые значения в сжимаемых данных встречаются чаще других.

Какой Сжатые файлы? Узнайте историю и Как открыть

Сжатые файлы

ЧТО ТАКОЕ Сжатый файл?

Сжатый файл представляет собой формат файла, который использует ряд различных методов сжатия и алгоритмов, чтобы потреблять меньше дискового пространства на компьютере. Есть несколько форматов сжатие архивных, которые позволяют один файл, чтобы действовать в качестве сжатого контейнера для группы файлов.

Есть два типа алгоритмов сжатия - без потерь сжатие и с потерями сжатие. В сжатии с потерями, некоторые данные теряются в процессе сжатия и не могут быть восстановлены, в то время как сжатие без потерь сохраняет все нетронутое и позволяет в полной мере восстановления данных. Однако, сжатие с потерями имеет преимущество создания файлов, которые значительно меньше по размеру, чем без потерь аналога.

КАК сжимаются файлы, используемые?

Сжатие полезно, когда речь идет о снижении размера файла исходных данных. Сжатые файлы обычно используется архивным созданием программного обеспечения (например, WinZip, 7Zip и т.д.) или программное обеспечение резервного копирования для сжатия нескольких файлов в меньший пакет (как правило, для обмена больших файлов через Интернет).




Какой популярный Compressed Files Extensions?

.ZIP

ZIP
Формат: -
Разработчик:
Тип сжатия: Lossless

Формат ZIP-файл используется для хранения одного или нескольких файлов (или даже папки) в сжатом, архивный формат. Одним из наиболее популярных сжатых форматов, он поддерживает несколько алгоритмов сжатия и может частично извлечь некоторые из файлов без сжатия / распаковки всех файлов в архиве.

.RAR

RAR
Формат: Двоичный
Разработчик: Eugene Roshal

Формат RAR файла может быть использован для хранения один или несколько файлов в сжатом формате, используя алгоритм сжатия RAR запатентованного в. Он поддерживает лучшее сжатие данных, чем формат ZIP.

.GZ

GZ
Формат: Двоичный
Разработчик: The GNU Project

GZ или GNU Zip архивный формат используется для хранения одного или нескольких файлов в сжатом формате. Файлы сначала помещаются в архив TAR, а затем сжимаются с помощью GZIP, программное обеспечение сжатия файлов. Файлы, сжатые в формате известны как тарболах.

.7Z

7Z
Формат: Двоичный
Разработчик: Igor Pavlov

Формат 7Z или 7Zip файл является открытым, сжатый формат архива файлов с поддержкой нескольких шифрования, предварительной обработки, а также алгоритмы сжатия данных. Эти алгоритмы включают в себя:

  • LZMA, LZMA2, BZIP2 и многое другое для сжатия данных
  • Предварительная обработка фильтры, такие как BCJ, BCJ2, и Delta кодирования
  • шифрования AES с 256-битным ключом

Каждая спецификация формата 7Z файл включает в себя исходный код 7-Zip.

.PKG

PKG
Формат: Двоичный
Разработчик: Apple

Формат файла Macos Installer Package (PKG) используется для хранения файлов программы установки в сжатом формате. Файл PKG может быть использован для установки программного обеспечения на MacOS от Apple (ранее известное как «Max OS X») операционная система.


Просмотрите расширения файлов в алфавитном порядке:   # A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Сжать файл онлайн и с помощью программ

02 июля, 2020

Автор: Maksim

Сжатые файлы очень удобны потому, что занимают совсем немного места и, благодаря этому, их можно без труда отправлять по интернету даже с невысокой скоростью соединения.

Есть несколько способов сжатия файлов и папок. Так, сделать это можно просто у себя на компьютере или с помощью специальных сервисов и интернете.

Прошлый материал был посвящен тому, что такое контент и, какое значение он имеет на интернет. Сегодня вы узнаете, как сжать файл и папку онлайн, в winrar и других популярных программах.

Интересно! Лучше всего сжимаются файлы, которые не были до этого сжаты другим способом. К примеру, картинки JPG являются уже сжатыми, поэтому прирост от их уменьшения будет незначительным. Лучше же всего это работает с текстовыми документами.

Как сжать файл на компьютере и ноутбуке

Рассмотрим самые лучшие программы для сжатия файлов на Windows 10 и ее более ранних версиях. Я уже подробно рассматривал их в статье про то, как заархивировать файл. Сжать директорию также можно с помощью этих программ, просто нужно заархивировать папку.

Важно! Создавайте архив в формате ZIP или самораспаковывающийся если хотите, чтобы ваш архив могли открыть абсолютно все пользователи, даже те, у которых нет установленного архиватора.

Windows 10 — встроенные средства

Если у вас стоит Виндовс 10, то сжать файл или папку будет легко в пару кликов без необходимости устанавливать дополнительно специальный софт.

1. Выделите, что необходимо и кликните по ним правой кнопкой мыши. В меню перейдите по «Отправить» — «Сжатая ZIP-папка».

2. Произойдет автоматическое сжатие и все будет добавлено в ZIP-контейнер. Параметры сжатия в операционной системе стоят довольно хорошие, но если вам необходимо прям максимально уменьшить размер, то можно воспользоваться одной из программ, описанных ниже.

WinRAR

Страница: WinRAR

1. После установки программы кликните по файлу или папке правой кнопкой мыши и выберите в меню пункт добавления в архив.

2. В окне можно выбрать параметры сжатия, формат архива и другие данные. Можно поставить максимальное сжатие или оставить все значения по умолчанию. Если хотите отправить созданный архив пользователю, у которого нет на компьютере ВинРАР, то делайте самораспаковывающийся архив или в формате ZIP. Нажмите на «ОК» и архив будет создан.

7-Zip

Страница: 7-Zip

1. Скачайте и установите программу. Перейдите в директорию, выделите мышкой, что необходимо и щелкните по ним правой кнопкой мыши. В появившемся меню кликните по пункту добавления данных к архиву.

2. Укажите необходимые параметры для сжатия по желанию или оставьте значения по умолчанию. Пункт SFX-архив означает самораспаковывающийся, такой контейнер будет открываться и распаковываться на любом компьютере даже без 7-zip. Нажмите на «ОК».

Интересно! О сжатии ПДФ документов, подробно написано в статье — как уменьшить размер файла pdf. Также с помощью них легко можно уменьшить размер музыки и других аудиофайлов, видео и изображений.

Сжать файл онлайн

Существуют и онлайн сервисы для сжатия данных и создания архивов. Они могут пригодится, когда встроенные в систему средства не работают или нужно обеспечить более качественное и вариативное сжатие.

Fconvert

Адрес: Fconvert

Простой и одновременно мощный онлайн сервис, с помощью которого можно легко сжать необходимые данные. Загрузите, что нужно на сайт, выберите формат и степень сжатия, после чего нажмите на конвертацию. Затем просто скачайте, то что получилось.

Archive Online

Адрес: Archive Online

Загрузите необходимые документы на сервис и нажмите на кнопку начала конвертации. Данные быстро обработаются и результат автоматически скачается на ваш компьютер или ноутбук. Если этого не произошло нажмите на соответствующую ссылку.

ezyZip

Адрес: ezyZip

Закачайте необходимые документы на сайт и нажмите на кнопку создания архива, чтобы началось его создание. Процесс не занимает обычно много времени. После того, как все будет готово, щелкните по ссылке скачивания, чтобы загрузить все себе на компьютер.

В заключение

Как видите есть масса способов, как это можно сделать быстро и качественно. Тема уменьшения веса/размера документов будет продолжена и в других материалах на данном портале, так что заходите еще и добавляйте в закладки.

Форматы сжатия данных - Время электроники

В статье рассматриваются основные методы сжатия данных, приводится классификация наиболее известных алгоритмов, и на простых примерах обсуждаются механизмы работы методов CS&Q, RLE-кодирования, Хаффмана, LZW, дельта-кодирования, JPEG и MPEG. Статья представляет собой авторизованный перевод [1].

Передача данных и их хранение стоят определенных денег. Чем с большим количеством информации приходится иметь дело, тем дороже обходится ее хранение и передача. Зачастую данные хранятся в наиболее простом виде, например в коде ASCII (American Standard Code for Information Interchange — американский стандартный код для обмена информацией) текстового редактора, в исполняемом на компьютере двоичном коде, в отдельных файлах, полученных от систем сбора данных и т.д. Как правило, при использовании этих простых методов кодирования объем файлов данных примерно в два раза превышает действительно необходимый размер для представления информации. Ее сжатие с помощью алгоритмов и программ позволяет решить эту задачу. Программа сжатия используется для преобразования данных из простого формата в оптимизированный по компактности. Наоборот, программа распаковки возвращает данные в исходный вид. Мы обсудим шесть методов сжатия данных в этом разделе. Первые три из них являются простыми методами кодирования: кодирование длин серий с передачей информации об их начале и длительности; кодирование Хаффмана и дельта-кодирование. Последние три метода являются сложными процедурами сжатия данных, которые стали промышленными стандартами: LZW, форматы JPEG и MPEG.

Методы сжатия данных

В таблице 1 показаны два разных способа распределения алгоритмов сжатия по категориям. К категории (а) относятся методы, определяемые как процедуры сжатия без потерь и с потерями. При использовании метода сжатия без потерь восстановленные данные идентичны исходным. Этот метод применяется для обработки многих типов данных, например для исполняемого кода, текстовых файлов, табличных данных и т.д. При этом не допускается потеря ни одного бита информации. В то же время файлы данных, представляющие изображения и другие полученные сигналы, нет необходимости хранить и передавать без потерь. Любой электрический сигнал содержит шум. Если изменения в этих сигналах схожи с небольшим количеством дополнительного шума, вреда не наносится. Алгоритм, применение которого приводит к некоторому ухудшение параметров сигнала, называется сжатием с потерями. Методы сжатия с потерями намного эффективнее методов кодирования без потерь. Чем выше коэффициент сжатия, тем больше шума добавляется в данные.

Табл. 1. Классификация методов сжатия: без потерь и с потерями

Без потерь

С потерями

RLE-кодирование

CS&Q

Код Хаффмана

JPEG

Дельта-кодирование

MPEG

LZW

Передаваемые по интернету изображения служат наглядным примером того, почему необходимо сжатие данных. Предположим, что требуется загрузить из интернета цифровую цветную фотографию с помощью 33,6-Кбит/с модема. Если изображение не сжато (например, это файл TIFF-формата), его объем составит около 600 Кбайт. При сжатии фото без потерь (в файл GIF-формата) его размер уменьшится примерно до 300 Кбайт. Метод сжатия с потерями (JPEG-формат) позволит уменьшить размер файла до 50 Кбайт. Время загрузки этих трех файлов составляет 142, 72 и 12 с, соответственно. Это большая разница. JPEG идеально подходит для работы с цифровыми фотографиями, тогда как GIF используется только для рисованных изображений.

Второй способ классификации методов сжатия данных проиллюстрирован в таблице 2. Большинство программ сжатия работает с группами данных, которые берутся из исходного файла, сжимаются и записываются в выходной файл. Например, одним из таких методов является CS&Q (Coarser Sampling and Quantization — неточные выборка и дискретизация). Предположим, что сжимается цифровой сигнал, например звуковой сигнал, который оцифрован с разрядностью 12 бит. Можно прочесть две смежные выборки из исходного файла (24 бит), отбросить одну выборку полностью, отбросить наименее значащие 4 бита из другой выборки, затем записать оставшиеся 8 битов в выходной файл. При 24 входных битах и 8 выходных коэффициент сжатия алгоритма с потерями равен 3:1. Этот метод высокоэффективен при использовании сжатия с преобразованием, составляющего основу алгоритма JPEG.

Табл. 2. Классификация методов сжатия: фиксированный и переменный размер группы

Метод

Размер группы

входной

выходной

CS&Q

фиксированный

фиксированный

Код Хаффмана

фиксированный

переменный

Арифметический

переменный

переменный

RLE, LZW

переменный

фиксированный

В методе CS&Q из входящего файла читается фиксированное число битов, и меньшее фиксированное число записывается в выходной файл. Другие методы сжатия позволяют создавать переменное число битов для чтения или записи. Причина того, почему в таблицу не вошли форматы JPEG и MPEG, в том, что это составные алгоритмы, в которых совмещено множество других методов.

RLE-кодирование

Файлы данных содержат одни и те же символы, повторяющиеся множество раз в одном ряду. Например, в текстовых файлах используются пробелы для разделения предложений, отступы, таблицы и т.д. Цифровые сигналы также содержат одинаковые величины, указывающие на то, что сигнал не претерпевает изменений. Например, изображение ночного неба может содержать длинные серии символов, представляющих темный фон, а цифровая музыка может иметь длинную серию нулей между песнями. RLE-кодирование (Run-length encoding — кодирование по длинам серий) представляет собой метод сжатия таких типов файлов.
На рисунке 1 проиллюстрирован принцип этого кодирования для последовательности данных с частым повторением серии нулей. Всякий раз, когда нуль встречается во входных данных, в выходной файл записываются два значения: нуль, указывающий на начало кодирования, и число нулей в серии. Если среднее значение длины серии больше двух, происходит сжатие. С другой стороны, множество одиночных нулей в данных может привести к тому, что кодированный файл окажется больше исходного.

Рис. 1. Пример RLE-кодирования

Входные данные можно рассматривать и как отдельные байты, или группы, например числа с плавающей запятой. RLE-кодирование можно использовать только в случае одного знака (как в случае в нулем в примере выше), нескольких знаков или всех знаков.

Кодирование Хаффмана

Этот метод был разработан Хаф­фманом в 1950-х гг. Метод основан на использовании относительной частоты встречаемости индивидуальных элементов. Часто встречающиеся элементы кодируются более короткой последовательностью битов. На рисунке 2 представлена гистограмма байтовых величин большого файла ASCII. Более 96% этого файла состоит из 31 символа: букв в нижнем регистре, пробела, запятой, точки и символа возврата каретки.

Алгоритм, назначающий каждому из этих стандартных символов пятибитный двоичный код по схеме 00000 = a, 00001 = b, 00010 = c и т.д., позволяет 96% этого файла уменьшить на 5/8 объема. Последняя комбинация 11111 будет указывать на то, что передаваемый символ не входит в группу из 31 стандартного символа. Следующие восемь битов в этом файле указывают, что представляет собой символ в соотоветствии со стандартом присвоения ASCII. Итак, 4% символов во входном файле требуют для представления 5 + 8 = 13 бит.

Принцип этого алгоритма заключается в присвоении часто употребляемым символам меньшего числа битов, а редко встречающимся символам — большего количества битов. В данном примере среднее число битов, требуемых из расчета на исходный символ, равно 0,96 . 5 + 0,04 . 13 = 5,32. Другими словами, суммарный коэффициент сжатия составляет 8 бит/5,32 бит, или 1,5 : 1.

Рис. 2. Гистограмма значений ASCII фрагмента текста из этой статьи

На рисунке 3 представлена упрощенная схема кодирования Хаффмана. В таблице кодирования указана вероятность употребления символов с A по G, имеющихся в исходной последовательности данных, и их соответствия. Коды переменной длины сортируются в стандартные восьмибитовые группы. При распаковке данных все группы выстраиваются в последовательность нулей и единиц, что позволяет разделять поток данных без помощи маркеров. Обрабатывая поток данных, программа распаковки формирует достоверный код, а затем переходит к следующему символу. Такой способ формирования кода обеспечивает однозначное чтение данных.

Буква

Вероятность

Код Хаффмана

А

0,154

1

В

0,110

01

С

0,072

0010

D

0,063

0011

Е

0,059

0001

F

0,015

000010

G

0,011

000011

Рис. 3. Пример кодирования Хаффмана

Дельта-кодирование

Термин «дельта-кодирование» обозначает несколько методов сохранения или передачи данных в форме разности между последующими выборками (или символами), а не сохранение самих выборок. На рисунке 4 приводится пример работы этого механизма. Первое значение в кодируемом файле является совпадает с исходным. Все последующие значения в кодируемом файле равны разности между соответствующим и предыдущим значениями входного файла.

Рис. 4. Пример дельта-кодирования

Дельта-кодирование используется для сжатия данных, если значения исходного файла изменяются плавно, т.е. разность между следующими друг за другом величинами невелика. Это условие не выполняется для текста ASCII и исполняемого кода, но является общим случаем, когда информация поступает в виде сигнала. Например, на рисунке 5а показан фрагмент аудиосигнала, оцифрованного с разрядностью 8 бит, причем все выборки принимают значения в диапазоне –127–127. На рисунке 5б представлен кодированный вариант этого сигнала, основное отличие которого от исходного сигнала заключается в меньшей амплитуде. Другими словами, дельта-кодирование увеличивает вероятность того, что каждое значение выборки находится вблизи нуля, а вероятность того, что оно значительно больше этой величины, невелика. С неравномерным распределением вероятности работает метод Хаффмана. Если исходный сигнал не меняется или меняется линейно, в результате дельта-кодирования появятся серии выборок с одинаковыми значениями, с которыми работает RLE-алгоритм. Таким образом, в стандартном методе сжатия файлов используется дельта-кодирование с последующим применением метода Хаффмана или RLE-кодирования.

                      а)

                      б)

Рис. 5. Пример дельта-кодирования

Механизм дельта-кодирования можно расширить до более полного метода под названием кодирование с линейным предсказанием (Linear Predictive Coding, LPC).
Чтобы понять суть этого метода, представим, что уже были закодированы первые 99 выборок из входного сигнала и необходимо произвести выборку под номером 100. Мы задаемся вопросом о том, каково наиболее вероятное ее значение? В дельта-кодировании ответом на данный вопрос является предположение, что это значение предыдущей, 99-й выборки. Это ожидаемое значение используется как опорная величина при кодировании выборки 100. Таким образом, разность между значением выборки и ожиданием помещается в кодируемый файл. Метод LPC устанавливает наиболее вероятную величину на основе нескольких последних выборок. В используемых при этом алгоритмах применяется z-преобразование и другие математические методы.

Алгоритм LZW

LZW-сжатие — наиболее универсальный метод сжатия данных, получивший распространение благодаря своей простоте и гибкости. Этот алгоритм назван по имени его создателей (Lempel-Ziv-Welch encoding — сжатие данных методом Лемпела-Зива-Велча). Исходный метод сжатия Lempel-Ziv был впервые заявлен в 1977 г., а усовершенствованный Велчем вариант — в 1984 г. Метод позволяет сжимать текст, исполняемый код и схожие файлы данных примерно вполовину. LZW также хорошо работает с избыточными данными, например табличными числами, компьютерным исходным текстом и принятыми сигналами. В этих случаях типичными значениями коэффициента сжатия являются 5:1. LZW-сжатие всегда используется для обработки файлов изображения в формате GIF и предлагается в качестве опции для форматов TIFF и PostScript.
Алгоритм LZW использует кодовую таблицу, пример которой представлен на рисунке 6. Как правило, в таблице указываются 4096 элементов. При этом кодированные LZW-данные полностью состоят из 12-битных кодов, каждый из которых соответствует одному табличному элементу. Распаковка выполняется путем извлечения каждого кода из сжатого файла и его преобразования с помощью таблицы. Табличные коды 0—255 всегда назначаются единичным байтам входного файла (стандартному набору символов). Например, если используются только эти первые 256 кодов, каждый байт исходного файла преобразуется в 12 бит сжатого LZW-файла, который на 50% больше исходного. При распаковке этот 12-битный код преобразуется с помощью кодовой таблицы в единичные байты.

 

Пример кодовой таблицы

Кодовое число

Преобразование

Идентичный код

0000

0

0001

1

   

0254

254

0255

255

Уникальный код

0256

145 201 4

0257

243 245

   

4095

XXX XXX XXX

Рис. 6. Пример сжатия в соответствии с таблицей кодирования

Метод LZW сжимает данные с помощью кодов 256—4095, представляя последовательности байтов. Например, код 523 может представлять последовательность из трех байтов: 231 124 234. Всякий раз, когда алгоритм сжатия обнаруживает последовательность во входном файле, в кодируемый файл ставится код 523. При распаковке код 523 преобразуется с помощью таблицы в исходную последовательность из трех байтов. Чем длиннее последовательность, назначаемая единичному коду и чем чаще она повторяется, тем больше коэффициент сжатия.
Существуют два основных препятствия при использовании этого метода сжатия: 1) как определить, какие последовательности должны указываться в кодовой таблице и 2) как обеспечить программу распаковки той же таблицей, которую использует программа сжатия. Алгоритм LZW позволяет решить эти задачи.

Когда программа LZW начинает кодировать файл, таблица содержит лишь первые 256 элементов — остальная ее часть пуста. Это значит, что первые коды, поступающие в сжимаемый файл, представляют собой единичные байты исходного файла, преобразуемые в 12-бит группы. По мере продолжения кодирования LZW-алгоритм определяет повторяющиеся последовательности данных и добавляет их в кодовую таблицу. Сжатие начинается, когда последовательность обнаруживается вторично. Суть метода в том, что последовательность из входящего файла не добавляется в кодовую таблицу, если она уже была помещена в сжатый файл как отдельный символ (коды 0—255). Это важное условие, поскольку оно позволяет программе распаковки восстановить кодовую таблицу непосредственно из сжатых данных, не нуждаясь в ее отдельной передаче.

JPEG

Из множества алгоритмов сжатия с потерями кодирование с преобразованием оказалось наиболее востребованным. Наилучший пример такого метода — популярный стандарт JPEG (Joint Photographers Experts Group — Объединенная группа экспертов по машинной обработке фотографических изображений). Рассмотрим на примере JPEG работу алгоритма сжатия с потерями.

Мы уже обсудили простейший метод сжатия с потерями CS&Q, в котором уменьшается количество битов на выборку или полностью отбрасываются некоторые выборки. Оба этих приема позволяют достичь желаемого результата — файл становится меньше за счет ухудшения качества сигнала. Понятно, что эти простые методы работают не самым лучшим образом.

Сжатие с преобразованием основано на простом условии: в трансформированном сигнале (например, с помощью преобразования Фурье) полученные значения данных не несут прежней информационной нагрузки. В частности, низкочастотные компоненты сигнала начинают играть более важную роль, чем высокочастотные компоненты. Удаление 50% битов из высокочастотных компонентов может привести, например, к удалению лишь 5% закодированной информации.

Из рисунка 7 видно, что JPEG-сжатие начинается путем разбиения изображения на группы размером 8×8 пикселов. Полный алгоритм JPEG работате с широким рядом битов на пиксел, включая информацию о цвете. В этом примере каждый пиксел является единичным байтом, градацией серого в диапазоне 0—255. Эти группы 8×8 пикселов обрабатываются при сжатии независимо друг от друга. Это значит, что каждая группа сначала представляется 64 байтами. Вслед за преобразованием и удалением данных каждая группа представляется, например, 2—20 байтами. При распаковке сжатого файла требуется такое же количество байтов для аппроксимации исходной группы 8×8. Эти аппроксимированные группы затем объединяются, воссоздавая несжатое изображение. Почему используются группы размерами 8×8, а не 16×16? Такое группирование было основано исходя из максимального возможного размера, с которым работали микросхемы на момент разработки стандарта.

Рис. 7. Пример применения метода сжатия JPEG. Три группы 8?8, показанные в увеличенном виде, представляют значения отдельных пикселов

Для реализации методов сжатия было исследовано множество различных преобразований. Например, преобразование Karhunen-Loeve обеспечивает наиболее высокий коэффициент сжатия, но оно трудно осуществляется. Метод преобразования Фурье реализуется гораздо проще, но он не обеспечивает достаточно хорошего сжатия. В конце концов, выбор был сделан в пользу разновидности метода Фурье — дискретного косинусного преобразования (Discrete Cosine Transform — DCT).

На примере работы алгоритма JPEG видно, как несколько схем сжатия объединяются, обеспечивая большую эффективность. Вся процедура сжатия JPEG состоит из следующих этапов:
– изображение разбивается на группы 8×8;
– каждая группа преобразуется с помощью преобразования DCT;
– каждый спектральный элемент 8×8 сжимается путем сокращения числа битов и удаления некоторых компонентов с помощью таблицы квантования;
– видоизмененный спектр преобразуется из массива 8×8 в линейную последовательность, все высокочастотные компоненты которой помещаются в ее конец;
– серии нулей сжимаются с помощью метода RLE;
– последовательность кодируется либо методом Хаффмана, либо арифметическим методом для получения сжатого файла.

MPEG

MPEG (Moving Pictures Experts Group — Экспертная группа по кинематографии) — стандарт сжатия цифровых видеоданных. Этот алгоритм обеспечивает также сжатие звуковой дорожки к видеофильму. MPEG представляет собой еще более сложный, чем JPEG, стандарт с огромным потенциалом. Можно сказать, это ключевая технология XXI века.
У MPEG имеется несколько очень важных особенностей. Так например, он позволяет воспроизводить видеофильм в прямом и обратном направлениях, в режиме нормальной и повышенной скорости. К кодированной информации имеется прямой доступ, т.е. каждый отдельный кадр последовательности отображается как неподвижное изображение. Таким образом, фильм редактируется — можно кодировать его короткие фрагменты, не используя всю последовательность в качестве опорной. MPEG также устойчив к ошибкам, что позволяет избегать цифровых ошибок, приводящих к нежелательному прерыванию воспроизведения.

Используемый в этом стандарте метод можно классифицировать по двум типам сжатия: внутрикадровое и межкадровое. При сжатии по первому типу отдельные кадры, составляющие видеопоследовательность, кодируются так, как если бы они были неподвижными изображениями. Такое сжатие выполняется с помощью JPEG-стандарта с несколькими вариациями. В терминологии MPEG кадр, закодированный таким образом, называется внутрикодированным, или I-picture.

Наибольшая часть пикселов в видеопоследовательности изменяется незначительно от кадра к кадру. Если камера не движется, наибольшая часть изображения состоит из фона, который не меняется на протяжении некоторого количества кадров. MPEG использует это обстоятельство, сжимая избыточную информацию между кадрами с помощью дельта-кодирования. После сжатия одного из кадров в виде I-picture последующие кадры кодируются как изображения с предсказанием, или P-pictures, т.е. кодируются только изменившиеся пикселы, т.к. кадры I-picture включены в P-picture.

Эти две схемы сжатия составляют основу MPEG, тогда как практическая реализация данного метода намного сложнее описанной. Например, кадры P-picture могут использовать изображение I-picture как опорное, которое претерпело изменение при перемещении объектов в последовательности изображений. Существуют также двунаправленные предиктивно-кодированные изображения, или B-pictures. Эти видеокадры формируются способом предсказания «вперед» и «назад» на основе I-picture. При этом обрабатываются участки изображения, которые постепенно меняются на протяжении множества кадров. Отдельные кадры также хранятся без соблюдения последовательности в сжатых данных, чтобы облегчить упорядочение изображений I-, P- и B-pictures. Наличие цвета и звука еще больше усложняет реализацию этого алгоритма.

Наибольшее искажение при использовании формата MPEG наблюдается при быстром изменении больших частей изображения. Для поддержания воспроизведения с быстро меняющимися сценами на должном уровне требуется значительный объем информации. Если скорость передачи данных ограничена, зритель в этом случае видит ступенчатообразные искажения при смене сцен. Эти искажения сводятся к минимуму в сетях с одновременной передачей данных по нескольким видеоканалам, например в сети кабельного телевидения. Внезапное увеличение объема данных, требуемое для поддержки быстро меняющейся сцены в видеоканале, компенсируется относительно статическими изображениями, передаваемыми по другим каналам.

Литература

1. Steven W. Smith, Data compression tutorial Part 1, Part 2, and Part 3.

Лучшие программы для сжатия данных и архивации

При отправке большого количества файлов через интернет, а также их переносе на сменных носителях нам приходится пользоваться архиваторами. Так называются программы, предназначенные для сжатия файлов. В интернете они распространяются в свободном доступе, и скачать их на свой компьютер может каждый пользователь.

Содержание: [показать]

В данном разделе вы сможете найти разнообразные проги для сжатия контента. Они бывают платными и бесплатными. Подобные приложения обычно поддерживают работу со многими форматами. Однако есть и приложения, позволяющие сжимать только один конкретный вид файлов.

Планируете скачать программу для сжатия файлов, предназначенную исключительно для домашнего пользования? В таком случае, выберите бесплатный архиватор, использование которого возможно через контекстное меню. Чтобы распаковать или запаковать архив, даже не придётся открывать утилиту. Вы просто выбираете нужный пункт в меню, нажав правую кнопку мыши.

Каким бывает коэффициент сжатия и что это такое?

Сжатие данных может быть разным. Оно определяется специальным коэффициентом, то есть уровнем сжатия. В зависимости от программы, сжатие варьируется от 10% до 30%. Есть возможность создания многотомных архивов, а также установки архива на их распаковку. Отдельные виды ПО позволяют создавать самораспаковывающиеся файлы в формате .EXE. Что это значит? Вы запускаете файл с такой компрессией – и все файлы извлекаются в автоматическом режиме.

Отдельные виды документов и других файлов можно сжать ещё сильнее, и 30% – далеко не предел.

Однако вы должны понимать, что программа, осуществляющая такое сжатие, работает на максимуме. Она полностью загружает процессор, поэтому во время архивации компьютер немного подвисает. Разнообразные виды и уровни сжатия позволяют скачать архиватор и балансировать между размером архива, скоростью создания и некоторыми другими характеристиками.

Обратите внимание ещё на одну особенность. Функция архивирования часто используется прямо через контекстное меню. То есть, некоторые приложения-архиваторы вообще не имеют своего интерфейса. Они просто интегрируют свои пункты в меню.

ТОП-4 популярных платных архиваторов

  1. WinRAR. Пожалуй, самая известная программа для сжатия файлов, которую активно используют миллионы пользователей во всём мире. Отличается удобством использования и простотой. А знаменитая иконка в виде упакованных книжек у многих из нас ассоциируется с архивацией.
  2. WinZIP. Вы будете удивлены, но самой первой утилитой для компрессии файлов на операционной системе Windows была не WinRAR, а WinZip. Она также пользуется популярностью среди определённого круга пользователей. Поддерживает все распространённые расширения.
  3. ZipZag. Приложение с оригинальным названием, чем-то напоминающим слово «ЗигЗаг». Не менее удачный архиватор. Его характерной особенностью является поддержка большого количества форматов, среди которых встречается и rar с zip, и cab, и даже RPM.
  4. PowerZip. Мощнейший «комбайн» для работы. Легко распаковывает загруженные файлы. Умеет создавать собственные файлы в формате .zip, установка паролей тоже есть.

ТОП-10 популярных архиваторов бесплатно

  1. 7-ZIP рекомендуется скачать всем, кто регулярно работает как с .zip, так и с многими другими архивами. Доступно, бесплатно, просто – именно так можно охарактеризовать 7-ZIP.
  2. J7Z. Доступная и вместе с тем очень мощная утилита, которую можно установить на любую версию ОС
  3. IZArc. Поддерживает не только разнообразные форматы сжатия данных, но и монтирование образов диска.
  4. PeaZip. Бьёт все рекорды по количеству загрузок, поддерживает более 30 форматов.
  5. KGB Archiver. Полностью бесплатная утилита. Характеризуется поддержкой нескольких вариантов сжатия, достаточно удобным интерфейсом.
  6. TUGZip. Интуитивно понятный интерфейс, множество форматов являются визитной карточкой этого архиватора.
  7. WinUHA. Имеет GUI-интерфейс, работает даже с архивами UHARC.
  8. ZipItFree. Также входит в ТОП-12 архиваторов по количеству загрузок.
  9. RAS/MP2M – программный продукт с максимальной производительностью. Предназначен специально для работы с архивами.

ZipGenius. Приложение, которое используется для сжатия в ZIP. Характеризуется большим количеством возможностей.

Тестируем программы архивации. Какая сжимает лучше?

Чтобы провести тестирование, мы выбрали 5 популярных программ:

  • WinRAR
  • 7-Zip
  • WinZIP
  • Hamster Free Archiver
  • PowerArchiver

Все приложения переведены на русский и характеризуются поддержкой большого количества расширений. Но какая из них окажется лучше? Для тестирования были взяты три набора файлов:

  • Документы. Подборка из документов XLS и DOC. Размер – 3,8 Мб, количество файлов – 35 штук.
  • Фотографии. 14 фотоснимков, сделанных на хороший смартфон. Размер пакета – 78 Мбайт. Хитрость в том, что формат jpeg уже предполагает сжатие данных. Поэтому сжать его ещё больше весьма проблематично. Так что если архиватор сможет сжать их ещё больше, это будет огромным преимуществом.
  • Программы. Мы взяли пакет «старенького» офисного пакета Microsoft Office 2003 и решили проверить, насколько хорошо программы смогут его заархивировать. Общее количество файлов и папок – 2055 и 125 соответственно, размер – 875 Мб.

Результаты тестирования

При сжатии офисных документов лучше всего зарекомендовала себя программа 7-ZIP (алгоритм LZMA2). На втором и третьем месте оказались архиваторы WinRAR и Hamster FZA.

Хорошо сжать фотоснимки удалось разве что приложением WinZIP, однако результат оказался впечатляющим. Экономится более 20% места.

Напоминаем, что видеофайл мы не использовали, только фотоснимки.

При компрессии файлов из папки «Офис» специальной утилитой лучший результат показало приложение WinRAR. Оно оказалось ещё и самым быстрым.

Когда нужно сжать файлы и сэкономить свободное пространство, используйте «правильные» архиваторы. Специально для вас мы отбираем лучшие из лучших, и публикуем на нашем сайте. Вы сможете скачать их совершенно бесплатно.

§16. Сжатие данных






Содержание урока

Зачем и как сжимать данные?

Сжатие без потерь

Сжатие с потерями

Программы-архиваторы

Выводы. Интеллект-карта

Вопросы и задания

Практическая работа № 5 «Использование архиватора»


Зачем и как сжимать данные?


Ключевые слова:


 • сжатие данных 
 • коэффициент сжатия 
 • сжатие без потерь 
 • сжатие с потерями
 • архивация
 • самораспаковывающийся
 архив
 • программа-архиватор 
 • контрольная сумма 
 

Для того чтобы сэкономить место на внешних носителях (жёстких дисках, «флэшках») или ускорить передачу данных по компьютерным сетям, можно сжать данные — уменьшить их информационный объём, сократить размер файла.

Как вы уже знаете, рисунки часто хранятся в сжатом виде. Кроме того, сжатие почти всегда используется при хранении и передаче звука и видео — упаковку и распаковку этих данных выполняют специальные программы-кодеки.

Покажем, как можно сжать данные, на простом примере. Есть файл, в котором в 8-битной кодировке записаны сначала 100 русских букв А, а потом — 100 букв Б (рис. 2.39).

Рис. 2.39

Каждая буква на рис. 2.39 занимает 8 бит. Определите информационный объём файла в байтах.

Теперь запишем те же самые данные иначе: сначала количество повторений первого символа, а затем — сам первый символ, потом так же для второго символа (рис. 2.40).

Рис. 2.40

Каждая ячейка на рис. 2.40 занимает 8 бит. Определите информационный объём файла в байтах.

Объём файла уменьшился, это значит, что мы сжали данные.

Коэффициент сжатия — это отношение размера исходного файла IO к размеру сжатого файла IСЖ: kсж = IO / IСЖ

Определите коэффициент сжатия файла в рассмотренном выше примере.

Почему же этот файл удалось так удачно сжать? Всё дело в том, что в нём были длинные цепочки повторяющихся символов, и мы применили алгоритм, который очень удачно их сжимает. Этот алгоритм называется кодированием цепочек одинаковых символов (по-английски — RLE 1) : Run Length Encoding).


1) Алгоритм RLE можно успешно использовать для сжатия рисунков, в которых большие области закрашены одним цветом.


В файле записаны 100 различных символов. Определите коэффициент сжатия файла с помощью алгоритма RLE. Что означает полученное число?

Данные можно сжать, если в них есть какие-то закономерности (избыточность), например одинаковые символы, стоящие рядом, или одинаковые цепочки символов («слова»). Поэтому хорошо сжимаются данные, в которых таких закономерностей много, например тексты и рисунки. Хуже всего сжимаются случайные данные, в которых нет ничего закономерного.

Программы для сжатия данных выявляют избыточность данных и устраняют её, поэтому сжимать второй раз уже сжатые данные чаще всего бесполезно.

Следующая страница Сжатие без потерь

Cкачать материалы урока

что значит сжать файл?

jaimiem написал:

что значит сжать файл?

Вы говорите о сжатии без потерь . См.

означает ли это, что он будет занимать меньше места на моем диске

Это зависит от файла.

Файл MP3 или JPEG содержит данные, уже подвергнутые сжатию с потерями.Следовательно, сжатие такого файла сэкономит очень мало места на диске. Эта экономия обычно достигается за счет сжатия метаданных (таких как теги MP3 или теги EXIF), которые для начала не занимают много места. При определенных обстоятельствах такой сжатый файл может даже быть больше оригинала.

Напротив, текстовые файлы могут подвергаться значительному сжатию. Примером может служить формат MS Word .docx. Файл .docx на самом деле представляет собой (сжатый) zip-архив, содержащий иерархию в основном размеченных текстовых файлов.Такой архив при расширении может занимать в 10 раз больше места.

Может ли случиться что-нибудь плохое при сжатии файла?

«Что угодно» - слово довольно большое. Вы должны знать две основные проблемы: защита паролем и совместимость. Если сжатый файл защищен паролем, и вы потеряете пароль, вы больше никогда не сможете получить к нему доступ. Если формат сжатия устареет, вы больше не сможете найти программное обеспечение, способное расширять архив.

.

Объяснение WinZip Computing

Среди сотен различных типов расширений файлов файлы сжатия, такие как ZIP, являются уникальными. Они не предназначены для изображений, видео, аудио или какого-либо одного типа данных.

Вместо этого они являются результатом сжатия больших файлов во что-то более управляемое. При сжатии файла данные занимают меньше места, и файлы можно отправлять и получать намного быстрее.

Но подождите, как можно уменьшить размер файла, не испортив данные? Это может показаться невозможным, но как только вы узнаете, что происходит за кулисами, это становится понятным.

Итак, если вы когда-нибудь задумывались, "что делает сжатие файла?" тогда вы попали в нужное место. Итак, давайте начнем с некоторых основ.

Что такое сжатие файлов?

Это правда, что ZIP - не единственный тип сжатого файла, но он определенно один из самых распространенных. Мы могли бы продолжать и говорить о ZIP, ARC, ARJ, RAR, CAB и десятках других, но все они, по сути, работают одинаково.Итак, чтобы этот пост был понятным и легким для понимания, мы сосредоточимся только на расширении ZIP.

По сути, сжатый файл - это своего рода архив, содержащий один или несколько файлов, размер которых был уменьшен. Поскольку эти файлы меньше, их можно хранить, не занимая много места, или передавать через Интернет с более высокой скоростью. Используя такую ​​программу, как WinZip, вы можете затем распаковать файл или файлы обратно в их исходное состояние без какого-либо ухудшения.


Нужно скачать Winzip?

Загрузите бесплатную 30-дневную пробную версию прямо сейчас!


Все еще не знаете, как на самом деле работает это волшебство? Потерпите меня, пока я буду немного разбираться в технике.

Как работает сжатие файлов?

Здесь все может немного усложниться.По сути, есть два основных типа сжатия файлов? без потерь и с потерями. Сжатие без потерь принимает ваши файлы и уменьшает их размер без потери информации. Сжатие с потерями уменьшает размер файла, отрубая фрагменты, которые не на 100% необходимы для работы. Я знаю, что это довольно большое упрощение, поэтому давайте разберем их по одному.

Сжатие файлов без потерь

Это может звучать безумно, но так работает.Чтобы сжатие без потерь работало, файл необходимо уменьшить, ничего не теряя. Это делается за счет удаления избыточности.

Что такое избыточность, спросите вы?

Избыточность данных - это условие, создаваемое в базе данных или среде хранения данных, в которой один и тот же фрагмент данных хранится в нескольких местах.

За счет исключения избыточности у вас остается только один экземпляр каждого бита данных.

Сжатие файлов без потерь будет примерно таким:

AAABBBBBCC

и сжав его до этого:

A3B5C2

Здесь та же информация, но она упрощена и занимает меньше места (обратите внимание, что числа соответствуют количеству повторений предыдущей буквы). Таким образом, когда вы распаковываете (распаковываете / открываете / извлекаете) файл, он знает, как вернуться в исходную форму.Это в основном используется для текста и электронных таблиц, потому что потеря слов или данных из документа - это не то, чего вы хотите.

Сжатие файлов с потерями

Сжатие с потерями работает в основном так же, но, как вы, вероятно, можете понять по названию, это приводит к безвозвратной потере некоторых данных (не так плохо, как кажется).

Это чаще встречается с мультимедийными файлами, такими как видео, аудио и изображения, потому что они не слишком страдают от потери данных.Фактически, музыка и видео, которые у вас сейчас есть на вашем компьютере, вероятно, были сжаты, и вы даже не замечаете недостающих битов. Это связано с тем, что удаляемые данные находятся за пределами диапазона, который люди могут слышать или видеть.

Однако есть и обратная сторона - если вы снова и снова сжимаете один и тот же файл, используя метод с потерями, вы начнете замечать снижение качества, поскольку данные каждый раз удаляются.

Зачем сжимать файлы?


Нужно скачать Winzip?

Загрузите бесплатную 30-дневную пробную версию прямо сейчас!


Если вы часто редактируете медиафайлы, вы знаете, насколько важно сжатие файлов при передаче фотографий, музыки и видео.Вы действительно не хотите убивать всю свою пропускную способность и тратить кучу ценного дискового пространства. Если вы не один из таких людей, то вот почему это так необходимо.

Занимает меньше места

Допустим, у вас есть огромное количество файлов на вашем компьютере, но вы не планируете что-либо с ними делать какое-то время (возможно, вы виртуальный накопитель, кто знает). Оставлять их на жестком диске, чтобы они занимали место, - не самое практичное решение.

Вместо этого вы можете заархивировать большое количество файлов в одну архивную папку, которая освобождает место и значительно упрощает организацию.

Храните свою коллекцию старых фильмов о кунг-фу на жестком диске? Сожмите их все в один ZIP-файл и удивитесь, сколько места вы сэкономите.

Более эффективные переводы

Если вы когда-либо пробовали отправить по электронной почте действительно большой файл, вы знаете, что это может занять много времени.Еще хуже - попытка отправить сразу несколько документов по электронной почте. Часто ваше сообщение не удается, потому что некоторые почтовые клиенты не разрешают передачу файлов более определенного размера.

Конечно, вы можете отправить серию нескольких писем с небольшими вложениями к каждому, но это отнимает много времени и сложно отслеживать (и вы, вероятно, рассердите получателя).

Благодаря сжатию ваших документов в один ZIP-файл, он займет меньше места и будет передаваться намного быстрее.Получателю просто нужно использовать такую ​​программу, как WinZip, для извлечения файлов, и у него будет все, что вы отправили, в одной организованной папке.

Можно сэкономить деньги

Жесткие диски дорогие - я не должен вам об этом говорить. Очевидно, что для хранения большого количества данных требуется много места, так почему бы не получить максимальную отдачу от вложенных средств?

Допустим, у вас есть 200 ГБ данных, которые вам нужно спрятать на вашем компьютере, но на вашем жестком диске всего 250 ГБ.Конечно, он подойдет, но тогда у вас останется только 50 ГБ, что в наши дни немного.

Вы можете пойти и купить более крупный и дорогой жесткий диск, перенести все со старого на новый и все готово.

ИЛИ

Вы можете сжать 200 ГБ данных в ZIP-файл, который занимает всего 100 ГБ. У вас все еще есть все ваши файлы, готовые к использованию, когда они вам понадобятся, но вам не нужно тратить деньги на дополнительное пространство для хранения.

Как сжимать / распаковывать файлы

На этом этапе у вас должно быть достаточно четкое представление о сжатии файлов - как оно работает и почему это полезно. Это здорово и все такое, но вы, наверное, хотите знать, как самостоятельно архивировать и распаковывать файлы, не так ли?

Ниже приводится ускоренный курс по процессу сжатия и распаковки файлов. К счастью, если файлы, которые вы пытаетесь сжать, относительно небольшие, ваша операционная система должна иметь возможность заархивировать их без использования стороннего программного обеспечения.Об этом позаботится простой вариант щелчка правой кнопкой мыши.

Но что, если вы имеете дело с несколькими гигабайтами данных? Вам понадобится что-то более привлекательное, чтобы заботиться о вещах. К счастью для вас WinZip - ведущий файловый компрессор.


Нужно скачать Winzip?

Загрузите бесплатную 30-дневную пробную версию прямо сейчас!


Сжатие больших файлов в WinZip

  1. Эта часть довольно сложная.Во-первых, вам нужно открыть WinZip (сложно, правда?).
  2. Затем вам нужно найти и выбрать все файлы, которые вы хотите сжать, на панели Файлы .
  3. После того, как все они выбраны, нажмите Добавить в архив.
  4. Щелкните Сохранить как.
  5. Выберите целевое местоположение, дайте ему имя и нажмите Сохранить. И это все.

Сжатие больших файлов за пределами WinZip (для работы необходимо установить WinZip)

  1. Откройте папку, содержащую все файлы, которые вы хотите сжать.
  2. Выделите каждую, которую собираетесь застегнуть.
  3. Щелкните правой кнопкой мыши в выделенной области, и появится подменю WinZip. У вас есть пара вариантов на выбор.
  4. * Добавить в Zip-файл: , щелкнув эту опцию, вы сможете присвоить имени вашему Zip-файлу, определить, как он должен быть сжат, и добавить шифрование.

    * Добавить в [имя файла] .zip: Эти параметры работают намного быстрее, но у вас не так много свободы.По сути, он создаст Zip-файл с именем содержащей его папки, но вы не сможете настроить параметры.

  5. Теперь ваш Zip-файл создан для хранения или передачи.

Распаковка (разархивирование) ваших файлов

Распаковать файл очень просто:

  1. Перетаскивание файла или папки из заархивированной папки в новое место.

ИЛИ

  1. Щелкните правой кнопкой мыши внутри заархивированной папки, выберите Извлечь все , затем следуйте инструкциям.

Вот и все

Итак, это подводит итог основам сжатия файлов. Кажется невозможным уменьшить размер файла, а затем снова собрать его в другом месте, но, по сути, происходит именно это.

Если вы хотите узнать больше, посетите веб-сайт WinZip для получения дополнительной документации.


Нужно скачать Winzip?

Загрузите бесплатную 30-дневную пробную версию прямо сейчас!

.Выход

- AWK для обработки сжатых файлов и печати исходных (сжатых) имен файлов

Переполнение стека
  1. Около
  2. Товары
  3. Для команд
  1. Переполнение стека Общественные вопросы и ответы
  2. Переполнение стека для команд Где разработчики и технологи делятся частными знаниями с коллегами
  3. Вакансии Программирование и связанные с ним технические возможности карьерного роста
  4. Талант Нанимайте технических специалистов и создавайте свой бренд работодателя
  5. Реклама Обратитесь к разработчикам и технологам со всего мира
  6. О компании

Загрузка…

    .

    Руководство по unix / командам / сжатию файлов - Викиучебники, открытые книги для открытого мира

    Из Wikibooks, открытые книги для открытого мира

    Перейти к навигации Перейти к поиску
    Ищите Руководство по unix / командам / сжатию файлов в одном из родственных проектов Викиучебника: Викиучебник не имеет страницы с таким точным названием.

    Другие причины, по которым это сообщение может отображаться:

    • Если страница была создана здесь недавно, она может еще не отображаться из-за задержки обновления базы данных; подождите несколько минут и попробуйте функцию очистки.
    • Заголовки в Викиучебниках чувствительны к регистру , кроме первого символа; Пожалуйста, проверьте альтернативные заглавные буквы и подумайте о добавлении перенаправления сюда к правильному заголовку.
    • Если страница была удалена, проверьте журнал удалений и просмотрите политику удаления.
    .

    Как работает сжатие файлов | HowStuffWorks

    В нашем предыдущем примере мы выбрали все повторяющиеся слова и поместили их в словарь. Для нас это наиболее очевидный способ составления словаря. Но программа сжатия видит это совершенно иначе: в ней нет концепции отдельных слов - она ​​только ищет шаблоны. А чтобы максимально уменьшить размер файла, он тщательно выбирает, какие шаблоны включить в словарь.

    Если подойти к фразе с этой точки зрения, мы получим совершенно другой словарь.

    Объявление

    Если бы программа сжатия просканировала фразу Кеннеди, первая повторяемость, с которой она столкнется, будет состоять всего из пары букв. В словах «не спрашивайте, что у вас» есть повторяющийся узор из буквы «т», за которой следует пробел - в «не» и «что». Если программа сжатия записала это в словарь, она могла бы записывать «1» каждый раз, когда за буквой «t» следовало пробел. Но в этой короткой фразе этого шаблона недостаточно, чтобы его можно было использовать, поэтому программа в конечном итоге его перезапишет.

    Следующее, что программа может заметить, - это «ou», которое встречается как в «your», так и в «country». Если бы это был более длинный документ, запись этого шаблона в словарь могла бы сэкономить много места - «ou» - довольно распространенная комбинация в английском языке. Но по мере того, как программа сжатия прорабатывала это предложение, она быстро обнаружила лучший выбор для словарной статьи: не только повторяется «ou», но и повторяются целые слова «your» и «country», и они фактически повторяются. вместе, как словосочетание «ваша страна.«В этом случае программа заменит словарную статью для« ou »записью« ваша страна ».

    Фраза «может сделать для» также повторяется, один раз за ней следует «ваш» и один раз за ней следует «вы», что дает нам повторяющийся образец «могу сделать для вас». Это позволяет нам записывать 15 символов (включая пробелы) с одним числовым значением, в то время как «ваша страна» позволяет нам записывать только 13 символов (с пробелами) с одним числовым значением, поэтому программа перезапишет запись «ваша страна» как просто «r страна, а затем напишите отдельную запись для "может сделать для вас.«Программа действует таким образом, собирая все повторяющиеся биты информации и затем вычисляя, какие шаблоны следует записать в словарь. Эта способность переписывать словарь является« адаптивной »частью алгоритма LZ на основе адаптивного словаря . способ, которым программа на самом деле это делает, довольно сложен, как вы можете видеть из обсуждений на Data-Compression.com.

    Независимо от того, какой конкретный метод вы используете, эта система глубокого поиска позволяет сжимать файл гораздо эффективнее, чем если бы вы просто выбирали слова.Используя шаблоны, которые мы выбрали выше, и добавив «__» для пробелов, мы получили более крупный словарь:

    1. спросите__
    2. what__
    3. you
    4. r__country
    5. __can__do__for__you

    И это меньшее предложение: «1not__2345 __ - __ 12354»

    Предложение теперь занимает 18 единиц памяти, а наш словарь занимает 41 единицу.Таким образом, мы уменьшили общий размер файла с 79 до 59 единиц! Это всего лишь один способ сжатия фразы, и не обязательно самый эффективный. (Посмотрим, сможете ли вы найти лучший способ!)

    Так насколько хороша эта система? Коэффициент уменьшения файла зависит от ряда факторов, включая тип файла, размер файла и схему сжатия.

    В большинстве языков мира определенные буквы и слова часто встречаются вместе в одном шаблоне.Из-за такой высокой степени избыточности текстовые файлы , очень хорошо сжимаются. Уменьшение на 50 процентов и более типично для текстового файла хорошего размера. Большинство языков программирования также очень избыточны, потому что они используют относительно небольшой набор команд, которые часто идут вместе в заданном шаблоне. Файлы, содержащие много уникальной информации, например графику или файлы MP3, не могут быть сильно сжаты с помощью этой системы, потому что они не повторяют многие шаблоны (подробнее об этом в следующем разделе).

    Если в файле много повторяющихся шаблонов, скорость уменьшения обычно увеличивается с размером файла. Вы можете убедиться в этом, просто взглянув на наш пример - если бы у нас было больше речи Кеннеди, мы могли бы чаще обращаться к шаблонам в нашем словаре и таким образом получать больше от файлового пространства каждой записи. Кроме того, в ходе более продолжительной работы могут появиться более распространенные шаблоны, что позволит нам создать более эффективный словарь.

    Эта эффективность также зависит от конкретного алгоритма, используемого программой сжатия.Некоторые программы особенно подходят для улавливания шаблонов в файлах определенных типов и поэтому могут сжать их более лаконично. У других есть словари внутри словарей, которые могут эффективно сжимать файлы большего размера, но не файлы меньшего размера. Хотя все программы сжатия подобного типа работают с одной и той же основной идеей, на самом деле существует множество вариантов выполнения. Программисты всегда пытаются построить лучшую систему.

    .

    Смотрите также