Зачем нужно сжимать информацию и какие существуют способы это сделать.
А действительно, зачем? Посчитаем, к примеру, сколько займет памяти изображение, по качеству близкое к телевизионному. Пусть его разрешение -- 800х6009 пиксел, а число оттенков цвета около 16 тысяч (High Color), т. е. цвет каждого пиксела представляется двухбайтовым кодом. 800x600=480000 элементов. 480000x2 байт = 960000 байт -- это чуть меньше 1 мегабайта. Кажется, не так много -- на лазерном диске поместится больше 650 таких картинок. Ну, а если речь идет о фильме? Стандартная скорость кинопроекции -- 24 кадра в секунду. Значит на компакт-диске можно записать фрагмент длительностью 650:24=27 секунд. Куда это годится?! А ведь это далеко не единственный случай, когда информации "слишком много". Таким образом, одна из причин использования сжатия данных -- желание поместить больше информации в память того же объема. Есть и вторая причина. Сжатие информации ускоряет ее передачу. Но об этом -- в следующей главе.
Существует несколько методов сжатия (компрессии10) данных. Все их можно разделить на две группы -- сжатие без потерь и с потерями. В первом случае распакованное сообщение точно повторяет исходное. Естественно, так можно обрабатывать любую информацию. Сжатие же с потерями возможно только в тех случаях, когда допустимы некоторые искажения -- какие именно, зависит от конкретного типа данных.
Практически все методы сжатия без потерь основаны на одной из двух довольно простых идей.
Одна из них впервые появилась в методе сжатия текстовой информации, предложенном в 1952 году Хафманом. Вы знаете, что стандартно каждый символ текста кодируется одним байтом. Но дело в том, что одни буквы встречаются чаще, а другие реже. Например, в тексте, написанном на русском языке, в каждой тысяче символов в среднем будет 90 букв "о", 72 -- "е" и только 2 -- "ф". Больше же всего окажется пробелов: сто семьдесят четыре. Если для наиболее распространенных символов использовать более короткие коды (меньше 8 бит), а для менее распространенных -- длинные (больше 8 бит), текст в целом займет меньше памяти, чем при стандартной кодировке.
Несколько методов сжатия основаны на учете повторяющихся байтов или последовательностей байт. Простейший из них -- RLE11 -- широко используется при сжатии изображений. В файле, сжатом таким методом, записывается, сколько раз повторяются одинаковые байты. Например, вместо "RRRRRGGGBBBBBBRRRBBRRRRRRR" будет храниться "5R3G6B3R2B7R"12. Очевидно, что такой метод лучше всего работает, когда изображение содержит большие участки с однотонной закраской.
Другие методы основаны на том, что если некоторая последовательность байт встречается в файле многократно, ее можно записать один раз в особую таблицу, а потом просто указывать: "взять столько-то байт из такого-то места таблицы"13.
Методы сжатия без потерь уменьшают размер файлов не очень сильно. Обычно коэффициент сжатия не превосходит 1/3—1/4. Гораздо лучших результатов можно добиться, используя сжатие с потерями. В этом случае на основе специальных исследований определяется, какой информацией можно пожертвовать.
Например, установлено, что человеческое зрение очень чувствительно к изменению яркости и гораздо меньше, к цветовому тону. Поэтому при сжатии фотографических изображений (и вообще, изображений, в которых нет резких границ между цветами) можно исключить информацию о цвете части пикселов. При распаковке же определять его по соседним. На практике чаще всего применяется метод, использующий более сложную обработку, -- JPEG14. Он позволяет сжимать изображение в десятки раз. С учетом особенностей восприятия человеком информации строятся также методы сжатия с потерями видеоизображения (наиболее распространены сейчас методы MPEG15) и звука.
Естественно, сжатие с потерями может использоваться только программами, предназначеными для обработки конкретных видов данных (например, графическими редакторами). А вот методы сжатия без потерь применяются и для любых произвольных файлов (широко известны программы-компрессоры ARJ, ZIP, RAR, StuffIt и др).
Заметим, что не стоит пытаться сжать файлы, которые уже были сжаты: размер их либо уменьшится совсем незначительно, либо даже увеличится.
Примечания
На самом деле, в телевизионном изображении 625 строк.
Compressus (лат.) -- сжимание.
Run-Length Encoding (англ.) -- кодирование длины последовательности.
На самом деле, конечно, используются коды цветов и коды, указывающие либо сколько раз повторяется следующий байт, либо сколько следующих байтов -- неповторяющиеся.
На этой идее основан широко использующийся для сжатия различных данных метод LZW, названный так по первым буквам фамилий его разработчиков: Lempel, Ziv и Welch.
Joint Photographic Experts Group (англ.) -- Объединенная группа экспертов по фотографии, разработавшая одноименный метод сжатия изображений.
Moving Picture Experts Group (англ.) -- Группа экспертов по движущимся изображениям
Другие работы по теме:
Радиоэкология в строительстве
ВЛИЯНИЕ ВОЗДЕЙСТВИЯ ИОНИЗИРУЮЩЕГО ИЗЛУЧЕНИЯ НА ФИЗИКО-МЕХАНИЧЕСКИЕ СВОЙСТВА ДРЕВЕСИНЫ, ИСПОЛБЗУЕМОЙ В СТРОИТЕЛЬСТВЕ НА ТЕРРИТОРИИ БРЯНСКОЙ ОБЛАСТИ.
Нефть
Реферат на тему “Нефть”. Нефть -масляная горючая жидкость обычно темного цвета со своеобразным запахом она немного легче воды и в ней не растворяется.
Второе начало термодинамики
Второй закон термодинамики: если в системе нет равновесия, процессы протекают в направлении, при котором система приблизится к равновесию. Превращение работы в теплоту. Два источника теплоты – с высокой температурой и с низкой. Сжатие газа в компрессорах.
Газотурбинный двигатель 2
Газотурбинный двигатель Газотурбинный двигатель (ГТД), тепловой двигатель, в котором газ сжимается и нагревается, а затем энергия сжатого и нагретого газа преобразуется в механическую работу на валу газовой турбины. Рабочий процесс ГТД может осуществляться с непрерывным сгоранием топлива при постоянном давлении или с прерывистым сгоранием топлива при постоянном объёме.
Стенд для монтажа шин
Проектирование стенда для демонтажа и монтажа шин. Расчет площади поперечного сечения штока, штока на сжатие, нагрузки на шток. Выбор гидроцилиндра и расчет параметров гидравлического насоса. Расчет сварного шва крепления корпуса гидроцилиндра с серьгой.
Структура и формирование исходных данных, необходимых для расчета параметров технологических схем
СТРУКТУРА И ФОРМИРОВАНИЕ ИСХОДНЫХ ДАННЫХ, НЕОБХОДИМЫХ ДЛЯ РАСЧЕТА ПАРАМЕТРОВ ТЕХНОЛОГИЧЕСКИХ СХЕМ Для определения параметров технологических схем необходимы соответствующие исходные данные, которые могут быть получены при натурных наблюдениях и исследованиях, в лабораторных условиях, из производственного опыта, т.е. с использованием горной графической документации, экспериментальных данных или расчётным путём.
Расчет металлоконструкций
Министерство общего и профессионального образования Российской Федерации Сочинский Государственный Университет Туризма и Курортного Дела Институт туристского сервиса и инфраструктуры
Обработка результатов эксперимента
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ КАФЕДРА МАТЕМАТИКИ СЕМЕСТРОВАЯ РАБОТА ПО СТАТИСТИКЕ
Проектирование состава бетона
Курсовая работа по материаловедению студента Группа Санкт-Петербургский Государственный Политехнический Университет Инженерно-строительный факультет
Теплотехника 2
Федеральное агентство по образованию Государственное образовательное учреждение высшего профессионального образования «САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АЭРОКОСМИЧЕСКИЙ УНИВЕРСИТЕТ имени академика С.П. КОРОЛЕВА» (СГАУ)
Расчет цикла паротурбинной установки
Для паротурбинной установки, работающей по обратимому циклу Ренкина можно определить работу, произведенную паром в турбине и затраченную на привод питательного насоса. Расчет теоретического расхода пара и тепла на выработку электроэнергии в цикле.
Разработка состава и технологии таблеток натрия алендроната
Введение Согласно определению, принятому Всемирной организацией здравоохранения, остеопороз объединяет группу метаболических заболеваний скелета, характеризующихся снижением массы костей, нарушением их архитектоники с последующим повышением ломкости и развитием переломов. У больных с остеопорозом костная ткань утрачивает не только минеральные, но и органические компоненты.
Фигура Земли
Фигура Земли в первом приближении представляет собой эллипсоид вращения, у которого экваториальный радиус (а) больше полярного (b) на 21389 км.
Дросселирование газов
Холодильные циклы без отдачи внешней работы (с дросселированием газа). Холодильные циклы с расширением сжатого газа в детандере.
Фигура Земли
В. В. Орлёнок, доктор геолого-минералогических наук Фигура Земли в первом приближении представляет собой эллипсоид вращения, у которого экваториальный радиус (а) больше полярного (b) на 21389 км. Отсюда полярное сжатие земного эллипсоида составляет
Рождение звезды
Когда плотность молекулярного облака (или отдельной его части) становится настолько большой, что гравитация преодолевает газовое давление, облако начинает неудержимо коллапсировать.
Обработка результатов эксперимента
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ КАФЕДРА МАТЕМАТИКИ СЕМЕСТРОВАЯ РАБОТА ПО СТАТИСТИКЕ
Расселл, Генри Норрис
Генри Норрис Расселл (Henry Norris Russell; 25 октября 1877, Ойстер-Бэй, штат Нью-Йорк, США — 18 февраля 1957, Принстон, Нью-Джерси, США) — американский астрофизик, разработавший одну из первых теорий эволюции звёзд, первым определил содержание химических элементов в атмосфере Солнца, получил оценки содержания химических элементов во Вселенной, занимался исследованием связи между спектрами звезд и их светимостью.
JPEG
Формат файла JPEG. Процесс сжатия изображения JPEG. Коэффициент архивации в JPEG.
Большой выбор с еще большим отсевом
Виртуальные ленточные библиотеки (Virtual Tape Libraries, VTL) предоставляют возможность постепенного перехода с ленточных накопителей на решение хранения данных, полностью базирующееся на жестких дисках.
Графика на ПК
Растровая и векторная графика. Графические редакторы. Форматы файлов для хранения растровых графических изображений. Все создаваемые с помощью компьютера изображения можно разделить на две большие части – растровую и векторную графику. Растровые изображения представляют собой однослойную сетку точек, называемых пикселами, каждая из которых может иметь определенный цвет.
Предмет и структура информатики
Б.В.Соболь Термин информатика получил распространение с середины 80-х гг. прошлого века. Он состоит из корня inform - «информация» и суффикса matics
архиватор WinRAR 8.0
Методичка по теме: «Архиваторы» 1. Что такое архивные файлы, для чего предназначены программы-архиваторы ? Архивные файлы – это документы, рисунки и др. файлы, которые специально сжаты (упакованы) с целью более рационального размещения на дискете или для передачи по электронной почте через интернет.
Графика на ПЭВМ
Графика на ПК Растровая и векторная графика. Графические редакторы. Форматы файлов для хранения растровых графических изображений. Все создаваемые с помощью компьютера изображения можно разделить на две большие части – растровую и векторную графику. Растровые изображения представляют собой однослойную сетку точек, называемых пикселами, каждая из которых может иметь определенный цвет.
Исследование истечения жидкости из отверстий и насадков
Сущность и особенности определения истечения жидкости из резервуара через отверстия и насадки. Понятие и виды степени сжатия струи. Основные характеристики насадков при турбулентных режимах течения. Описание экспериментальной установки напорного бака.
Общие сведения о грунтах
Скалистые грунты — массивные породы имеющие прочную связь слагающих частиц, имеют значительную прочность на сжатие и не промерзают, идеальная основа для фундамента.
Исаак Ньютон
Исаак Ньютон - великий английский физик, механик, астроном и математик. Высокое признание получили работы Ньютона, в которых он заложил основы научного понимания законов мироздания взамен фантастических домыслов религии.
Взрыв
Взрыв — это чрезвычайно быстрое, определяемое долями секунды горение, сопровождающееся выделением большого количества тепла, раскаленных газообразных продуктов и образованием большого давления.