Кодирование графических данных. Кодирование звуковой информации

Существует два основных способа кодирования графической информации: растровый и векторный.

Растровый способ кодирования характеризуется тем, что все изображение по вертикали и горизонтали разбивается на достаточно мелкие прямоугольники – так называемые элементы изображения, или пиксели (от англ. pixel – picture element). Чем меньше прямоугольники, тем больше разрешение (resolution), т. е. тем более мелкие детали изображения можно закодировать. Этот параметр измеряется в dpi (dots per inch – точек на дюйм). В зависимости от того, на какое графическое разрешение экрана настроена операционная система компьютера, на экране могут размещаться изображения 640х480, 800х600, 1024х768 и более.

У растровых изображений два основных недостатка. Во-первых, очень большие объемы данных. Для активных работ с большеразмерными иллюстрациями типа журнальной полосы требуются компьютеры с большими размерами оперативной памяти (128 Мбайт и выше). Во-вторых, растровые изображения невозможно значительно увеличить без серьезных искажений. Эффект искажения при увеличении точек растра называется пикселизацией.

Для каждого пикселя хранится информация о его цвете и координатах. За цвет пикселя принимается некоторое усредненное значение цвета в прямоугольнике. Цвет пикселя кодируется определенным количеством битов. Глубина цвета (Color Depth) это– количество бит, приходящихся на один пиксель. В разных системах кодирования под цвет пикселя отводится от 1 до 24 бит. Нетрудно сообразить, что если под цвет отводится всего один бит, мы получим черно-белое изображение. При использовании 8 бит число возможных цветов достигает 256, 16 бит – 65 536 цветов, 24 бит – 16 777 216 цветов.

Способ разделения цвета на составляющие называется цветовой моделью. В настоящее время разработано множество цветовых моделей: RGB, CMYK, HSB, Lab и т. д., каждая из которых имеет свою область практического применения.

Рассмотрим более подробно RGB-модель, наиболее часто применяемую в компьютерной графике. При этом способе кодирования любой цвет представляется в виде комбинации трех цветов: красного (Red), зеленого (Green) и синего (Blue), взятых с разной интенсивностью. Интенсивность каждого цвета кодируется 8 битами. Таким образом, для каждого основного цвета существует 256 различных значений интенсивности.

Видимый человеком свет имеет длину волны в довольно узком диапазоне — от 0,38 мкм до 0,72 мкм. А человеческий глаз имеет специальные рецепторы (называемые колбочками), чувствительные именно к цвету. При этом каждая из колбочек «специализируется» уже на своем, совсем узком, диапазоне длин волн.

Природа распорядилась так, что в человеческом глазе оказались колбочки трех типов, чувствительные к цветам, которые мы называем красным, зеленым и синим. (Собаки, например, способны воспринимать цвета в диапазоне волн, начинающемся в светло-синем участке спектра и немного захватывающем невидимый человеку ультрафиолет. Поэтому долгое время считалось, что у собак восприятие цвета черно-белое.)

Существует более практичный вариант CMY — система CMYK, в которой символ К означает черный цвет. Введение в эту цветовую систему черного цвета в качестве независимой основной цветовой переменной позволяет использовать недорогие красители. Систему CMYK часто называют четырехцветной, а результат ее применения — четырехцветной печатью. Во многих моделях точка, окрашенная в составной цвет, группируется из четырех точек, каждая из которых окрашена в один из основных цветов CMYK.

Данные в системе CMYK представляются либо цветовым триплетом, аналогичным RGB, либо четырьмя величинами. Если данные представлены цветовым триплетом, то отдельные цветовые величины противоположны величинам RGB. Так, для 24-битового пиксельного значения триплет (255,255,255) соответствует черному цвету, а триплет (0,0,0) — белому. Однако в большинстве случаев для представления цветов в системе CMYKиспользуется последовательность четырех величин.

Как правило, четыре цветовые составляющие CMYK задаются в процентах в диапазоне от 0 до 100.

Векторное кодирование

Векторный рисунок – это рисунок, который закодирован в виде набора простейших геометрических фигур, параметры которых (размеры, координаты вершин, углы наклона, цвет контура и заливки) хранятся в виде чисел. Векторный рисунок можно «разобрать» на части, растащив мышкой его элементы, а потом снова собрать полное изображение.

При векторном кодировании для отрезка хранятся координаты его концов, для прямоугольников и ломаных – координаты вершин. Окружность и эллипс можно задать координатами прямоугольника, в который вписана фигура.

Векторный способ кодирования рисунки обладает значительными преимуществами в сравнении с растровым тогда, когда изображение может быть полностью разложено на простейшие геометрические фигуры (например, чертеж, схема, карта, диаграмма). В этом случае при кодировании нет потери информации.

Объем файлов напрямую зависит от сложности рисунка – чем меньше элементов, тем меньше места занимает файл. Как правило, векторные рисунки значительно меньше по объему, чем растровые.

Самый главный недостаток этого метода – он практически непригоден для кодирования размытых изображений, например, фотографий.

Среди форматов векторных рисунков отметим следующие:

WMF (англ. Windows Metafile – метафайл Windows, файлы с расширением .wmf и .emf) – стандартный формат векторных рисунков в операционной системе Windows;

CDR (файлы с расширением .cdr) – формат векторных рисунков программы CorelDRAW;

AI (файлы с расширением .ai) – формат векторных рисунков программы Adobe Illustrator;
SVG (англ. Scalable Vector Graphics – масштабируемые векторные изображения, файлы с расширением .svg) – векторная графика для веб‐страниц.

Кодирование и обработка звуковой информации

Звуковая информация. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну с непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность звуковой волны, тем громче звук, чем больше частота волны, тем выше тон звука

Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук).

Человек может воспринимать звук в огромном диапазоне интенсивностей, в котором максимальная интенсивность больше минимальной в 10¹⁴ раз (в сто тысяч миллиардов раз). Для измерения громкости звука применяется специальная единица “децибел” (дбл) (табл. 5.1). Уменьшение или увеличение громкости звука на 10 дбл соответствует уменьшению или увеличению интенсивности звука в 10 раз.

Временная дискретизация звука. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть преобразован в цифровую дискретную форму с помощью временной дискретизации. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, для каждого такого участка устанавливается определенная величина интенсивности звука.

Таким образом, непрерывная зависимость громкости звука от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность “ступенек”

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате. Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации. Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее “лесенка” цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука – это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой “ступеньке” присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука – это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2^I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2^I = 2¹⁶ = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему – 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим “моно”). Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим “стерео”).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его. Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши. Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.

При сохранении звука в форматах со сжатием отбрасываются “избыточные” для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).