SlideShare a Scribd company logo
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
ИМ. А.Н.ТУПОЛЕВА

О. Г. МОРОЗОВ, Р. Р. САМИГУЛЛИН, Н. В. ДОРОГОВ, А. Р. НАСЫБУЛЛИН
ЦИФРОВАЯ ОБРАБОТКА АУДИО И ВИДЕОСИГНАЛОВ

Конспект лекций

КАЗАНЬ
2010
Инновационность




Предназначен
для
подготовки
студентов
обучающихся
по
профилю
подготовки
«Аудиовизуальная техника» направления 210400 «Радиотехника», а также для студентов вузов
соответствующих специальностей и инженерам,
специализирующихся в данной области.

Совместное рассмотрение методов и средств
цифровой обработки аудио и видео сигналов
в одном учебном пособии
Лекция 1
АНАЛОГО-ЦИФРОВОЕ
ПРЕОБРАЗОВАНИЕ СИГНАЛОВ

Аналоговый сигнал :

U (t ) = A0 sin ω (t )

Преобразование аналогового сигнала в
цифровой состоит из двух этапов:

дискретизации по времени

квантовании по амплитуде.

Дискретизация по времени, как правило,
означает что сигнал представляется
рядом своих отсчётов (дискретов)
непрерывных по амплитуде и взятых
через равные промежутки времени.
Квантование сигнала по амплитуде это
преобразование сигнала в сигнал со
ступенчатым изменением амплитуды.
Теорема Котельникова

f ä > 2Ω

где fд– частота с которой производятся
дискретизация по времени
Ω - верхняя частота в спектре
аналогового сигнала.

из теоремы Котельникова вытекают 2 следствия:

Любой аналоговый сигнал, может быть восстановлен с какой
угодно точностью по своим дискретным отсчётам, взятым с
частотой.

Если максимальная частота в сигнале превышает половину
частоты дискретизации, то способа восстановить сигнал из
дискретного в аналоговый без искажений не существует.
Параметры, определяющие характеристики
Аналого-цифровых преобразователей
(АЦП)
Статические параметры:



Разрешающая способность



Погрешность полной
шкалы

h = U пш /(2 N − 1)

δ ПШ =

ε ПШ
* 100%
U ПШ
Нелинейность - максимальное отклонение реальной характеристики
преобразования D(Uвх) от оптимальной.

εj
δЛ =
* 100%
U ПШ

δ ДЛ

hk − h
=
*100%
U ПШ

дифференциальная
нелинейность

Погрешность линейности характеристики
преобразования АЦП


Непропадание кодов - свойство АЦП выдавать все возможные
выходные коды, при изменении входного напряжения от
начальной до конечной точки диапазона преобразования.



Монотонность характеристики преобразования - это
неизменность знака приращения выходного кода D при
монотонном изменении входного преобразуемого сигнала.
Монотонность
не
гарантирует
малых
значений
дифференциальной нелинейности и непропадания кодов.



Температурная
нестабильность
АЦ-преобразователя
характеризуется температурными коэффициентами погрешности
полной шкалы и погрешности смещения нуля.



Динамические параметры. Возникновение динамических
погрешностей
связано
с
дискретизацией
сигналов,
изменяющихся во времени. Можно выделить следующие
параметры АЦП, определяющие его динамическую точность.


Максимальная частота дискретизации (преобразования) - это наибольшая
частота, с которой происходит образование выборочных значений сигнала, при
которой выбранный параметр АЦП не выходит за заданные пределы.
Измеряется числом выборок в секунду.



Время преобразования (tпр) - это время, отсчитываемое от начала импульса
дискретизации или начала преобразования до появления на выходе
устойчивого кода, соответствующего данной выборке.



Время выборки (стробирования) - время, в течение которого происходит
образование одного выборочного значения. При работе без УВХ равно времени
преобразования АЦП.



Шумы АЦ. В идеале, повторяющиеся преобразования фиксированного
постоянного входного сигнала должны давать один и тот же выходной код.
Однако, вследствие неизбежного шума в схемах АЦП, существует некоторый
диапазон выходных кодов для заданного входного напряжения.
Контрольные вопросы











Чем определяется выбор частоты дискретизации аналогового сигнала?
Какие два следствия вытекают из теоремы Котельникова?
Какие параметры определяют характеристики АЦП?
Что такое разрешающая способность АЦП?
Что такое погрешность полной шкалы АЦП?
Что такое погрешность смещения нуля АЦП?
Что такое погрешность линейности характеристики преобразования
АЦП?
Какие динамические параметра АЦП вы знаете
Лекция 2
Типы преобразования



Линейные АЦП. Большинство АЦП считаются линейными, хотя
аналого-цифровое преобразование по сути является нелинейным
процессом (поскольку операция отображения непрерывного
пространства в дискретное — операция нелинейная).



Нелинейные АЦП. Если бы плотность вероятности амплитуды
входного сигнала имела равномерное распределение, то отношение
сигнал/шум (применительно к шуму квантования) было бы
максимально возможным.
Классификация АЦП
Параллельные АЦП
АЦП прямого преобразования или параллельный АЦП.
содержит по одному компаратору на каждый дискретный
уровень входного сигнала.

Рис. Структурная схема параллельного АЦП
Последовательно-параллельные АЦП являются компромиссом между
стремлением получить высокое быстродействие и желанием сделать это по
возможности меньшей ценой. Последовательно-параллельные АЦП
занимают промежуточное положение по разрешающей способности и
быстродействию между параллельными АЦП и АЦП последовательного
приближения. Последовательно-параллельные АЦП подразделяют на
многоступенчатые, многотактные и конвеерные .
МНОГОСТУПЕНЧАТЫЕ ПОСЛЕДОВАТЕЛЬНО-ПАРАЛЛЕЛЬНЫЕ АЦП
Многотактные последовательно-параллельные АЦП
Конвеерные АЦП. Быстродействие многоступенчатого АЦП можно повысить,
применив конвеерный принцип многоступенчатой обработки входного сигнала.

Диаграмма работы конвеерного
АЦП
Контрольные вопросы










Что обозначает термин линейный применительно к АЦП?
Что значит нелинейный АЦП?
Как классифицируются АЦП?
Что такое параллельные АЦП?
Перечислите все типы последовательно-параллельных АЦП.
В чем преимущество многоступенчатых последовательнопараллельных АЦП?
Нарисуйте схему конвейерного АЦП.
В чем “плюсы” и “минусы” использования конвейерного АЦП?
Лекция 3
АЦП последовательные
АЦП последовательного счета.

Структурная схема АЦП последовательного счета

f пр. макс. = (2

N

− 1) / f такт.

Например, при N=10 и fтакт=1 МГц tпр.макс=1024 мкс, что обеспечивает
максимальную частоту выборок порядка 1 кГц.
АЦП последовательного приближения (рис.) или АЦП с поразрядным
уравновешиванием.

Структурная схема АЦП последовательного приближения
Интегрирующие АЦП.
Недостатком рассмотренных выше последовательных АЦП является низкая
помехоустойчивость результатов преобразования. Действительно, выборка
мгновенного значения входного напряжения, обычно включает слагаемое в виде
мгновенного значения помехи. Впоследствии при цифровой обработке
последовательности выборок эта составляющая может быть подавлена, однако на
это требуется время и вычислительные ресурсы. В АЦП, рассмотренных ниже,
входной сигнал интегрируется либо непрерывно, либо на определенном
временном интервале, длительность которого обычно выбирается кратной
периоду помехи. Это позволяет во многих случаях подавить помеху еще на этапе
преобразования. Платой за это является пониженное быстродействие
интегрирующих АЦП.
АЦП многотактного интегрирования.
Упрощенная схема АЦП работающего в два основных такта (АЦП двухтактного
интегрирования), приведена на рис.
Время интегрирования входного напряжения t1 постоянно; в качестве таймера
используется счетчик с коэффициентом пересчета Kсч, так что:

t1 =

K сч
f так.

К моменту окончания интегрирования выходное напряжение интегратора
составляет:

U вх.ср К сч
1 t1
U И (t1 ) = −
∫ U вх (t )dt = −
RC 0
f такт RC
где Uвх.ср. - среднее за время t1 входное напряжение.
Интервал времени, в котором проходит стадия счета, определяется уравнением

1 t1 +t2
U И (t1 ) +
∫U ОП dt = 0
RC t1
t2 =

n2
f такт

где n2 - содержимое счетчика
после
окончания стадии
счета, получим результат:

n2 =
Временные диаграммы АЦП
двухкратного интегрирования

U вх.ср К сч
U оп
Сигма-дельта АЦП (или АЦП с уравновешиванием или балансом зарядов).

Структурная схема сигма-дельта модулятора

Структурная схема сигма-дельта АЦП
ПРЕОБРАЗОВАТЕЛИ НАПРЯЖЕНИЕ-ЧАСТОТА

Структурная схема ПНЧ

Структурная схема АЦП на основе
ПНЧ
Контрольные вопросы
Перечислите все типы последовательных АЦП.

•

Объясните принцип работы АЦП последовательного счета по структурной
схеме.
•

От чего зависит время преобразования АЦП последовательного счета?

•

Объясните принцип действия АЦП последовательного приближения.

•

Перечислите все типы интегрирующих АЦП.

•

Какая отличительная особенность метода многотактного интегрирования?

•

Какой принцип лежит в основе сигма-дельта АЦП.

•

Нарисуйте схему
напряжение - частота.
•

АЦП

построенного

по

принципу

преобразователя
Лекция 4
Особенности преобразование аудиосигналов в цифровую форму.

показан период гармонического колебания (справа)
и соответствующий ему двоично-дополнительный код (слева).
Линейное квантование по амплитуде
шум квантования

ξ Ш КВ ≤

∆
2

Линейное квантование
по уровню:
а) амплитудная
характеристика;
б) шумы квантования.
Нелинейное квантование по амплитуде

Нелинейное
квантование
по уровню:
а) амплитудная
характеристика;
б) шумы квантования.
Выбор частоты дискретизации аудиосигнала
выбор частоты дискретизации при операции аналого-цифрового преобразования
должен подчиняться теореме Котельникова-Шэннона-Найквиста.

Система
Телефония
Компакт-диск
Профессиональная
аудиосистема
DVD аудио

Частота дискретизации, Гц
8000
44100
48000
96000
(для 6-канального
аудиосигнала)
Контрольные вопросы
Что вносит дискретизация в спектр исходного сигнала если ее частота
выбрана согласно теореме Котельникова?
•

Что называют шумом (ошибкой) квантования АЦП?

•

От каких параметров зависит величина шума квантования?

•

Какой цифровой код используют при оцифровке аудиосигнала и почему?

•

Что такое «линейное квантование по амплитуде»?

•

Что такое «нелинейное квантование по амплитуде»?

•

Назовите некоторые типовые значения частот дискретизации, используемые
в широкораспространенных системах.
•

Какой объем будет занимать аудиофайл длительностью 10 мин в формате
ИКМ
•
Лекция 5
Цифровое сжатие
Сжатие данных (англ. data compression) — алгоритмическое
преобразование данных, производимое с целью уменьшения их объёма.
Применяется для более рационального использования устройств хранения и
передачи данных. Синонимы — упаковка данных, компрессия, сжимающее
кодирование, кодирование источника.
Сжатие основано на устранении избыточности, содержащейся в
исходных данных. В основе любого способа сжатия лежит модель источника
данных, или, точнее, модель избыточности. Иными словами, для сжатия данных
используются некоторые априорные сведения о том, какого рода данные
сжимаются. Простейшим примером избыточности является повторение в тексте
фрагментов (например, слов естественного или машинного языка). Подобная
избыточность обычно устраняется заменой повторяющейся последовательности
ссылкой на уже закодированный фрагмент с указанием его длины. Другой вид
избыточности связан с тем, что некоторые значения в сжимаемых данных
встречаются чаще других. Сокращение объёма данных достигается за счёт замены
часто встречающихся данных короткими кодовыми словами, а редких —
длинными (энтропийное кодирование). Сжатие данных, не обладающих
свойством избыточности (например, случайный сигнал или шум, зашифрованные
сообщения), принципиально невозможно без потерь.
В целом все существующие методы кодирования аудиоинформации можно
условно разделить всего на два типа.
1. Сжатие данных без потерь (lossless coding) - это способ кодирования
(уплотнения) цифровой аудиоинформации, позволяющий осуществлять 100%-ное
восстановление исходных данных из сжатого потока (под понятием "исходные
данные" здесь подразумевается исходный вид оцифрованных аудиоданных). К
такому способу уплотнения данных прибегают в случаях, когда требуется
абсолютное сохранение качества оригинального звучания аудиоданных.
Существующие сегодня алгоритмы сжатия без потерь позволяют сократить
занимаемый данными объем на 20-50%. Механизмы работы подобных кодеров
сходны с механизмами работы архиваторов общих данных, таких, как, например,
ZIP или RAR, но при этом адаптированы специально для сжатия аудиоданных10.
Кодирование без потерь, хотя и идеально с точки зрения сохранности качества
аудиоматериалов, неспособно обеспечить высокий уровень компрессии.
2. Сжатие данных с потерями (lossy coding). Цель такого кодирования достижение любыми путями максимально высокого коэффициента компрессии
данных при сохранении качества их звучания на приемлемом уровне. В основе
идеи кодирования с потерями лежат два простых основополагающих
соображения:
•исходные
цифровые аудиоданные избыточны - они содержат много
бесполезной для слуха информации, которую можно удалить, повысив тем самым
коэффициент компрессии;
•требования к качеству звучания аудиоматериала могут быть разными и
зависят от конкретных целей и сфер использования.
Характеристики алгоритмов сжатия и их применимость.
Коэффициент сжатия — основная характеристика алгоритма сжатия. Она
определяется как отношение объёма исходных несжатых данных к объёму сжатых,
то есть:
k = So/Sc,
где k — коэффициент сжатия, So — объём исходных данных, а Sc — объём
сжатых.
Таким образом, чем выше коэффициент сжатия, тем алгоритм эффективнее.
Следует отметить:
если k = 1, то алгоритм не производит сжатия, то есть выходное сообщение
оказывается по объёму равным входному;
если k < 1, то алгоритм порождает сообщение большего размера, нежели
несжатое, то есть, совершает «вредную» работу.
Ситуация с k < 1 вполне возможна при сжатии. Принципиально невозможно
получить алгоритм сжатия без потерь, который при любых данных образовывал
бы на выходе данные меньшей или равной длины. Обоснование этого факта
заключается в том, что поскольку число различных сообщений длиной n бит
составляет ровно 2n, число различных сообщений с длиной меньшей или равной n
(при наличии хотя бы одного сообщения меньшей длины) будет меньше 2 n. Это
значит, что невозможно однозначно сопоставить все исходные сообщения
сжатым: либо некоторые исходные сообщения не будут иметь сжатого
представления, либо нескольким исходным сообщениям будет соответствовать
одно и то же сжатое, а значит их нельзя отличить.
Коэффициент сжатия может быть как постоянным (некоторые алгоритмы
сжатия звука, изображения и т. п., например А-закон, μ-закон, ADPCM, усечённое
блочное кодирование), так и переменным. Во втором случае оценён по некоторым
критериям:
•средний (обычно по некоторому тестовому набору данных);
•максимальный (случай наилучшего сжатия);
•минимальный (случай наихудшего сжатия);
Коэффициент сжатия с потерями при этом сильно зависит от допустимой
погрешности сжатия или качества, которое обычно выступает как параметр
алгоритма. В общем случае постоянный коэффициент сжатия способны
обеспечить только методы сжатия данных с потерями.
Допустимость потерь. Основным критерием различия между алгоритмами
сжатия является описанное выше наличие или отсутствие потерь, в то время как
возможность применения сжатия с потерями должна быть обоснована. Для
некоторых типов данных искажения не допустимы в принципе. В их числе:
•символические
данные, изменение которых неминуемо приводит к
изменению их семантики: программы и их исходные тексты, двоичные массивы и
т. п.;
•жизненно
важные данные, изменения в которых могут привести к
критическим ошибкам: например, получаемые с медицинской измерительной
аппаратуры или контрольных приборов летательных, космических аппаратов и т.
п.;
многократно подвергаемые сжатию и восстановлению промежуточные
данные при многоэтапной обработке графических, звуковых и видеоданных.
Системные требования алгоритмов. Различные алгоритмы могут
требовать различного количества ресурсов вычислительной системы, на которых
они реализованы:
•оперативной памяти (под промежуточные данные);
•постоянной памяти (под код программы и константы);
•процессорного времени.
Алгоритмы сжатия данных неизвестного формата. Имеется два
основных подхода к сжатию данных неизвестного формата.
На каждом шаге алгоритма сжатия очередной сжимаемый символ либо
помещается в выходной буфер сжимающего кодера как есть (со специальным
флагом, помечающим, что он не был сжат), либо группа из нескольких сжимаемых
символов заменяется ссылкой на совпадающую с ней группу из уже
закодированных символов. Поскольку восстановление сжатых таким образом
данных выполняется очень быстро, такой подход часто используется для создания
самораспаковывающихся программ.
Для каждой сжимаемой последовательности символов однократно либо в
каждый момент времени собирается статистика её встречаемости в кодируемых
данных. На основе этой статистики вычисляется вероятность значения очередного
кодируемого символа (либо последовательности символов). После этого
применяется та или иная разновидность энтропийного кодирования, например,
арифметическое кодирование или кодирование Хаффмана, для представления
часто встречающихся последовательностей короткими кодовыми словами, а редко
встречающихся — более длинными.
Контрольные вопросы
Что такое цифровое сжатие?

•

Назовите характеристики алгоритмов сжатия и их применимость.

•

В чем может заключаться избыточность в компрессированных сигналах?

•

Что характеризует коэффициент сжатия?

•

Какой механизм работы сжатия без потерь?

•

Какие ограничения накладываются на сжатие с потерями?

•

Какие два основных подхода к сжатию данных неизвестного формата?

•

Системные требования алгоритмов.

•
Лекция 6
Цифровое представление звукового сигнала при записи
Цифровая обработка звукового сигнала при записи
Импульсно-кодовая
модуляция
(ИКМ)
является
наиболее
распространенной формой цифрового представления аудиосигнала. Полученный
в результате преобразования PCM-поток (PCM - Pulse Code Modulation), может
быть как параллельным, когда все биты каждого отсчета передаются
одновременно по нескольким линиям с частотой дискретизации, так и
последовательным, когда биты передаются друг за другом с более высокой
частотой по одной линии.
Структура записываемой информации. Обычно каждый 16-разрядный
отрезок называется словом, которое обычно раскладывают на два символа,
каждый из которых содержит 8 разрядов (бит).
Формирование кадра записи. Для того чтобы в проигрывателе CD можно было
распознавать цифровые данные закодированного сигнала, необходимо эти данные
организовать в определенные образы. Во всех CD образ имеет блочную кадровую
структуру.
Кадр − информационный блок, включающий по шесть выборок звукового
сигнала каждого канала. кадр состоит из 12 слов (по 6 слов на канал). выборки
звукового сигнала осуществляются с частотой 44,1 кГц. В результате первого
мультиплексирования - уже 88,2 кГц, в результате частота кадров, состоящих из 12
слов каждый, составляет 88,2/12=7,35 кГц.
Биты (символы
паритета)
Левый

ФНЧ

УВХ

АЦП

Входной
аудиосигнал
Правый

ФНЧ

УВХ

АЦП

Первый
мультиплексор

CIRCкоде
р

41,1 кГц

Кодер сигналов
контроля и
дисплей

Синхрогенера
тор

Сигнал таймера

Биты (символы
данных)
Модулятор
канала

Генератор
таймера

Лазер записи

Рис. Процесс записи аудиоинформации на CD

Выходные
последовательные
данные на лазер

Мастер-копия
компакт диска
CIRC-кодер. Схема CIRC-кодера выполняет две функции. Одна
функция схемы − разложить каждое 16-разрядное слово на два 8-разрядных
символа. В течение процесса разложения эти символы подвергаются чередованию
(interleaving) в определенном порядке. В результате чередования непрерывный
музыкальный сигнал оказывается «разбросанным» по разным местам
информационной дорожки CD. Такое «разбрасывание» сигнала по площади CD
делается для повышения помехоустойчивости и достоверности воспроизведения.
Если информационные символы в каком-то месте CD будут повреждены или
«прочитаны» звукоснимателем ошибочно, это не приведет к дефекту, заметному
для слушателя, поскольку ошибочные символы, находящиеся на информационной
дорожке, относятся к различным (по времени) местам записанной музыкальной
программы.
Другая функция схемы CIRC-кодера − обеспечить метод, которым
проигрыватель CD может проверять ошибки в потоке данных. Ошибки в потоке
данных могут возникать как из-за некачественных компакт-дисков, так и из-за
сбоев в процессе считывания информации в устройствах и схемах проигрывателя.
Из-за этих сбоев считывания возникают прерывания полезного сигнала, так
называемые «выпадения». В аналоговой технике такой эффект выпадения
приводит лишь к кратковременному пропуску сигнала и не оказывает влияния на
дальнейшую работу. В случае ИКМ, однако, «выпадения» при воспроизведении
прослушиваются в виде раздражающих пульсирующих шорохов, которые
называют ошибками кодирования.
Канальное кодирование. При записи луч лазера фокусируется на поверхности
в пятно определенных размеров. Получаемый при этом пит имеет также
определенный размер, зависящий от характеристик записывающего лазера. В
принципе минимальный по размеру пит будет отображать только одну единицу
информации (один бит). Однако существуют способы, при которых такой
минимальный пит будет отображать не один бит, а больше. Такие способы
преобразования называются канальным кодированием.

Рис. Фрагмент таблицы EFM-кода
Декодирование информации, записанной на CD. Основным узлом
декодера является фотодетектор, который преобразует оптический сигнал,
считанный с CD, и преобразует его в три основных функциональных
электрических сигнала: - информационного; - автофокусировки; - отслеживания
(трекинга), обеспечивающего точное сопровождение лазерного луча по дорожке
записи диска.
Схема
питания
лазера

Лазерная
оптическая
система

Фотодиодная матрица

ERCO

Схема
интерполяции и
блокировки

Система
автофокусироваки и
радиального трекинга

Тактовая
схема

Предусилитель ВЧ
сигнала (EFM)

Синхро
генератор

EFM-демодулятор

Цифровой фильтр и
демультиплексор

ЦАП

ЦАП

Усилител
ь

Усилител
ь

Левый аудиоканал

Правый
аудиоканал

Mute
Декодер
сигналовконтроля и
дисплея

Панель
управления

Панель
дисплея

Системный
контроллер

Усилитель серводвигателя вращения диска
Контрольные вопросы
Что называют импульсно-кодовой модуляцией?

•

Структура
модуляцией.
•

записываемой

информации

при

импульсно-кодовой

Что такое «Кадр записи» при импульсно-кодовой модуляции?

•

Какое преимущество использования EFM-модуляции?

•

Зачем нужен CIRC-кодер?

•

Какой метод используется в CD проигрывателях для распознавания
ошибок.
•

Что такое канальное кодирование?

•

Декодирование информации записанной на CD.

•
Лекция 7
Демодуляция EFM сигналов

≈ 600мВ

3Т 5Т 7Т 9Т 11Т
4Т 6Т 8Т 10Т
Сигнал EFM на выходе ВЧ-предусилителя
Нормализованный EFM-сигнал поступает на дальнейшее декодирование.
Декодер в проигрывателе CD представляет собой сочетание различных схемных
устройств, выполняющих целый ряд функций:
− восстановление тактового сигнала данных;
− восстановление синхронизирующего образа из потока данных для
синхронизации всей системы;
− демодуляция EFM-сигнала;
− разделение цифровых сигналов на аудиоинформацию и информацию
субкода;
− восстановление первоначальной последовательности (деперемежение);
− коррекция ошибок;
− интерполяция цифровых сигналов;
− демультиплексирование цифровых сигналов;
− восстановление цифрового аудиосигнала в первоначальный аналоговый
аудиосигнал.
Исходная
форма

•

•

•

•

•

•
•

•

•

1 2 3 4 5 6 7 8 9 10

•

•

•

•

•

•

•

•

•

•

1 2 3 4 5 6 7 8 9 10

Выборка
данных на CD

1 2 3 4 5 6 7 8 9 10
Данные после
прочтения

1 2 3 4 5 6 7 8 9 10

Выпадение

1 2 3 4 5 6 7 8 9 10

1 2 3 4 5 6 7 8 9 10

Данные после
деперемежения

1 2 3 4 5 6 7 8 9 10

а)

1 2 3 4 5 6 7 8 9 10

б)

Рис. Принцип перемежения и деперемежения: а − без чередования, б − с чередованием

•
Можно использовать три метода устранения воздействия выпадения сигнала
на воспроизведение.
Первый метод − метод блокировки − основан на том, что дефектное слово
блокируется и заменяется просто нулевым значением.
При втором методе ошибочное слово обнаруживается при выполнении
предварительной записи-захвата, и ложное слово заменяется предыдущим, так
что при этом не возникает практически никакого слышимого отличия при
воспроизведении.
И, наконец, лучшую компенсацию выпадения можно осуществить с помощью
линейной интерполяции. В этом случае при распознавании ошибочного слова
оно заменяется словом, имеющим значение, усредненное между предыдущим и
последующим значениями; компенсация ошибки оказывается настолько точной,
что отличить на слух воспроизведенный аудиосигнал от первоначального не
представляется возможным.
Восстановленный в правильной последовательности и скорректированный
поток цифровых аудиоданных подается на цифровой фильтр и схему
демультиплексирования. Цифровая фильтрация обеспечивает более высокое
качество воспроизведения, чем в обычных проигрывателях.
Цифровые фильтры формируют из цифровых звуковых сигналов с частотой
выборки 44,1 кГц цифровые сигналы с частотой выборки, кратной основной
частоте.
Контрольные вопросы
Демодуляция EFM сигналов.

•

Какие этапы проходит сигнал после EFM-демодулятора?

•

CIRC-декодер.

•

Что такое перемежение выборок?

•

Что такое деперемежение выборок?

•

Какой принцип узкополосной фазовой синхронизации?

•

Роль ОЗУ в проигрывателях CD.

•

Какие методы компенсации выпадения сигнала используются в
проигрывателях CD?
•
Лекция 8
Форматы сжатия аудиосигналов
Формат сжатия звука MP3. MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3
(но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) —
лицензируемый формат файла для хранения аудио-информации.

Описание формата. В этом формате звуки кодируются частотным
образом (без дискретных партий); есть поддержка стерео, причём в двух
форматах (подробности — ниже). MP3 является форматом сжатия с потерями,
то есть часть звуковой информации, которую (согласно психоакустической
модели) ухо человека воспринять не может или воспринимается не всеми
людьми, из записи удаляется безвозвратно. Степень сжатия можно варьировать,
в том числе в пределах одного файла. Интервал возможных значений битрейта
составляет 8 — 320 кбит/c. Для сравнения, поток данных с обычного компактдиска формата Audio-CD равен 1411,2 кбит/c при частоте дискретизации 44100
Гц.
MP3 и «качество Audio-CD». было распространено мнение, что запись с
битрейтом
128
кбит/c
подходит
для
музыкальных
произведений,
предназначенных для прослушивания большинством людей, обеспечивая
качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых,
качество полученного MP3 зависит не только от битрейта, но и от кодирующей
программы (кодека). Во-вторых, помимо превалирующего режима CBR (Constant
Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио
кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate —
усредненный битрейт) и VBR (Variable Bitrate — переменный битрейт). В-третьих,
граница 128 кбит/c является условной.
Режимы кодирования и опции. Существует три версии MP3 формата для
различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными
диапазонами битрейта и частоты дискретизации:
32—320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц
для MPEG-1 Layer 3;
•

16—160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц
для MPEG-2 Layer 3;
•

8—160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5
Layer 3.
•
Режимы управления кодированием звуковых каналов. Так как
формат MP3 поддерживает двухканальное кодирование (стерео), существует 4
режима:
•Стерео — двухканальное кодирование, при котором каналы исходного
стереосигнала кодируются независимо друг от друга, но распределение бит между
каналами в общем битрейте может варьироваться в зависимости от сложности
сигнала в каждом канале.
•Моно — одноканальное кодирование. Единственным плюсом данного
режима может являться только выходное качество по сравнению с режимом
Стерео при одинаковом битрейте, так как на один канал приходится вдвое
большее количество бит, чем в режиме Стерео.
•Двухканальный
— два независимых канала, например звуковое
сопровождение на разных языках. Битрейт делится на два канала. Например, если
заданный битрейт 192 кбит/c, то для каждого канала он будет равен только 96
кбит/c.
•Объединённое стерео (Joint Stereo) — оптимальный способ двухканального
кодирования. Например, в одном из режимов Объединённое стерео левый и
правый каналы преобразуются в их сумму (L+R) и разность (L-R). Для
большинства звуковых файлов насыщеность канала с разностью (L-R) получается
намного меньше канала с суммой (L+R). Поэтому Объединённое стерео позволяет
либо сэкономить на битрейте канала (L-R) или улучшить качество на том же
битрейте, поскольку на канал суммы (L+R) отводится большая часть битрейта. Но
современные кодеки используют различные схемы в разных фреймах (включая
чистое стерео) в зависимости от исходного сигнала.
CBR. CBR расшифровывается как Constant Bit Rate, то есть Постоянный
битрейт, который задается пользователем и не изменяется при кодировании
произведения. Таким образом каждой секунде произведения соответствует
одинаковое количество закодированных бит данных (даже при кодировании
тишины). CBR может быть полезен для потоков мультимедиа данных по
ограниченному каналу; в таком случае кодирование использует все возможности
канала данных. Для хранения данный режим кодирования не является
оптимальным, так как он не может выделить достаточно места для сложных
отрезков исходного произведения, при этом бесполезно тратя место на простых
отрезках. Повышенные битрейты (выше 256 кбит/c) могут решить данную
проблему, выделив больше места для данных, но – увеличивая размер файла.
VBR. VBR расшифровывается как Variable Bit Rate, то есть Варьирующийся
Битрейт или Переменный Битрейт, который динамически изменяется
программой-кодером при кодировании, в зависимости от насыщенности
кодируемого аудиоматериала и установленного пользователем качества
кодирования (например, тишина закодируется с минимальным битрейтом).
Аудиоматериал разной насыщенности может быть закодирован с определенным
качеством, которое обычно выше, чем при установке среднего значения в методе
CBR. Минусом данного метода кодирования является сложность предсказания
размера выходного файла. Но этот недостаток VBR-кодирования незначителен в
сравнение с его достоинствами. Также минусом является то, что VBR считает
«незначительной» звуковой информацией более тихие фрагменты, таким образом
получается, что если слушать очень громко, то эти фрагменты будут
некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и
громкие фрагменты.
ABR. ABR расшифровывается как Average Bit Rate, то есть Усредненый
Битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задается
пользователем, а программа варьирует его, постоянно подгоняя под заданный
битрейт. Таким образом, кодер будет с осторожностью использовать максимально
и минимально возможные значения битрейта, так как рискует не вписаться в
заданный пользователем битрейт. Это явный минус данного метода, так как
сказывается на качестве выходного файла, которое будет немного лучше CBR, но
намного хуже VBR. С другой стороны, этот метод позволяет наиболее гибко
задавать битрейт (
Теги. Метки в границах mp3-файла (в начале иили в конце). Существуют
различные версии тегов.
Недостатки формата. MP3 является лидером по распространённости, но
при этом не является лучшим по техническим параметрам. Существуют форматы,
позволяющие добиться большего качества при одинаковом размере файла, такие
как Vorbis, AAC.
Юридические ограничения. Для свободного использования формата
существуют патентные ограничения. Компания Alcatel-Lucent обладает правами на
MP3 и получает отчисления от тех, кто использует этот формат — производителей
плееров и мобильных телефонов. Из-за этого лицензионная чистота формата под
вопросом. В частности, Alcatel-Lucent предъявила претензии компании Microsoft
за то, что в Windows была встроена поддержка MP3. Однако срок действия
патентов на технологию заканчивается в 2010 году, после чего любая компания
сможет использовать её свободно.
Формат сжатия звука OGG Vorbis. Vorbis — свободный формат сжатия
звука с потерями, официально появившийся летом 2002 года. Психоакустическая
модель, используемая в Vorbis, по принципам действия близка к MPEG Audio Layer
III и подобным, однако математическая обработка и практическая реализация
этой модели существенно отличаются, что позволило авторам объявить свой
формат совершенно независимым от всех предшественников.
Кодирование.. По всевозможным оценкам является вторым по популярности
форматом компрессии звука с потерями. Широко используется в компьютерных
играх и в файлообменных сетях для передачи музыкальных произведений.По
заявлению
разработчиков,
Vorbis
применяет
более
качественную
психоакустическую модель, чем его конкуренты, дающую лучшую чёткость
воспроизведения при равной плотности потока. В результате сжатый
музыкальный файл окажется в два раза меньше (или в два раза лучше), чем у MP3.
Он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц
и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с
потерями), поэтому Vorbis великолепно подходит для кодирования 6-канального
звука DVD-Audio.
К тому же, формат Vorbis — «sample accurate». Это гарантирует, что звуковые
данные перед кодированием и после декодирования не будут иметь смещений,
дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете
non-stop музыку (когда один трек постепенно переходит в другой) — в итоге
сохранится целостность звука.
Метаданные. Формат изначально разрабатывался с возможностью
потокового вещания. Это даёт формату достаточно полезный побочный эффект —
в одном файле можно хранить несколько композиций с собственными тегами. При
загрузке такого файла в плеер должны отобразиться все композиции, будто их
загрузили из нескольких различных файлов.
Битрейт. Ogg Vorbis по умолчанию использует переменный битрейт, при
этом значения последнего не ограничены какими-то жёсткими значениями, и он
может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом
жёстко не ограничен максимальный битрейт, и при максимальных настройках
кодирования он может варьировать от 400 kbps до 700 kbps. Такой же гибкостью
обладает частота дискретизации — пользователям предоставляется любой выбор в
пределах от 2 кГц до 192 кГц.
Преимущества формата Vorbis
•Отсутствие патентных ограничений.
•До 255 каналов.
•Частота дискретизации до 192 кГц.
•Разрядность до 32 бит.
•«Sample
accurate» — звуковые данные не будут иметь
дополнительных или потерянных сэмплов относительно друг друга.
•«Streamable» — поддержка поточного воспроизведения.
•Эффективные алгоритмы переменного битрейта.
•Гибкий Joint stereo.
•Мощная и гибкая психоакустическая модель.
•Теги хранятся в Юникоде, а не национальной кодировке.

смещений,
Контрольные вопросы
Формат сжатия звука MP3.

•

Назовите недостатки формата MP3.

•

Какие диапазоны битрейта и частоты дискретизации предусмотрены в
формате MP3?
•

Какие режимы управления кодированием звуковых каналов существуют в
MP3?
•

Что такое CBR и VBR?

•

Формат сжатия звука OGG Vorbis.

•

Какие требования накладываются на битрейт в формате OGG Vorbis?

•

Назовите основные преимущества формата Vorbis.

•
Лекция 9
Формат сжатия звука Windows Media Audio. Windows Media Audio —
лицензируемый формат файла, разработанный компанией Microsoft для хранения
и трансляции аудио-информации.
Форматы сжатия звука FLAC. FLAC (англ. Free Lossless Audio Codec —
свободный аудио-кодек без потерь) — популярный свободный кодек для сжатия
аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3, FLAC не удаляет
никакой информации из аудиопотока и подходит как для прослушивания
музыки на высококачественной звуковоспроизводящей аппаратуре, так и для
архивирования аудиоколлекции. На сегодня формат FLAC поддерживается
многими аудиоприложениями.
Аудиопоток. Основными частями потока являются:
•Строка из четырёх байтов «fLaC»
•Блок метаданных STREAMINFO
•Другие необязательные блоки метаданных
•Аудио фреймы
Первые четыре байта идентифицируют поток FLAC. Следующие за ними
метаданные содержат информацию о потоке, затем идут сжатые аудиоданные.
Метаданные. FLAC определяет несколько типов блоков метаданных (все они
перечислены на странице формата). Блоки метаданных могут быть любого
размера, новые блоки могут быть легко добавлены. Декодер имеет возможность
пропускать неизвеcтные ему блоки метаданных. Обязателен только блок
STREAMINFO. Другие блоки предназначены для резервирования места, хранения
таблиц точек поиска, тегов, список разметки аудиодисков, а также данных для
конкретных приложений.
Аудиоданные. За метаданными следуют сжатые аудиоданные. Метаданные и
аудиоданные не чередуются. Как и большинство кодеков, FLAC делит входной
поток на блоки и кодирует их независимо друг от друга.
Разбиение на блоки. Размер блока — очень важный параметр для
кодирования. Если он очень мал, то в потоке будет слишком много заголовков
фреймов, что уменьшит уровень сжатия. Если размер большой, то кодер не сможет
подобрать эффективную модель сжатия.
Межканальная декорреляция. Если на вход поступают стерео аудиоданные,
они могут пройти через стадию межканальной декорреляции. Правый и левый
канал преобразуются к среднему и разностному по формулам: средний = (левый +
правый)/2, разностный = левый — правый. В отличие от joint stereo этот процесс
не приводит к потерям. Для данных с аудио компакт-дисков это обычно приводит
к значительному увеличению уровня сжатия.
Моделирование. На следующем этапе кодер пытается аппроксимировать
сигнал такой функцией, чтобы полученный после её вычитания из оригинала
результат (называемый разностью, остатком, ошибкой) можно было закодировать
минимальным количеством битов. Параметры функций тоже должны
записываться, поэтому они не должны занимать много места. FLAC использует два
метода формирования аппроксимаций:
•подгонка простого полинома к сигналу
•общее кодирование с линейными предикторами (LPC).
Остаточное кодирование. Когда модель подобрана, кодер вычитает
приближение из оригинала, чтобы получить остаточный (ошибочный) сигнал,
который затем кодируется без потерь. Для этого используется то обстоятельство,
что разностный сигнал обычно имеет распределение Лапласа и есть набор
специальных кодов Хаффмана, называемый кодами Райса, позволяющий
эффективно и быстро кодировать эти сигналы без использования словаря.
Составление фреймов. Аудиофрейму предшествует заголовок, который
начинается с кода синхронизации и содержит минимум информации,
необходимой декодеру для воспроизведения потока. Сюда также записывается
номер блока или сэмпла и восьмибитная контрольная сумма самого заголовка.
Код синхронизации, CRC заголовка фрейма и номер блока/сэмпла позволяют
осуществлять пересинхронизацию и поиск даже в отсутствие точек поиска. В
конце фрейма записывается его шестнадцатибитная контрольная сумма. Если
базовый декодер обнаружит ошибку, будет сгенерирован блок тишины.
Формат сжатия звука AAC. AAC (англ. Advanced Audio Coding) —
собственнический (патентованный) формат аудиофайла с меньшей потерей
качества при кодировании, чем MP3 при одинаковых размерах. Формат также
позволяет сжимать без потери качества исходника (профиль ALAC AAC).
Основные этапы работы AAC.
1. Удаляются невоспринимаемые составляющие сигнала.
2. Удаляется избыточность в кодированном аудио сигнале.
3. Затем сигнал обрабатывается по методу MDCT согласно его сложности.
4. Добавляются коды коррекции внутренних ошибок.
5. Сигнал сохраняется или передаётся.
Аудио стандарт MPEG-4 не требует единственного или малого набора
высокоэффективных схем компрессии, а скорее сложный набор для выполнения
широкого круга операций от кодирования низкокачественной речи до
высококачественного аудио и синтезирования музыки.
Семейство алгоритмов аудио кодирования MPEG-4 охватывает диапазон от
кодирования низкокачественной речи (до 2 кбит/с) до высококачественного аудио
(от 64 кбит/с на канал и выше).
•AAC имеет частоту сэмплов от 8 Гц до 96 кГц и количество каналов от 1 до 48.
•В
отличие от гибридного набора фильтров MP3, AAC использует
Модифицированное Дискретное Косинусное Преобразование (MDCT) вместе с
увеличенным размером «окна» в 2048 пунктов. AAC более подходит для
кодирования аудио с потоком сложных импульсов и прямоугольных сигналов, чем
MP3.
•
AAC может динамически переключаться между длинами блоков MDCT от
2048 пунктов до 256.
•Если происходит единственная или кратковременная смена, используется
малое «окно» в 256 пунктов для лучшего разрешения.
•По умолчанию используется большое 2048-пунктовое «окно» для улучшения
эффективности кодирования.
•Превосходства AAC над MP3
•Частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц — 48 кГц)
•До 48 звуковых каналов
•Большая эффективность кодирования при постоянном битрейте
•Большая эффективность кодирования при переменном битрейте
Более гибкий режим Joint stereo Всё это означает, что слушатель получает
улучшенное и более стабильное качество звука, чем при MP3 с таким же или
меньшим битрейтом.
Профили.
Low Complexity (MPEG-2/MPEG-4 AAC-LC)

•

Main Profile

•

High Efficiency AAC (MPEG-4 HE-AAC)

•

Scalable Sample Rate (SSR)

•

Long Term Prediction (LTP) — более сложный и ресурсоёмкий (сл-но

•

качественней) чем все остальные
Advanced Lossless Audio Coding (ALAC AAC) - сильная степень сжатия, без

•

математических потерь
Расширения файлов.
.m4a — незащищённый файл AAC

•

.m4b — файл AAC, поддерживающий закладки. Используется для аудиокниг и

•

подкастов.
.m4p — защищённый файл AAC. Используется для защиты файла от

•

копирования при легальной загрузке собственнической музыки в онлайнмагазинах, подобных iTunes Store.
•
Контрольные вопросы
Формат сжатия звука Windows Media Audio.

•

Что такое DRM?

•

Форматы сжатия звука FLAC.

•

Назовите основные части аудиопотока в формате FLAC.

•

Что такое межканальная декорреляция?

•

Структура фрейма в формате FLAC.

•

Формат сжатия звука AAC.

•

Какие профили существуют у формата AAC?

•
Лекция 10
Сравнение аналоговой и цифровой обработки сигналов
Сигналы могут быть обработаны с использованием аналоговых методов
(аналоговой обработки сигналов, или ASP), цифровых методов (цифровой
обработки сигналов, или DSP) или комбинации аналоговых и цифровых методов
(комбинированной обработки сигналов, или MSP). В некоторых случаях выбор
методов ясен, в других случаях нет ясности в выборе и принятие окончательного
решения основывается на определенных соображениях.
Что касается DSP, то главное отличие его от традиционного компьютерного
анализа данных заключается в высокой скорости и эффективности выполнения
сложных функций цифровой обработки, таких как фильтрация, анализ с
использованием быстрого преобразования Фурье (БПФ) и сжатие данных в
реальном масштабе времени.
Термин "комбинированная обработка сигналов" подразумевает, что системой
выполняется и аналоговая, и цифровая обработка. Такая система может быть
реализована в виде печатной платы, гибридной интегральной схемы (ИС) или
отдельного кристалла с интегрированными элементами. АЦП и ЦАП
рассматриваются как устройства комбинированной обработки сигналов, так как в
каждом из них реализованы и аналоговые, и цифровые функции.
Контрольные вопросы
Сравните аналоговую и цифровую обработку сигнала

•

Какие цифровые способы обработки сигнала вы знаете.

•

Нарисуйте структурную схему цифрового фильтра.

•

Чем отличаются АЧХ аналогового и цифрового фильтров

•

Назовите главное отличие DSP от традиционного компьютерного анализа
данных
•

Что подразумевает термин "комбинированная обработка сигналов"

•

Что такое «Цепь нормализации сигнала»?

•

Какое быстродействие требует фильтр со 129 коэффициентами.

•
Лекция 11
Для сжатия радиочастотного спектра телесигнала необходимо его оцифровать,
но просто оцифрованный телесигнал требует скорости передачи информации
15...20 Мбит/с. Резервом для снижения скорости передачи является устранение
избыточности. Действительно, избыточность в последовательности кадров в
течении некоторого времени – велика (особенно это проявляется на мало
динамичных сценах. Таким образом, логично создать такую систему передачи
видеосигнала, в которой статиче-ская часть изображения передается редко, а
динамическая — чаще. Это называется устранение избыточности во времени
(временная из-быточность). Далее замечаем, что фон в большинстве кадров
остается практически неизменным, спрашивается, зачем точка за точкой
передавать его. Это называется устранение пространственной избыточности.
Общие принципы передачи телеизображений
Y = 0.299R + 0.587G + 0.114B,

U = R - Y,

При приеме в цветном телевизоре
восстановления (декодирования):

V = B - Y,

осуществляется

R = Y + U, B = Y + V, G = Y - 0.509U - 0.194V

обратный

процесс
В настоящее время в эксплуатации находятся три совместимых системы
цветного телевидения - NTSC, PAL, SECAM. Основные различия между ними
заключаются в конкретных методах кодирования телевизионного сигнала см.
Таблице
Тип системы
Вертикальная частота развертки, Гц

NTSC
60

PAL
50

SECAM
50

Горизонтальная частота развертки, кГц

15.374

15.625

15.625

Число строк в кадре

525

625

625

Число видимых (активных) строк в кадре

480

576

576

Амплитудная

Амплитудная

Частотная

Тип модуляции цветовой
поднесущей
Полоса видеосигнала, МГц

4.2

Частота цветовой поднесущей,
МГц

3.60

Разнос несущих видео/звук, МГц

4.5

5.5 для B/G, 6 для I,
6.5 для D/K

6

7 для B/G, 8 для I/D/K

Полная ширина сигнала, МГц

5 для B/G, 5.5 для I,
6 для D/K
4.43

4.41 по U,
4.25 по V
Кратко остановимся на особенностях этих систем, рассматривая их в
хронологическом порядке.
NTSC (National Television System Color). Первая система цветного
телевидения, нашедшая практическое применение. Разработана в США в 1953 г.
принята для вещания. Именно при ее создании были выработаны основные
принципы передачи цвета в телевидении. В NTSC каждая телевизионная строка
содержит составляющую яркости Y и два сигнала цветности E I = 0.737U - 0.268V,
EQ=0.478U+0.413V. Здесь переход от осей цветового кодирования U, V к осям I, Q
обусловлен необходимостью сужения ширины полос цветовых поднесущих всего
до ± 0.5 Мгц (в NTSC используется самая узкая полоса видеосигнала). Поскольку
глаз человека мелкие детали зеленого и пурпурного цветов (ось Q) воспринимает
как неокрашеные (ось I - перпендикулярная к Q), то для сигналов EQ и EI это
удается без дополнительных потерь в разрешении. Цветоразностные сигналы
передаются путем амплитудной модуляции поднесущих на одной и той же частоте,
но с фазовым сдвигом на 90њ . Последнее обстоятельство является
принципиально важным для разделения сигналов при приеме. Однако, из-за
неизбежных нелинейных искажений в канале передачи поднесущие оказываются
промодулированными сигналом яркости как по амплитуде, так и по фазе. В
результате в зависимости от яркости участков изображений изменяются их
цветовой тон. Например, человеческие лица на изображении окрашиваются в
красноватый цвет в тенях и в зеленоватый - на освещенных участках. Это и
является основным недостатком системы NTSC.C целью его устранения немецкой
фирмой Telefunken в 1963 г. была разработана система
PAL

(Phase

Alternation

Line).

Здесь

использована

аналогичная

амплитудная модуляция цветоразностных сигналов EU=0.877U и EV=0.493V с
фазовым сдвигом на 90њ , но через строку дополнительно производится
изменение знака амплитуды составляющей EU. В результате при восстановлении
в

декодере

цветовые

составляющие

надежно

разделяются

сложением/вычитанием сигналов цветности последовательных телевизионных
строк, и паразитная яркостная модуляция приводит лишь к некоторому
изменению

цветовой

насыщенности.

Усреднение

сигналов

двух

строк

обеспечивает также повышение отношения сигнал/шум, но приводит к
снижению вертикальной четкости в два раза. Впрочем частично последнее
компенсируется увеличением числа телевизионных строк разложения. Система
PAL принята в большинстве стран Западной Европы, Африки и Азии, включая
Китай, Австралию и Новую Зеландию.
SECAM

(SEquentiel

Couleur

A

Memoire).

Первоначально

была

предложена во Франции еще в 1954 г., но регулярное вещание после длительных
доработок было начато только в 1967 одновременно во Франции и СССР. В
настоящее время она принята также в Восточной Европе, Монако, Люксембурге,
Иране, Ираке и некоторых других странах. Основная особенность системы поочередная, через строку, передача цветоразностных сигналов (D R= +1.9U, DB=1.5V) с дальнейшим восстановлением в декодере путем повторения строк. При
этом в отличие от PAL и NTSC используется частотная модуляция поднесущих. В
результате цветовой тон и насыщенность не зависят от освещенности, но на
резких переходах яркости возникают цветовые окантовки. Обычно после ярких
участков изображения окантовка имеет синий цвет, а после темных - желтый.
Кроме того, как и в системе PAL, цветовая четкость по вертикали снижена вдвое.
формирование полного телевизионного сигнала к видео необходимо
добавить звук, а полученный так называемый низкочастотный телевизионный
сигнал передать через эфир путем модуляции гармоники одного из доступных
радиоканалов (48,5...66 МГц - первый частотный диапазон, 76...100 МГц - второй
частотный диапазон, 174...230 МГц - третий частотный диапазон, 470...790 МГц четвертый частотный диапазон). И здесь даже в рамках одной системы
существуют различия, связанные с конкретной шириной спектра видеосигнала и
его разносом со звуковой частью, полярностью амплитудной модуляции
радиоканала изображения и типом модуляции радиоканала звука. В таблице
представлены основные параметры телевизионных стандартов стран мира.
Стандарт

A
B
C
D
E
F
G
H
I
K
L
M
N

Число
строк

405
625
625
625
819
819
625
625
625
625
625
525
625

Ширина
канала,
МГц
5
7
7
8
14
7
8
8
8
8
8
6
6

Полоса
в/сигнала,
МГц
3
5
5
6
10
5
5
5
5.5
6
6
4.2
4.2

Разнос
видео/
звук,
МГц
3.5
5.5
5.5
6.5
11.15
5.5
5.5
5.5
6
6.5
6.5
4.5
4.5

Полярность
модуляции
видео
+
+
+
+
+
-

Тип
модуляции
несущей звука
AM
ЧМ
AM
ЧМ
AM
AM
ЧМ
ЧМ
ЧМ
ЧМ
AM
ЧМ
ЧМ
Контрольные вопросы
Какие можно выделить два общих класса цифрового телевидения?

•

Назовите основные принципы передачи телеизображений.

•

Почему для передачи телеизображений используют цветоразностные
сигналы?
•

Что такое чересстрочная развертка?

•

Система NTSC.

•

Система PAL.

•

Система SECAM.

•

Какие существуют стандарты телевизионного вещания?

•
Лекция 12
Цифровое представление сигнала
К системам кодирования в цифровой видеотехнике предъявляются весьма
многочисленные и часто противоречивые требования. Поэтому на практике
кодирование всегда выполняется в несколько приемов. Сейчас принято выделять
следующие основные виды: кодирования источника информации с целью
преобразования сигнала в цифровую форму и его экономное представление путем
сжатия или, как часто говорят, компрессии; кодирования с целью обнаружения и
исправления ошибок; канального кодирования с целью согласования параметров
цифрового
сигнала
со
свойствами
канала
связи
и
обеспечения
самосинхронизации.
Преобразование аналогового телевизионного сигнала в цифровой.
Цифровой телевизионный сигнал получается из аналогового телевизионного
сигнала путем преобразования его в цифровую форму. Это преобразование
включает следующие три операции:
•Дискретизацию во времени, т. е. замену непрерывного аналогового сигнала
последовательностью его значений в дис-кретные моменты времени - отсчетов
или выборок.
•Квантование по уровню, заключающееся в округлении значения каждого
отсчета до ближайшего уровня квантования.
•Кодирование
(оцифровку), в результате которого значение отсчета
представляется в виде числа, соответствующего номеру полученного уровня
квантования.
Схема включения АЦП (а) и его входные и выходные сигналы (б)
Дискретизация видеосигнала
Перейдем к анализу параметров аналого-цифрового преоб-разования.
Первым из них является частота дискретизации fд. В соответствии с теоремой
Котельникова должно выполняться условие fд> 2fв, где fв - верхняя граничная
частота спектра преобра-зуемого в цифровую форму сигнала. Отсюда следует, в
частности, что частота дискретизации телевизионного сигнала, используемо-го в
нашей стране (fв = 6 МГц), должна быть не менее 12 МГц.

Дискретизация сигнала при выполнении (а-в) и при нарушении (г-е) условий
теоремы Котельникова
Спектр дискретизированного сигнала при
выполнении (а)
и при нарушении (б) условий теоремы
Варианты расположений отсчетов при дискретизации изображения
Дискретизация изображения.
Исходное изображение (а),
дискретизированное изображение (б) и
результат интерполяции (в)
1
b ( x, y ) = 2
4π

∞ ∞

∫ ∫ S( f , f
x

y

)e

2π j ( xf x + yf y )

−∞ −∞

Пример двумерной функции координат

df x df y
Примерный вид пространственного спектра для реальных изображений
Пространственные спектры дискретизированных изображений в
случаях
выполнения (а) и нарушения (б) условий аналога теоремы Котельникова для
двумерных сигналов
Искажения при дискретизации изображения
Контрольные вопросы
Что такое интерполяция?

•

В чем проявляются искажения одномерного сигнала, создаваемые
дискретизацией, в случае нарушений условий теоремы Котельникова?
•

Что такое двумерное преобразование Фурье?

•

Что такое пространственная частота? В каких единицах она измеряется (в
случае непрерывных изображений)?
•

Как преобразуется пространственный спектр непрерывного изображения
при дискретизации в случаях выполнения и нарушения условий двумерного
аналога теоремы Котельникова?
•

Почему ошибка квантования является случайной? Каков характер
распределения этой случайной величины?
•

Какие виды искажений возникают в изображении при дискретизации?

•

От каких параметров зависит полоса частот видеосигнала?

•
Лекция 12
важнейший параметр аналого-цифрового

Следующий
преобразования число уровней квантования Nкв, определяемое числом двоичных разрядов
АЦП п в соответствии с соотношением
Nкв = 2n
Выбор значения Nкв осуществляется так, чтобы влияние квантования на
изображение не было заметно для получателя информации.

Сигнал до квантования (а),
сигнал после квантования (б),
ошибка квантования (в)
Исходное распределение яркости в
изображении (а) и распределение
яркости после квантования (б)
Это обусловлено в первую очередь свойствами зрительного аппарата человека.
Как известно, пороговое превышение яркости ΔBпор объекта над фоном, при
котором объект различается наблюдателем, подчиняется в первом приближении
закону Вебера-Фехнера
ΔBпор/B0 = k
где k = 0,015...0,020; В0 - яркость фона. Таким образом, с ростом яркости фона
растет и порог ΔBпор.
Передаточная характеристика гамма-корректора описывает-ся соотношением
Uвых/Uвыхм = (Uвх/Uвхм)γ
где Uвх и Uвых - напряжения сигналов на входе и на выходе гамма-корректора,
соответственно; Uвхм и Uвыхм - максимальные значения диапазонов напряжений
сигналов на входе и на выходе гамма-корректора, соответственно; γ = 0,42...0,48 показатель гамма-коррекции.
График передаточной характеристики гамма-корректора для случая γ=0,45
приведен на рис.
Передаточная функция гамма-корректора.
Аналого-цифровое преобразование. Квантование.
изображение, квантованное на 4
уровня, и соответствующий такому
числу уровней шум квантования, в
котором
нетрудно
разглядеть
сюжет исходного изображения

Изображение, показанное на рис.
получено с использованием 128 уровней
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v
P up dsp a&v

More Related Content

Viewers also liked

лабораторная работа №1
лабораторная работа №1лабораторная работа №1
лабораторная работа №1student_kai
 
лекция 4 управление инцидентами-ч2
лекция 4 управление инцидентами-ч2лекция 4 управление инцидентами-ч2
лекция 4 управление инцидентами-ч2student_kai
 
лекция№18
лекция№18лекция№18
лекция№18student_kai
 
5 7 zanyatie--_igra
5 7 zanyatie--_igra5 7 zanyatie--_igra
5 7 zanyatie--_igrastudent_kai
 
лекция№23
лекция№23лекция№23
лекция№23student_kai
 
лекция №3
лекция №3лекция №3
лекция №3student_kai
 
презентация по л.р.№3
презентация  по л.р.№3презентация  по л.р.№3
презентация по л.р.№3student_kai
 
презентация 7
презентация 7презентация 7
презентация 7student_kai
 
презентация 2
презентация 2презентация 2
презентация 2student_kai
 
занятие5. сложение ускорений в сложном движении точки
занятие5. сложение ускорений в сложном движении точкизанятие5. сложение ускорений в сложном движении точки
занятие5. сложение ускорений в сложном движении точкиstudent_kai
 
лекция 5 управление проблемами-ч1
лекция 5 управление проблемами-ч1лекция 5 управление проблемами-ч1
лекция 5 управление проблемами-ч1student_kai
 
презентация 3
презентация 3презентация 3
презентация 3student_kai
 
лекция№4
лекция№4лекция№4
лекция№4student_kai
 
лекция№13
лекция№13лекция№13
лекция№13student_kai
 
лекция №9
лекция №9лекция №9
лекция №9student_kai
 
лекция №5
лекция №5лекция №5
лекция №5student_kai
 

Viewers also liked (20)

лабораторная работа №1
лабораторная работа №1лабораторная работа №1
лабораторная работа №1
 
лекция 5
лекция 5лекция 5
лекция 5
 
лекция 4 управление инцидентами-ч2
лекция 4 управление инцидентами-ч2лекция 4 управление инцидентами-ч2
лекция 4 управление инцидентами-ч2
 
лекция 12
лекция 12лекция 12
лекция 12
 
лекция№18
лекция№18лекция№18
лекция№18
 
5 7 zanyatie--_igra
5 7 zanyatie--_igra5 7 zanyatie--_igra
5 7 zanyatie--_igra
 
лекция№23
лекция№23лекция№23
лекция№23
 
лекция №3
лекция №3лекция №3
лекция №3
 
презентация по л.р.№3
презентация  по л.р.№3презентация  по л.р.№3
презентация по л.р.№3
 
презентация 7
презентация 7презентация 7
презентация 7
 
презентация 2
презентация 2презентация 2
презентация 2
 
занятие5. сложение ускорений в сложном движении точки
занятие5. сложение ускорений в сложном движении точкизанятие5. сложение ускорений в сложном движении точки
занятие5. сложение ускорений в сложном движении точки
 
лекция 5 управление проблемами-ч1
лекция 5 управление проблемами-ч1лекция 5 управление проблемами-ч1
лекция 5 управление проблемами-ч1
 
презентация 3
презентация 3презентация 3
презентация 3
 
лекция№4
лекция№4лекция№4
лекция№4
 
лекция 14
лекция 14лекция 14
лекция 14
 
лекция 4
лекция 4лекция 4
лекция 4
 
лекция№13
лекция№13лекция№13
лекция№13
 
лекция №9
лекция №9лекция №9
лекция №9
 
лекция №5
лекция №5лекция №5
лекция №5
 

Similar to P up dsp a&v

Кодирующие электронно-лучевые трубки и их применение
Кодирующие электронно-лучевые трубки и их применениеКодирующие электронно-лучевые трубки и их применение
Кодирующие электронно-лучевые трубки и их применение
Иван Иванов
 
Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...
Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...
Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...
ООО "Прософт-Системы"
 
08. АЦП STM32(1)
08.  АЦП STM32(1)08.  АЦП STM32(1)
08. АЦП STM32(1)
KamlachPV
 
Устройства связи для релейной защиты и противоаварийной автоматики
Устройства связи для релейной защиты и противоаварийной автоматикиУстройства связи для релейной защиты и противоаварийной автоматики
Устройства связи для релейной защиты и противоаварийной автоматикиHelen Petukhova
 
Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...
Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...
Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...
ООО "Прософт-Системы"
 
ПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛА
ПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛАПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛА
ПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛА
ITMO University
 
7122
71227122
Hioki pw3198 rus
Hioki pw3198 rusHioki pw3198 rus
Hioki pw3198 rushiokirus
 
Hioki pw3198
Hioki pw3198Hioki pw3198
Hioki pw3198
hiokirus
 
Организация высокочастотных и цифровых каналов связи для систем РЗ и ПА
Организация высокочастотных и цифровых каналов связи для систем РЗ и ПАОрганизация высокочастотных и цифровых каналов связи для систем РЗ и ПА
Организация высокочастотных и цифровых каналов связи для систем РЗ и ПА
ООО "Прософт-Системы"
 
Исследование переходных процессов при заряде и разряде конденсатора через соп...
Исследование переходных процессов при заряде и разряде конденсатора через соп...Исследование переходных процессов при заряде и разряде конденсатора через соп...
Исследование переходных процессов при заряде и разряде конденсатора через соп...
Alex_Goryainov
 
[FEE] 4. Bipolar transistors
[FEE] 4. Bipolar transistors[FEE] 4. Bipolar transistors
[FEE] 4. Bipolar transistors
Gabit Altybaev
 
«Восток-РП1»
«Восток-РП1»«Восток-РП1»
«Восток-РП1»
NTCRTS
 
АО Профотек
АО ПрофотекАО Профотек
АО Профотек
PROFOTECH
 
Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)
Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)
Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)
uadeps
 
Planar catalogue 2015
Planar catalogue 2015Planar catalogue 2015
Planar catalogue 2015
PLANAR
 
«Акведук»
«Акведук»«Акведук»
«Акведук»
Natali Kos
 
ЭКРА. Проблемы построения и надежности цифровой подстанции
ЭКРА. Проблемы построения и надежности цифровой подстанцииЭКРА. Проблемы построения и надежности цифровой подстанции
ЭКРА. Проблемы построения и надежности цифровой подстанции
DigitalSubstation
 
08. adc
08. adc08. adc
08. adc
KamlachPV
 

Similar to P up dsp a&v (20)

Кодирующие электронно-лучевые трубки и их применение
Кодирующие электронно-лучевые трубки и их применениеКодирующие электронно-лучевые трубки и их применение
Кодирующие электронно-лучевые трубки и их применение
 
Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...
Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...
Семейство приемопередатчиков АВАНТ. Новые решения для организации каналов свя...
 
08. АЦП STM32(1)
08.  АЦП STM32(1)08.  АЦП STM32(1)
08. АЦП STM32(1)
 
Устройства связи для релейной защиты и противоаварийной автоматики
Устройства связи для релейной защиты и противоаварийной автоматикиУстройства связи для релейной защиты и противоаварийной автоматики
Устройства связи для релейной защиты и противоаварийной автоматики
 
Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...
Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...
Специализированная аппаратура ВЧ связи для РЗ и ПА. Отличительные особенности...
 
ПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛА
ПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛАПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛА
ПСЕВДОРЕГУЛЯРНЫЕ КОДОВЫЕ ШКАЛЫ ДЛЯ ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ УГЛА
 
7122
71227122
7122
 
Hioki pw3198 rus
Hioki pw3198 rusHioki pw3198 rus
Hioki pw3198 rus
 
Hioki pw3198
Hioki pw3198Hioki pw3198
Hioki pw3198
 
Организация высокочастотных и цифровых каналов связи для систем РЗ и ПА
Организация высокочастотных и цифровых каналов связи для систем РЗ и ПАОрганизация высокочастотных и цифровых каналов связи для систем РЗ и ПА
Организация высокочастотных и цифровых каналов связи для систем РЗ и ПА
 
Исследование переходных процессов при заряде и разряде конденсатора через соп...
Исследование переходных процессов при заряде и разряде конденсатора через соп...Исследование переходных процессов при заряде и разряде конденсатора через соп...
Исследование переходных процессов при заряде и разряде конденсатора через соп...
 
[FEE] 4. Bipolar transistors
[FEE] 4. Bipolar transistors[FEE] 4. Bipolar transistors
[FEE] 4. Bipolar transistors
 
«Восток-РП1»
«Восток-РП1»«Восток-РП1»
«Восток-РП1»
 
АО Профотек
АО ПрофотекАО Профотек
АО Профотек
 
Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)
Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)
Измерения в пассивных оптических сетях (PON). Приборы и методы (Юрий Никитченко)
 
Planar catalogue 2015
Planar catalogue 2015Planar catalogue 2015
Planar catalogue 2015
 
Adc
AdcAdc
Adc
 
«Акведук»
«Акведук»«Акведук»
«Акведук»
 
ЭКРА. Проблемы построения и надежности цифровой подстанции
ЭКРА. Проблемы построения и надежности цифровой подстанцииЭКРА. Проблемы построения и надежности цифровой подстанции
ЭКРА. Проблемы построения и надежности цифровой подстанции
 
08. adc
08. adc08. adc
08. adc
 

More from student_kai

презентация
презентацияпрезентация
презентацияstudent_kai
 
презентации продолжение банкета
презентации продолжение банкетапрезентации продолжение банкета
презентации продолжение банкетаstudent_kai
 
основы программирования на языке C
основы программирования на языке Cосновы программирования на языке C
основы программирования на языке Cstudent_kai
 
презентация курсовой работы
презентация курсовой работыпрезентация курсовой работы
презентация курсовой работыstudent_kai
 
лекция№34
лекция№34лекция№34
лекция№34student_kai
 
лекция№32
лекция№32лекция№32
лекция№32student_kai
 
лекция№33
лекция№33лекция№33
лекция№33student_kai
 
лекция№31
лекция№31лекция№31
лекция№31student_kai
 
лекция№30
лекция№30лекция№30
лекция№30student_kai
 
лекция№29
лекция№29лекция№29
лекция№29student_kai
 
лекция№28
лекция№28лекция№28
лекция№28student_kai
 
лекция№27
лекция№27лекция№27
лекция№27student_kai
 
лекция№26
лекция№26лекция№26
лекция№26student_kai
 
лекция№25
лекция№25лекция№25
лекция№25student_kai
 
лекция№25
лекция№25лекция№25
лекция№25student_kai
 
лекция№24
лекция№24лекция№24
лекция№24student_kai
 
лекция№22
лекция№22лекция№22
лекция№22student_kai
 
лекция№21
лекция№21лекция№21
лекция№21student_kai
 
лекция№20
лекция№20лекция№20
лекция№20student_kai
 
лекция№19
лекция№19лекция№19
лекция№19student_kai
 

More from student_kai (20)

презентация
презентацияпрезентация
презентация
 
презентации продолжение банкета
презентации продолжение банкетапрезентации продолжение банкета
презентации продолжение банкета
 
основы программирования на языке C
основы программирования на языке Cосновы программирования на языке C
основы программирования на языке C
 
презентация курсовой работы
презентация курсовой работыпрезентация курсовой работы
презентация курсовой работы
 
лекция№34
лекция№34лекция№34
лекция№34
 
лекция№32
лекция№32лекция№32
лекция№32
 
лекция№33
лекция№33лекция№33
лекция№33
 
лекция№31
лекция№31лекция№31
лекция№31
 
лекция№30
лекция№30лекция№30
лекция№30
 
лекция№29
лекция№29лекция№29
лекция№29
 
лекция№28
лекция№28лекция№28
лекция№28
 
лекция№27
лекция№27лекция№27
лекция№27
 
лекция№26
лекция№26лекция№26
лекция№26
 
лекция№25
лекция№25лекция№25
лекция№25
 
лекция№25
лекция№25лекция№25
лекция№25
 
лекция№24
лекция№24лекция№24
лекция№24
 
лекция№22
лекция№22лекция№22
лекция№22
 
лекция№21
лекция№21лекция№21
лекция№21
 
лекция№20
лекция№20лекция№20
лекция№20
 
лекция№19
лекция№19лекция№19
лекция№19
 

P up dsp a&v

  • 1. НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ КАЗАНСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМ. А.Н.ТУПОЛЕВА О. Г. МОРОЗОВ, Р. Р. САМИГУЛЛИН, Н. В. ДОРОГОВ, А. Р. НАСЫБУЛЛИН ЦИФРОВАЯ ОБРАБОТКА АУДИО И ВИДЕОСИГНАЛОВ Конспект лекций КАЗАНЬ 2010
  • 2. Инновационность   Предназначен для подготовки студентов обучающихся по профилю подготовки «Аудиовизуальная техника» направления 210400 «Радиотехника», а также для студентов вузов соответствующих специальностей и инженерам, специализирующихся в данной области. Совместное рассмотрение методов и средств цифровой обработки аудио и видео сигналов в одном учебном пособии
  • 3. Лекция 1 АНАЛОГО-ЦИФРОВОЕ ПРЕОБРАЗОВАНИЕ СИГНАЛОВ Аналоговый сигнал : U (t ) = A0 sin ω (t ) Преобразование аналогового сигнала в цифровой состоит из двух этапов:  дискретизации по времени  квантовании по амплитуде. Дискретизация по времени, как правило, означает что сигнал представляется рядом своих отсчётов (дискретов) непрерывных по амплитуде и взятых через равные промежутки времени. Квантование сигнала по амплитуде это преобразование сигнала в сигнал со ступенчатым изменением амплитуды.
  • 4. Теорема Котельникова f ä > 2Ω где fд– частота с которой производятся дискретизация по времени Ω - верхняя частота в спектре аналогового сигнала. из теоремы Котельникова вытекают 2 следствия:  Любой аналоговый сигнал, может быть восстановлен с какой угодно точностью по своим дискретным отсчётам, взятым с частотой.  Если максимальная частота в сигнале превышает половину частоты дискретизации, то способа восстановить сигнал из дискретного в аналоговый без искажений не существует.
  • 5. Параметры, определяющие характеристики Аналого-цифровых преобразователей (АЦП) Статические параметры:  Разрешающая способность  Погрешность полной шкалы h = U пш /(2 N − 1) δ ПШ = ε ПШ * 100% U ПШ
  • 6. Нелинейность - максимальное отклонение реальной характеристики преобразования D(Uвх) от оптимальной. εj δЛ = * 100% U ПШ δ ДЛ hk − h = *100% U ПШ дифференциальная нелинейность Погрешность линейности характеристики преобразования АЦП
  • 7.  Непропадание кодов - свойство АЦП выдавать все возможные выходные коды, при изменении входного напряжения от начальной до конечной точки диапазона преобразования.  Монотонность характеристики преобразования - это неизменность знака приращения выходного кода D при монотонном изменении входного преобразуемого сигнала. Монотонность не гарантирует малых значений дифференциальной нелинейности и непропадания кодов.  Температурная нестабильность АЦ-преобразователя характеризуется температурными коэффициентами погрешности полной шкалы и погрешности смещения нуля.  Динамические параметры. Возникновение динамических погрешностей связано с дискретизацией сигналов, изменяющихся во времени. Можно выделить следующие параметры АЦП, определяющие его динамическую точность.
  • 8.  Максимальная частота дискретизации (преобразования) - это наибольшая частота, с которой происходит образование выборочных значений сигнала, при которой выбранный параметр АЦП не выходит за заданные пределы. Измеряется числом выборок в секунду.  Время преобразования (tпр) - это время, отсчитываемое от начала импульса дискретизации или начала преобразования до появления на выходе устойчивого кода, соответствующего данной выборке.  Время выборки (стробирования) - время, в течение которого происходит образование одного выборочного значения. При работе без УВХ равно времени преобразования АЦП.  Шумы АЦ. В идеале, повторяющиеся преобразования фиксированного постоянного входного сигнала должны давать один и тот же выходной код. Однако, вследствие неизбежного шума в схемах АЦП, существует некоторый диапазон выходных кодов для заданного входного напряжения.
  • 9. Контрольные вопросы          Чем определяется выбор частоты дискретизации аналогового сигнала? Какие два следствия вытекают из теоремы Котельникова? Какие параметры определяют характеристики АЦП? Что такое разрешающая способность АЦП? Что такое погрешность полной шкалы АЦП? Что такое погрешность смещения нуля АЦП? Что такое погрешность линейности характеристики преобразования АЦП? Какие динамические параметра АЦП вы знаете
  • 10. Лекция 2 Типы преобразования  Линейные АЦП. Большинство АЦП считаются линейными, хотя аналого-цифровое преобразование по сути является нелинейным процессом (поскольку операция отображения непрерывного пространства в дискретное — операция нелинейная).  Нелинейные АЦП. Если бы плотность вероятности амплитуды входного сигнала имела равномерное распределение, то отношение сигнал/шум (применительно к шуму квантования) было бы максимально возможным.
  • 12. Параллельные АЦП АЦП прямого преобразования или параллельный АЦП. содержит по одному компаратору на каждый дискретный уровень входного сигнала. Рис. Структурная схема параллельного АЦП
  • 13. Последовательно-параллельные АЦП являются компромиссом между стремлением получить высокое быстродействие и желанием сделать это по возможности меньшей ценой. Последовательно-параллельные АЦП занимают промежуточное положение по разрешающей способности и быстродействию между параллельными АЦП и АЦП последовательного приближения. Последовательно-параллельные АЦП подразделяют на многоступенчатые, многотактные и конвеерные . МНОГОСТУПЕНЧАТЫЕ ПОСЛЕДОВАТЕЛЬНО-ПАРАЛЛЕЛЬНЫЕ АЦП
  • 15. Конвеерные АЦП. Быстродействие многоступенчатого АЦП можно повысить, применив конвеерный принцип многоступенчатой обработки входного сигнала. Диаграмма работы конвеерного АЦП
  • 16. Контрольные вопросы         Что обозначает термин линейный применительно к АЦП? Что значит нелинейный АЦП? Как классифицируются АЦП? Что такое параллельные АЦП? Перечислите все типы последовательно-параллельных АЦП. В чем преимущество многоступенчатых последовательнопараллельных АЦП? Нарисуйте схему конвейерного АЦП. В чем “плюсы” и “минусы” использования конвейерного АЦП?
  • 17. Лекция 3 АЦП последовательные АЦП последовательного счета. Структурная схема АЦП последовательного счета f пр. макс. = (2 N − 1) / f такт. Например, при N=10 и fтакт=1 МГц tпр.макс=1024 мкс, что обеспечивает максимальную частоту выборок порядка 1 кГц.
  • 18. АЦП последовательного приближения (рис.) или АЦП с поразрядным уравновешиванием. Структурная схема АЦП последовательного приближения
  • 19. Интегрирующие АЦП. Недостатком рассмотренных выше последовательных АЦП является низкая помехоустойчивость результатов преобразования. Действительно, выборка мгновенного значения входного напряжения, обычно включает слагаемое в виде мгновенного значения помехи. Впоследствии при цифровой обработке последовательности выборок эта составляющая может быть подавлена, однако на это требуется время и вычислительные ресурсы. В АЦП, рассмотренных ниже, входной сигнал интегрируется либо непрерывно, либо на определенном временном интервале, длительность которого обычно выбирается кратной периоду помехи. Это позволяет во многих случаях подавить помеху еще на этапе преобразования. Платой за это является пониженное быстродействие интегрирующих АЦП. АЦП многотактного интегрирования. Упрощенная схема АЦП работающего в два основных такта (АЦП двухтактного интегрирования), приведена на рис.
  • 20. Время интегрирования входного напряжения t1 постоянно; в качестве таймера используется счетчик с коэффициентом пересчета Kсч, так что: t1 = K сч f так. К моменту окончания интегрирования выходное напряжение интегратора составляет: U вх.ср К сч 1 t1 U И (t1 ) = − ∫ U вх (t )dt = − RC 0 f такт RC где Uвх.ср. - среднее за время t1 входное напряжение. Интервал времени, в котором проходит стадия счета, определяется уравнением 1 t1 +t2 U И (t1 ) + ∫U ОП dt = 0 RC t1
  • 21. t2 = n2 f такт где n2 - содержимое счетчика после окончания стадии счета, получим результат: n2 = Временные диаграммы АЦП двухкратного интегрирования U вх.ср К сч U оп
  • 22. Сигма-дельта АЦП (или АЦП с уравновешиванием или балансом зарядов). Структурная схема сигма-дельта модулятора Структурная схема сигма-дельта АЦП
  • 23. ПРЕОБРАЗОВАТЕЛИ НАПРЯЖЕНИЕ-ЧАСТОТА Структурная схема ПНЧ Структурная схема АЦП на основе ПНЧ
  • 24. Контрольные вопросы Перечислите все типы последовательных АЦП. • Объясните принцип работы АЦП последовательного счета по структурной схеме. • От чего зависит время преобразования АЦП последовательного счета? • Объясните принцип действия АЦП последовательного приближения. • Перечислите все типы интегрирующих АЦП. • Какая отличительная особенность метода многотактного интегрирования? • Какой принцип лежит в основе сигма-дельта АЦП. • Нарисуйте схему напряжение - частота. • АЦП построенного по принципу преобразователя
  • 25. Лекция 4 Особенности преобразование аудиосигналов в цифровую форму. показан период гармонического колебания (справа) и соответствующий ему двоично-дополнительный код (слева).
  • 26. Линейное квантование по амплитуде шум квантования ξ Ш КВ ≤ ∆ 2 Линейное квантование по уровню: а) амплитудная характеристика; б) шумы квантования.
  • 27. Нелинейное квантование по амплитуде Нелинейное квантование по уровню: а) амплитудная характеристика; б) шумы квантования.
  • 28. Выбор частоты дискретизации аудиосигнала выбор частоты дискретизации при операции аналого-цифрового преобразования должен подчиняться теореме Котельникова-Шэннона-Найквиста. Система Телефония Компакт-диск Профессиональная аудиосистема DVD аудио Частота дискретизации, Гц 8000 44100 48000 96000 (для 6-канального аудиосигнала)
  • 29. Контрольные вопросы Что вносит дискретизация в спектр исходного сигнала если ее частота выбрана согласно теореме Котельникова? • Что называют шумом (ошибкой) квантования АЦП? • От каких параметров зависит величина шума квантования? • Какой цифровой код используют при оцифровке аудиосигнала и почему? • Что такое «линейное квантование по амплитуде»? • Что такое «нелинейное квантование по амплитуде»? • Назовите некоторые типовые значения частот дискретизации, используемые в широкораспространенных системах. • Какой объем будет занимать аудиофайл длительностью 10 мин в формате ИКМ •
  • 30. Лекция 5 Цифровое сжатие Сжатие данных (англ. data compression) — алгоритмическое преобразование данных, производимое с целью уменьшения их объёма. Применяется для более рационального использования устройств хранения и передачи данных. Синонимы — упаковка данных, компрессия, сжимающее кодирование, кодирование источника. Сжатие основано на устранении избыточности, содержащейся в исходных данных. В основе любого способа сжатия лежит модель источника данных, или, точнее, модель избыточности. Иными словами, для сжатия данных используются некоторые априорные сведения о том, какого рода данные сжимаются. Простейшим примером избыточности является повторение в тексте фрагментов (например, слов естественного или машинного языка). Подобная избыточность обычно устраняется заменой повторяющейся последовательности ссылкой на уже закодированный фрагмент с указанием его длины. Другой вид избыточности связан с тем, что некоторые значения в сжимаемых данных встречаются чаще других. Сокращение объёма данных достигается за счёт замены часто встречающихся данных короткими кодовыми словами, а редких — длинными (энтропийное кодирование). Сжатие данных, не обладающих свойством избыточности (например, случайный сигнал или шум, зашифрованные сообщения), принципиально невозможно без потерь.
  • 31. В целом все существующие методы кодирования аудиоинформации можно условно разделить всего на два типа. 1. Сжатие данных без потерь (lossless coding) - это способ кодирования (уплотнения) цифровой аудиоинформации, позволяющий осуществлять 100%-ное восстановление исходных данных из сжатого потока (под понятием "исходные данные" здесь подразумевается исходный вид оцифрованных аудиоданных). К такому способу уплотнения данных прибегают в случаях, когда требуется абсолютное сохранение качества оригинального звучания аудиоданных. Существующие сегодня алгоритмы сжатия без потерь позволяют сократить занимаемый данными объем на 20-50%. Механизмы работы подобных кодеров сходны с механизмами работы архиваторов общих данных, таких, как, например, ZIP или RAR, но при этом адаптированы специально для сжатия аудиоданных10. Кодирование без потерь, хотя и идеально с точки зрения сохранности качества аудиоматериалов, неспособно обеспечить высокий уровень компрессии. 2. Сжатие данных с потерями (lossy coding). Цель такого кодирования достижение любыми путями максимально высокого коэффициента компрессии данных при сохранении качества их звучания на приемлемом уровне. В основе идеи кодирования с потерями лежат два простых основополагающих соображения: •исходные цифровые аудиоданные избыточны - они содержат много бесполезной для слуха информации, которую можно удалить, повысив тем самым коэффициент компрессии; •требования к качеству звучания аудиоматериала могут быть разными и зависят от конкретных целей и сфер использования.
  • 32. Характеристики алгоритмов сжатия и их применимость. Коэффициент сжатия — основная характеристика алгоритма сжатия. Она определяется как отношение объёма исходных несжатых данных к объёму сжатых, то есть: k = So/Sc, где k — коэффициент сжатия, So — объём исходных данных, а Sc — объём сжатых. Таким образом, чем выше коэффициент сжатия, тем алгоритм эффективнее. Следует отметить: если k = 1, то алгоритм не производит сжатия, то есть выходное сообщение оказывается по объёму равным входному; если k < 1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу. Ситуация с k < 1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длиной n бит составляет ровно 2n, число различных сообщений с длиной меньшей или равной n (при наличии хотя бы одного сообщения меньшей длины) будет меньше 2 n. Это значит, что невозможно однозначно сопоставить все исходные сообщения сжатым: либо некоторые исходные сообщения не будут иметь сжатого представления, либо нескольким исходным сообщениям будет соответствовать одно и то же сжатое, а значит их нельзя отличить.
  • 33. Коэффициент сжатия может быть как постоянным (некоторые алгоритмы сжатия звука, изображения и т. п., например А-закон, μ-закон, ADPCM, усечённое блочное кодирование), так и переменным. Во втором случае оценён по некоторым критериям: •средний (обычно по некоторому тестовому набору данных); •максимальный (случай наилучшего сжатия); •минимальный (случай наихудшего сжатия); Коэффициент сжатия с потерями при этом сильно зависит от допустимой погрешности сжатия или качества, которое обычно выступает как параметр алгоритма. В общем случае постоянный коэффициент сжатия способны обеспечить только методы сжатия данных с потерями. Допустимость потерь. Основным критерием различия между алгоритмами сжатия является описанное выше наличие или отсутствие потерь, в то время как возможность применения сжатия с потерями должна быть обоснована. Для некоторых типов данных искажения не допустимы в принципе. В их числе: •символические данные, изменение которых неминуемо приводит к изменению их семантики: программы и их исходные тексты, двоичные массивы и т. п.; •жизненно важные данные, изменения в которых могут привести к критическим ошибкам: например, получаемые с медицинской измерительной аппаратуры или контрольных приборов летательных, космических аппаратов и т. п.; многократно подвергаемые сжатию и восстановлению промежуточные данные при многоэтапной обработке графических, звуковых и видеоданных.
  • 34. Системные требования алгоритмов. Различные алгоритмы могут требовать различного количества ресурсов вычислительной системы, на которых они реализованы: •оперативной памяти (под промежуточные данные); •постоянной памяти (под код программы и константы); •процессорного времени. Алгоритмы сжатия данных неизвестного формата. Имеется два основных подхода к сжатию данных неизвестного формата. На каждом шаге алгоритма сжатия очередной сжимаемый символ либо помещается в выходной буфер сжимающего кодера как есть (со специальным флагом, помечающим, что он не был сжат), либо группа из нескольких сжимаемых символов заменяется ссылкой на совпадающую с ней группу из уже закодированных символов. Поскольку восстановление сжатых таким образом данных выполняется очень быстро, такой подход часто используется для создания самораспаковывающихся программ. Для каждой сжимаемой последовательности символов однократно либо в каждый момент времени собирается статистика её встречаемости в кодируемых данных. На основе этой статистики вычисляется вероятность значения очередного кодируемого символа (либо последовательности символов). После этого применяется та или иная разновидность энтропийного кодирования, например, арифметическое кодирование или кодирование Хаффмана, для представления часто встречающихся последовательностей короткими кодовыми словами, а редко встречающихся — более длинными.
  • 35. Контрольные вопросы Что такое цифровое сжатие? • Назовите характеристики алгоритмов сжатия и их применимость. • В чем может заключаться избыточность в компрессированных сигналах? • Что характеризует коэффициент сжатия? • Какой механизм работы сжатия без потерь? • Какие ограничения накладываются на сжатие с потерями? • Какие два основных подхода к сжатию данных неизвестного формата? • Системные требования алгоритмов. •
  • 36. Лекция 6 Цифровое представление звукового сигнала при записи Цифровая обработка звукового сигнала при записи Импульсно-кодовая модуляция (ИКМ) является наиболее распространенной формой цифрового представления аудиосигнала. Полученный в результате преобразования PCM-поток (PCM - Pulse Code Modulation), может быть как параллельным, когда все биты каждого отсчета передаются одновременно по нескольким линиям с частотой дискретизации, так и последовательным, когда биты передаются друг за другом с более высокой частотой по одной линии. Структура записываемой информации. Обычно каждый 16-разрядный отрезок называется словом, которое обычно раскладывают на два символа, каждый из которых содержит 8 разрядов (бит). Формирование кадра записи. Для того чтобы в проигрывателе CD можно было распознавать цифровые данные закодированного сигнала, необходимо эти данные организовать в определенные образы. Во всех CD образ имеет блочную кадровую структуру. Кадр − информационный блок, включающий по шесть выборок звукового сигнала каждого канала. кадр состоит из 12 слов (по 6 слов на канал). выборки звукового сигнала осуществляются с частотой 44,1 кГц. В результате первого мультиплексирования - уже 88,2 кГц, в результате частота кадров, состоящих из 12 слов каждый, составляет 88,2/12=7,35 кГц.
  • 37. Биты (символы паритета) Левый ФНЧ УВХ АЦП Входной аудиосигнал Правый ФНЧ УВХ АЦП Первый мультиплексор CIRCкоде р 41,1 кГц Кодер сигналов контроля и дисплей Синхрогенера тор Сигнал таймера Биты (символы данных) Модулятор канала Генератор таймера Лазер записи Рис. Процесс записи аудиоинформации на CD Выходные последовательные данные на лазер Мастер-копия компакт диска
  • 38. CIRC-кодер. Схема CIRC-кодера выполняет две функции. Одна функция схемы − разложить каждое 16-разрядное слово на два 8-разрядных символа. В течение процесса разложения эти символы подвергаются чередованию (interleaving) в определенном порядке. В результате чередования непрерывный музыкальный сигнал оказывается «разбросанным» по разным местам информационной дорожки CD. Такое «разбрасывание» сигнала по площади CD делается для повышения помехоустойчивости и достоверности воспроизведения. Если информационные символы в каком-то месте CD будут повреждены или «прочитаны» звукоснимателем ошибочно, это не приведет к дефекту, заметному для слушателя, поскольку ошибочные символы, находящиеся на информационной дорожке, относятся к различным (по времени) местам записанной музыкальной программы. Другая функция схемы CIRC-кодера − обеспечить метод, которым проигрыватель CD может проверять ошибки в потоке данных. Ошибки в потоке данных могут возникать как из-за некачественных компакт-дисков, так и из-за сбоев в процессе считывания информации в устройствах и схемах проигрывателя. Из-за этих сбоев считывания возникают прерывания полезного сигнала, так называемые «выпадения». В аналоговой технике такой эффект выпадения приводит лишь к кратковременному пропуску сигнала и не оказывает влияния на дальнейшую работу. В случае ИКМ, однако, «выпадения» при воспроизведении прослушиваются в виде раздражающих пульсирующих шорохов, которые называют ошибками кодирования.
  • 39. Канальное кодирование. При записи луч лазера фокусируется на поверхности в пятно определенных размеров. Получаемый при этом пит имеет также определенный размер, зависящий от характеристик записывающего лазера. В принципе минимальный по размеру пит будет отображать только одну единицу информации (один бит). Однако существуют способы, при которых такой минимальный пит будет отображать не один бит, а больше. Такие способы преобразования называются канальным кодированием. Рис. Фрагмент таблицы EFM-кода
  • 40. Декодирование информации, записанной на CD. Основным узлом декодера является фотодетектор, который преобразует оптический сигнал, считанный с CD, и преобразует его в три основных функциональных электрических сигнала: - информационного; - автофокусировки; - отслеживания (трекинга), обеспечивающего точное сопровождение лазерного луча по дорожке записи диска. Схема питания лазера Лазерная оптическая система Фотодиодная матрица ERCO Схема интерполяции и блокировки Система автофокусироваки и радиального трекинга Тактовая схема Предусилитель ВЧ сигнала (EFM) Синхро генератор EFM-демодулятор Цифровой фильтр и демультиплексор ЦАП ЦАП Усилител ь Усилител ь Левый аудиоканал Правый аудиоканал Mute Декодер сигналовконтроля и дисплея Панель управления Панель дисплея Системный контроллер Усилитель серводвигателя вращения диска
  • 41. Контрольные вопросы Что называют импульсно-кодовой модуляцией? • Структура модуляцией. • записываемой информации при импульсно-кодовой Что такое «Кадр записи» при импульсно-кодовой модуляции? • Какое преимущество использования EFM-модуляции? • Зачем нужен CIRC-кодер? • Какой метод используется в CD проигрывателях для распознавания ошибок. • Что такое канальное кодирование? • Декодирование информации записанной на CD. •
  • 42. Лекция 7 Демодуляция EFM сигналов ≈ 600мВ 3Т 5Т 7Т 9Т 11Т 4Т 6Т 8Т 10Т Сигнал EFM на выходе ВЧ-предусилителя
  • 43. Нормализованный EFM-сигнал поступает на дальнейшее декодирование. Декодер в проигрывателе CD представляет собой сочетание различных схемных устройств, выполняющих целый ряд функций: − восстановление тактового сигнала данных; − восстановление синхронизирующего образа из потока данных для синхронизации всей системы; − демодуляция EFM-сигнала; − разделение цифровых сигналов на аудиоинформацию и информацию субкода; − восстановление первоначальной последовательности (деперемежение); − коррекция ошибок; − интерполяция цифровых сигналов; − демультиплексирование цифровых сигналов; − восстановление цифрового аудиосигнала в первоначальный аналоговый аудиосигнал.
  • 44. Исходная форма • • • • • • • • • 1 2 3 4 5 6 7 8 9 10 • • • • • • • • • • 1 2 3 4 5 6 7 8 9 10 Выборка данных на CD 1 2 3 4 5 6 7 8 9 10 Данные после прочтения 1 2 3 4 5 6 7 8 9 10 Выпадение 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 Данные после деперемежения 1 2 3 4 5 6 7 8 9 10 а) 1 2 3 4 5 6 7 8 9 10 б) Рис. Принцип перемежения и деперемежения: а − без чередования, б − с чередованием •
  • 45. Можно использовать три метода устранения воздействия выпадения сигнала на воспроизведение. Первый метод − метод блокировки − основан на том, что дефектное слово блокируется и заменяется просто нулевым значением. При втором методе ошибочное слово обнаруживается при выполнении предварительной записи-захвата, и ложное слово заменяется предыдущим, так что при этом не возникает практически никакого слышимого отличия при воспроизведении. И, наконец, лучшую компенсацию выпадения можно осуществить с помощью линейной интерполяции. В этом случае при распознавании ошибочного слова оно заменяется словом, имеющим значение, усредненное между предыдущим и последующим значениями; компенсация ошибки оказывается настолько точной, что отличить на слух воспроизведенный аудиосигнал от первоначального не представляется возможным. Восстановленный в правильной последовательности и скорректированный поток цифровых аудиоданных подается на цифровой фильтр и схему демультиплексирования. Цифровая фильтрация обеспечивает более высокое качество воспроизведения, чем в обычных проигрывателях. Цифровые фильтры формируют из цифровых звуковых сигналов с частотой выборки 44,1 кГц цифровые сигналы с частотой выборки, кратной основной частоте.
  • 46. Контрольные вопросы Демодуляция EFM сигналов. • Какие этапы проходит сигнал после EFM-демодулятора? • CIRC-декодер. • Что такое перемежение выборок? • Что такое деперемежение выборок? • Какой принцип узкополосной фазовой синхронизации? • Роль ОЗУ в проигрывателях CD. • Какие методы компенсации выпадения сигнала используются в проигрывателях CD? •
  • 47. Лекция 8 Форматы сжатия аудиосигналов Формат сжатия звука MP3. MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации. Описание формата. В этом формате звуки кодируются частотным образом (без дискретных партий); есть поддержка стерео, причём в двух форматах (подробности — ниже). MP3 является форматом сжатия с потерями, то есть часть звуковой информации, которую (согласно психоакустической модели) ухо человека воспринять не может или воспринимается не всеми людьми, из записи удаляется безвозвратно. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 — 320 кбит/c. Для сравнения, поток данных с обычного компактдиска формата Audio-CD равен 1411,2 кбит/c при частоте дискретизации 44100 Гц.
  • 48. MP3 и «качество Audio-CD». было распространено мнение, что запись с битрейтом 128 кбит/c подходит для музыкальных произведений, предназначенных для прослушивания большинством людей, обеспечивая качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых, качество полученного MP3 зависит не только от битрейта, но и от кодирующей программы (кодека). Во-вторых, помимо превалирующего режима CBR (Constant Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate — усредненный битрейт) и VBR (Variable Bitrate — переменный битрейт). В-третьих, граница 128 кбит/c является условной. Режимы кодирования и опции. Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации: 32—320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1 Layer 3; • 16—160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3; • 8—160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3. •
  • 49. Режимы управления кодированием звуковых каналов. Так как формат MP3 поддерживает двухканальное кодирование (стерео), существует 4 режима: •Стерео — двухканальное кодирование, при котором каналы исходного стереосигнала кодируются независимо друг от друга, но распределение бит между каналами в общем битрейте может варьироваться в зависимости от сложности сигнала в каждом канале. •Моно — одноканальное кодирование. Единственным плюсом данного режима может являться только выходное качество по сравнению с режимом Стерео при одинаковом битрейте, так как на один канал приходится вдвое большее количество бит, чем в режиме Стерео. •Двухканальный — два независимых канала, например звуковое сопровождение на разных языках. Битрейт делится на два канала. Например, если заданный битрейт 192 кбит/c, то для каждого канала он будет равен только 96 кбит/c. •Объединённое стерео (Joint Stereo) — оптимальный способ двухканального кодирования. Например, в одном из режимов Объединённое стерео левый и правый каналы преобразуются в их сумму (L+R) и разность (L-R). Для большинства звуковых файлов насыщеность канала с разностью (L-R) получается намного меньше канала с суммой (L+R). Поэтому Объединённое стерео позволяет либо сэкономить на битрейте канала (L-R) или улучшить качество на том же битрейте, поскольку на канал суммы (L+R) отводится большая часть битрейта. Но современные кодеки используют различные схемы в разных фреймах (включая чистое стерео) в зависимости от исходного сигнала.
  • 50. CBR. CBR расшифровывается как Constant Bit Rate, то есть Постоянный битрейт, который задается пользователем и не изменяется при кодировании произведения. Таким образом каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). CBR может быть полезен для потоков мультимедиа данных по ограниченному каналу; в таком случае кодирование использует все возможности канала данных. Для хранения данный режим кодирования не является оптимальным, так как он не может выделить достаточно места для сложных отрезков исходного произведения, при этом бесполезно тратя место на простых отрезках. Повышенные битрейты (выше 256 кбит/c) могут решить данную проблему, выделив больше места для данных, но – увеличивая размер файла. VBR. VBR расшифровывается как Variable Bit Rate, то есть Варьирующийся Битрейт или Переменный Битрейт, который динамически изменяется программой-кодером при кодировании, в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Аудиоматериал разной насыщенности может быть закодирован с определенным качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Минусом данного метода кодирования является сложность предсказания размера выходного файла. Но этот недостаток VBR-кодирования незначителен в сравнение с его достоинствами. Также минусом является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты.
  • 51. ABR. ABR расшифровывается как Average Bit Rate, то есть Усредненый Битрейт, который является гибридом VBR и CBR: битрейт в кбит/c задается пользователем, а программа варьирует его, постоянно подгоняя под заданный битрейт. Таким образом, кодер будет с осторожностью использовать максимально и минимально возможные значения битрейта, так как рискует не вписаться в заданный пользователем битрейт. Это явный минус данного метода, так как сказывается на качестве выходного файла, которое будет немного лучше CBR, но намного хуже VBR. С другой стороны, этот метод позволяет наиболее гибко задавать битрейт ( Теги. Метки в границах mp3-файла (в начале иили в конце). Существуют различные версии тегов. Недостатки формата. MP3 является лидером по распространённости, но при этом не является лучшим по техническим параметрам. Существуют форматы, позволяющие добиться большего качества при одинаковом размере файла, такие как Vorbis, AAC. Юридические ограничения. Для свободного использования формата существуют патентные ограничения. Компания Alcatel-Lucent обладает правами на MP3 и получает отчисления от тех, кто использует этот формат — производителей плееров и мобильных телефонов. Из-за этого лицензионная чистота формата под вопросом. В частности, Alcatel-Lucent предъявила претензии компании Microsoft за то, что в Windows была встроена поддержка MP3. Однако срок действия патентов на технологию заканчивается в 2010 году, после чего любая компания сможет использовать её свободно.
  • 52. Формат сжатия звука OGG Vorbis. Vorbis — свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MPEG Audio Layer III и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Кодирование.. По всевозможным оценкам является вторым по популярности форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.По заявлению разработчиков, Vorbis применяет более качественную психоакустическую модель, чем его конкуренты, дающую лучшую чёткость воспроизведения при равной плотности потока. В результате сжатый музыкальный файл окажется в два раза меньше (или в два раза лучше), чем у MP3. Он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с потерями), поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio. К тому же, формат Vorbis — «sample accurate». Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений, дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно переходит в другой) — в итоге сохранится целостность звука.
  • 53. Метаданные. Формат изначально разрабатывался с возможностью потокового вещания. Это даёт формату достаточно полезный побочный эффект — в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов. Битрейт. Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 400 kbps до 700 kbps. Такой же гибкостью обладает частота дискретизации — пользователям предоставляется любой выбор в пределах от 2 кГц до 192 кГц. Преимущества формата Vorbis •Отсутствие патентных ограничений. •До 255 каналов. •Частота дискретизации до 192 кГц. •Разрядность до 32 бит. •«Sample accurate» — звуковые данные не будут иметь дополнительных или потерянных сэмплов относительно друг друга. •«Streamable» — поддержка поточного воспроизведения. •Эффективные алгоритмы переменного битрейта. •Гибкий Joint stereo. •Мощная и гибкая психоакустическая модель. •Теги хранятся в Юникоде, а не национальной кодировке. смещений,
  • 54. Контрольные вопросы Формат сжатия звука MP3. • Назовите недостатки формата MP3. • Какие диапазоны битрейта и частоты дискретизации предусмотрены в формате MP3? • Какие режимы управления кодированием звуковых каналов существуют в MP3? • Что такое CBR и VBR? • Формат сжатия звука OGG Vorbis. • Какие требования накладываются на битрейт в формате OGG Vorbis? • Назовите основные преимущества формата Vorbis. •
  • 55. Лекция 9 Формат сжатия звука Windows Media Audio. Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации. Форматы сжатия звука FLAC. FLAC (англ. Free Lossless Audio Codec — свободный аудио-кодек без потерь) — популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3, FLAC не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями. Аудиопоток. Основными частями потока являются: •Строка из четырёх байтов «fLaC» •Блок метаданных STREAMINFO •Другие необязательные блоки метаданных •Аудио фреймы Первые четыре байта идентифицируют поток FLAC. Следующие за ними метаданные содержат информацию о потоке, затем идут сжатые аудиоданные.
  • 56. Метаданные. FLAC определяет несколько типов блоков метаданных (все они перечислены на странице формата). Блоки метаданных могут быть любого размера, новые блоки могут быть легко добавлены. Декодер имеет возможность пропускать неизвеcтные ему блоки метаданных. Обязателен только блок STREAMINFO. Другие блоки предназначены для резервирования места, хранения таблиц точек поиска, тегов, список разметки аудиодисков, а также данных для конкретных приложений. Аудиоданные. За метаданными следуют сжатые аудиоданные. Метаданные и аудиоданные не чередуются. Как и большинство кодеков, FLAC делит входной поток на блоки и кодирует их независимо друг от друга. Разбиение на блоки. Размер блока — очень важный параметр для кодирования. Если он очень мал, то в потоке будет слишком много заголовков фреймов, что уменьшит уровень сжатия. Если размер большой, то кодер не сможет подобрать эффективную модель сжатия. Межканальная декорреляция. Если на вход поступают стерео аудиоданные, они могут пройти через стадию межканальной декорреляции. Правый и левый канал преобразуются к среднему и разностному по формулам: средний = (левый + правый)/2, разностный = левый — правый. В отличие от joint stereo этот процесс не приводит к потерям. Для данных с аудио компакт-дисков это обычно приводит к значительному увеличению уровня сжатия.
  • 57. Моделирование. На следующем этапе кодер пытается аппроксимировать сигнал такой функцией, чтобы полученный после её вычитания из оригинала результат (называемый разностью, остатком, ошибкой) можно было закодировать минимальным количеством битов. Параметры функций тоже должны записываться, поэтому они не должны занимать много места. FLAC использует два метода формирования аппроксимаций: •подгонка простого полинома к сигналу •общее кодирование с линейными предикторами (LPC). Остаточное кодирование. Когда модель подобрана, кодер вычитает приближение из оригинала, чтобы получить остаточный (ошибочный) сигнал, который затем кодируется без потерь. Для этого используется то обстоятельство, что разностный сигнал обычно имеет распределение Лапласа и есть набор специальных кодов Хаффмана, называемый кодами Райса, позволяющий эффективно и быстро кодировать эти сигналы без использования словаря. Составление фреймов. Аудиофрейму предшествует заголовок, который начинается с кода синхронизации и содержит минимум информации, необходимой декодеру для воспроизведения потока. Сюда также записывается номер блока или сэмпла и восьмибитная контрольная сумма самого заголовка. Код синхронизации, CRC заголовка фрейма и номер блока/сэмпла позволяют осуществлять пересинхронизацию и поиск даже в отсутствие точек поиска. В конце фрейма записывается его шестнадцатибитная контрольная сумма. Если базовый декодер обнаружит ошибку, будет сгенерирован блок тишины.
  • 58. Формат сжатия звука AAC. AAC (англ. Advanced Audio Coding) — собственнический (патентованный) формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC). Основные этапы работы AAC. 1. Удаляются невоспринимаемые составляющие сигнала. 2. Удаляется избыточность в кодированном аудио сигнале. 3. Затем сигнал обрабатывается по методу MDCT согласно его сложности. 4. Добавляются коды коррекции внутренних ошибок. 5. Сигнал сохраняется или передаётся. Аудио стандарт MPEG-4 не требует единственного или малого набора высокоэффективных схем компрессии, а скорее сложный набор для выполнения широкого круга операций от кодирования низкокачественной речи до высококачественного аудио и синтезирования музыки. Семейство алгоритмов аудио кодирования MPEG-4 охватывает диапазон от кодирования низкокачественной речи (до 2 кбит/с) до высококачественного аудио (от 64 кбит/с на канал и выше). •AAC имеет частоту сэмплов от 8 Гц до 96 кГц и количество каналов от 1 до 48. •В отличие от гибридного набора фильтров MP3, AAC использует Модифицированное Дискретное Косинусное Преобразование (MDCT) вместе с увеличенным размером «окна» в 2048 пунктов. AAC более подходит для кодирования аудио с потоком сложных импульсов и прямоугольных сигналов, чем MP3. •
  • 59. AAC может динамически переключаться между длинами блоков MDCT от 2048 пунктов до 256. •Если происходит единственная или кратковременная смена, используется малое «окно» в 256 пунктов для лучшего разрешения. •По умолчанию используется большое 2048-пунктовое «окно» для улучшения эффективности кодирования. •Превосходства AAC над MP3 •Частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц — 48 кГц) •До 48 звуковых каналов •Большая эффективность кодирования при постоянном битрейте •Большая эффективность кодирования при переменном битрейте Более гибкий режим Joint stereo Всё это означает, что слушатель получает улучшенное и более стабильное качество звука, чем при MP3 с таким же или меньшим битрейтом.
  • 60. Профили. Low Complexity (MPEG-2/MPEG-4 AAC-LC) • Main Profile • High Efficiency AAC (MPEG-4 HE-AAC) • Scalable Sample Rate (SSR) • Long Term Prediction (LTP) — более сложный и ресурсоёмкий (сл-но • качественней) чем все остальные Advanced Lossless Audio Coding (ALAC AAC) - сильная степень сжатия, без • математических потерь Расширения файлов. .m4a — незащищённый файл AAC • .m4b — файл AAC, поддерживающий закладки. Используется для аудиокниг и • подкастов. .m4p — защищённый файл AAC. Используется для защиты файла от • копирования при легальной загрузке собственнической музыки в онлайнмагазинах, подобных iTunes Store. •
  • 61. Контрольные вопросы Формат сжатия звука Windows Media Audio. • Что такое DRM? • Форматы сжатия звука FLAC. • Назовите основные части аудиопотока в формате FLAC. • Что такое межканальная декорреляция? • Структура фрейма в формате FLAC. • Формат сжатия звука AAC. • Какие профили существуют у формата AAC? •
  • 62. Лекция 10 Сравнение аналоговой и цифровой обработки сигналов Сигналы могут быть обработаны с использованием аналоговых методов (аналоговой обработки сигналов, или ASP), цифровых методов (цифровой обработки сигналов, или DSP) или комбинации аналоговых и цифровых методов (комбинированной обработки сигналов, или MSP). В некоторых случаях выбор методов ясен, в других случаях нет ясности в выборе и принятие окончательного решения основывается на определенных соображениях. Что касается DSP, то главное отличие его от традиционного компьютерного анализа данных заключается в высокой скорости и эффективности выполнения сложных функций цифровой обработки, таких как фильтрация, анализ с использованием быстрого преобразования Фурье (БПФ) и сжатие данных в реальном масштабе времени. Термин "комбинированная обработка сигналов" подразумевает, что системой выполняется и аналоговая, и цифровая обработка. Такая система может быть реализована в виде печатной платы, гибридной интегральной схемы (ИС) или отдельного кристалла с интегрированными элементами. АЦП и ЦАП рассматриваются как устройства комбинированной обработки сигналов, так как в каждом из них реализованы и аналоговые, и цифровые функции.
  • 63.
  • 64.
  • 65.
  • 66. Контрольные вопросы Сравните аналоговую и цифровую обработку сигнала • Какие цифровые способы обработки сигнала вы знаете. • Нарисуйте структурную схему цифрового фильтра. • Чем отличаются АЧХ аналогового и цифрового фильтров • Назовите главное отличие DSP от традиционного компьютерного анализа данных • Что подразумевает термин "комбинированная обработка сигналов" • Что такое «Цепь нормализации сигнала»? • Какое быстродействие требует фильтр со 129 коэффициентами. •
  • 67. Лекция 11 Для сжатия радиочастотного спектра телесигнала необходимо его оцифровать, но просто оцифрованный телесигнал требует скорости передачи информации 15...20 Мбит/с. Резервом для снижения скорости передачи является устранение избыточности. Действительно, избыточность в последовательности кадров в течении некоторого времени – велика (особенно это проявляется на мало динамичных сценах. Таким образом, логично создать такую систему передачи видеосигнала, в которой статиче-ская часть изображения передается редко, а динамическая — чаще. Это называется устранение избыточности во времени (временная из-быточность). Далее замечаем, что фон в большинстве кадров остается практически неизменным, спрашивается, зачем точка за точкой передавать его. Это называется устранение пространственной избыточности. Общие принципы передачи телеизображений Y = 0.299R + 0.587G + 0.114B, U = R - Y, При приеме в цветном телевизоре восстановления (декодирования): V = B - Y, осуществляется R = Y + U, B = Y + V, G = Y - 0.509U - 0.194V обратный процесс
  • 68. В настоящее время в эксплуатации находятся три совместимых системы цветного телевидения - NTSC, PAL, SECAM. Основные различия между ними заключаются в конкретных методах кодирования телевизионного сигнала см. Таблице Тип системы Вертикальная частота развертки, Гц NTSC 60 PAL 50 SECAM 50 Горизонтальная частота развертки, кГц 15.374 15.625 15.625 Число строк в кадре 525 625 625 Число видимых (активных) строк в кадре 480 576 576 Амплитудная Амплитудная Частотная Тип модуляции цветовой поднесущей Полоса видеосигнала, МГц 4.2 Частота цветовой поднесущей, МГц 3.60 Разнос несущих видео/звук, МГц 4.5 5.5 для B/G, 6 для I, 6.5 для D/K 6 7 для B/G, 8 для I/D/K Полная ширина сигнала, МГц 5 для B/G, 5.5 для I, 6 для D/K 4.43 4.41 по U, 4.25 по V
  • 69. Кратко остановимся на особенностях этих систем, рассматривая их в хронологическом порядке. NTSC (National Television System Color). Первая система цветного телевидения, нашедшая практическое применение. Разработана в США в 1953 г. принята для вещания. Именно при ее создании были выработаны основные принципы передачи цвета в телевидении. В NTSC каждая телевизионная строка содержит составляющую яркости Y и два сигнала цветности E I = 0.737U - 0.268V, EQ=0.478U+0.413V. Здесь переход от осей цветового кодирования U, V к осям I, Q обусловлен необходимостью сужения ширины полос цветовых поднесущих всего до ± 0.5 Мгц (в NTSC используется самая узкая полоса видеосигнала). Поскольку глаз человека мелкие детали зеленого и пурпурного цветов (ось Q) воспринимает как неокрашеные (ось I - перпендикулярная к Q), то для сигналов EQ и EI это удается без дополнительных потерь в разрешении. Цветоразностные сигналы передаются путем амплитудной модуляции поднесущих на одной и той же частоте, но с фазовым сдвигом на 90њ . Последнее обстоятельство является принципиально важным для разделения сигналов при приеме. Однако, из-за неизбежных нелинейных искажений в канале передачи поднесущие оказываются промодулированными сигналом яркости как по амплитуде, так и по фазе. В результате в зависимости от яркости участков изображений изменяются их цветовой тон. Например, человеческие лица на изображении окрашиваются в красноватый цвет в тенях и в зеленоватый - на освещенных участках. Это и является основным недостатком системы NTSC.C целью его устранения немецкой фирмой Telefunken в 1963 г. была разработана система
  • 70. PAL (Phase Alternation Line). Здесь использована аналогичная амплитудная модуляция цветоразностных сигналов EU=0.877U и EV=0.493V с фазовым сдвигом на 90њ , но через строку дополнительно производится изменение знака амплитуды составляющей EU. В результате при восстановлении в декодере цветовые составляющие надежно разделяются сложением/вычитанием сигналов цветности последовательных телевизионных строк, и паразитная яркостная модуляция приводит лишь к некоторому изменению цветовой насыщенности. Усреднение сигналов двух строк обеспечивает также повышение отношения сигнал/шум, но приводит к снижению вертикальной четкости в два раза. Впрочем частично последнее компенсируется увеличением числа телевизионных строк разложения. Система PAL принята в большинстве стран Западной Европы, Африки и Азии, включая Китай, Австралию и Новую Зеландию.
  • 71. SECAM (SEquentiel Couleur A Memoire). Первоначально была предложена во Франции еще в 1954 г., но регулярное вещание после длительных доработок было начато только в 1967 одновременно во Франции и СССР. В настоящее время она принята также в Восточной Европе, Монако, Люксембурге, Иране, Ираке и некоторых других странах. Основная особенность системы поочередная, через строку, передача цветоразностных сигналов (D R= +1.9U, DB=1.5V) с дальнейшим восстановлением в декодере путем повторения строк. При этом в отличие от PAL и NTSC используется частотная модуляция поднесущих. В результате цветовой тон и насыщенность не зависят от освещенности, но на резких переходах яркости возникают цветовые окантовки. Обычно после ярких участков изображения окантовка имеет синий цвет, а после темных - желтый. Кроме того, как и в системе PAL, цветовая четкость по вертикали снижена вдвое.
  • 72. формирование полного телевизионного сигнала к видео необходимо добавить звук, а полученный так называемый низкочастотный телевизионный сигнал передать через эфир путем модуляции гармоники одного из доступных радиоканалов (48,5...66 МГц - первый частотный диапазон, 76...100 МГц - второй частотный диапазон, 174...230 МГц - третий частотный диапазон, 470...790 МГц четвертый частотный диапазон). И здесь даже в рамках одной системы существуют различия, связанные с конкретной шириной спектра видеосигнала и его разносом со звуковой частью, полярностью амплитудной модуляции радиоканала изображения и типом модуляции радиоканала звука. В таблице представлены основные параметры телевизионных стандартов стран мира. Стандарт A B C D E F G H I K L M N Число строк 405 625 625 625 819 819 625 625 625 625 625 525 625 Ширина канала, МГц 5 7 7 8 14 7 8 8 8 8 8 6 6 Полоса в/сигнала, МГц 3 5 5 6 10 5 5 5 5.5 6 6 4.2 4.2 Разнос видео/ звук, МГц 3.5 5.5 5.5 6.5 11.15 5.5 5.5 5.5 6 6.5 6.5 4.5 4.5 Полярность модуляции видео + + + + + - Тип модуляции несущей звука AM ЧМ AM ЧМ AM AM ЧМ ЧМ ЧМ ЧМ AM ЧМ ЧМ
  • 73. Контрольные вопросы Какие можно выделить два общих класса цифрового телевидения? • Назовите основные принципы передачи телеизображений. • Почему для передачи телеизображений используют цветоразностные сигналы? • Что такое чересстрочная развертка? • Система NTSC. • Система PAL. • Система SECAM. • Какие существуют стандарты телевизионного вещания? •
  • 74. Лекция 12 Цифровое представление сигнала К системам кодирования в цифровой видеотехнике предъявляются весьма многочисленные и часто противоречивые требования. Поэтому на практике кодирование всегда выполняется в несколько приемов. Сейчас принято выделять следующие основные виды: кодирования источника информации с целью преобразования сигнала в цифровую форму и его экономное представление путем сжатия или, как часто говорят, компрессии; кодирования с целью обнаружения и исправления ошибок; канального кодирования с целью согласования параметров цифрового сигнала со свойствами канала связи и обеспечения самосинхронизации. Преобразование аналогового телевизионного сигнала в цифровой. Цифровой телевизионный сигнал получается из аналогового телевизионного сигнала путем преобразования его в цифровую форму. Это преобразование включает следующие три операции: •Дискретизацию во времени, т. е. замену непрерывного аналогового сигнала последовательностью его значений в дис-кретные моменты времени - отсчетов или выборок. •Квантование по уровню, заключающееся в округлении значения каждого отсчета до ближайшего уровня квантования. •Кодирование (оцифровку), в результате которого значение отсчета представляется в виде числа, соответствующего номеру полученного уровня квантования.
  • 75. Схема включения АЦП (а) и его входные и выходные сигналы (б)
  • 76. Дискретизация видеосигнала Перейдем к анализу параметров аналого-цифрового преоб-разования. Первым из них является частота дискретизации fд. В соответствии с теоремой Котельникова должно выполняться условие fд> 2fв, где fв - верхняя граничная частота спектра преобра-зуемого в цифровую форму сигнала. Отсюда следует, в частности, что частота дискретизации телевизионного сигнала, используемо-го в нашей стране (fв = 6 МГц), должна быть не менее 12 МГц. Дискретизация сигнала при выполнении (а-в) и при нарушении (г-е) условий теоремы Котельникова
  • 77. Спектр дискретизированного сигнала при выполнении (а) и при нарушении (б) условий теоремы
  • 78. Варианты расположений отсчетов при дискретизации изображения
  • 79. Дискретизация изображения. Исходное изображение (а), дискретизированное изображение (б) и результат интерполяции (в)
  • 80. 1 b ( x, y ) = 2 4π ∞ ∞ ∫ ∫ S( f , f x y )e 2π j ( xf x + yf y ) −∞ −∞ Пример двумерной функции координат df x df y
  • 81. Примерный вид пространственного спектра для реальных изображений
  • 82. Пространственные спектры дискретизированных изображений в случаях выполнения (а) и нарушения (б) условий аналога теоремы Котельникова для двумерных сигналов
  • 84. Контрольные вопросы Что такое интерполяция? • В чем проявляются искажения одномерного сигнала, создаваемые дискретизацией, в случае нарушений условий теоремы Котельникова? • Что такое двумерное преобразование Фурье? • Что такое пространственная частота? В каких единицах она измеряется (в случае непрерывных изображений)? • Как преобразуется пространственный спектр непрерывного изображения при дискретизации в случаях выполнения и нарушения условий двумерного аналога теоремы Котельникова? • Почему ошибка квантования является случайной? Каков характер распределения этой случайной величины? • Какие виды искажений возникают в изображении при дискретизации? • От каких параметров зависит полоса частот видеосигнала? •
  • 85. Лекция 12 важнейший параметр аналого-цифрового Следующий преобразования число уровней квантования Nкв, определяемое числом двоичных разрядов АЦП п в соответствии с соотношением Nкв = 2n Выбор значения Nкв осуществляется так, чтобы влияние квантования на изображение не было заметно для получателя информации. Сигнал до квантования (а), сигнал после квантования (б), ошибка квантования (в)
  • 86. Исходное распределение яркости в изображении (а) и распределение яркости после квантования (б)
  • 87. Это обусловлено в первую очередь свойствами зрительного аппарата человека. Как известно, пороговое превышение яркости ΔBпор объекта над фоном, при котором объект различается наблюдателем, подчиняется в первом приближении закону Вебера-Фехнера ΔBпор/B0 = k где k = 0,015...0,020; В0 - яркость фона. Таким образом, с ростом яркости фона растет и порог ΔBпор. Передаточная характеристика гамма-корректора описывает-ся соотношением Uвых/Uвыхм = (Uвх/Uвхм)γ где Uвх и Uвых - напряжения сигналов на входе и на выходе гамма-корректора, соответственно; Uвхм и Uвыхм - максимальные значения диапазонов напряжений сигналов на входе и на выходе гамма-корректора, соответственно; γ = 0,42...0,48 показатель гамма-коррекции. График передаточной характеристики гамма-корректора для случая γ=0,45 приведен на рис.
  • 90. изображение, квантованное на 4 уровня, и соответствующий такому числу уровней шум квантования, в котором нетрудно разглядеть сюжет исходного изображения Изображение, показанное на рис. получено с использованием 128 уровней