Аудио. Цифровое и аналоговое аудио. Оцифровка аналогового сигнала Ростех "огражданивается" и покушается на лавры Samsung и General Electric

Преобразование аналогового сигнала в цифровую форму представляет собой комплекс трех операций: дискретизацию, квантование и кодирование.

Дискретизация - замена непрерывного аналогового ТВ-сигнала S(t) последовательностью выборок (отсчетов) этого сигнала (Рис. 2). Эти отсчеты берутся в моменты времени, отделенные друг от друга интервалом Т, который называется интервалом дискретизации. Величина, обратная интервалу дискретизации, называется частотой дискретизации. Наиболее распространена равномерная дискретизация с постоянным периодом, основанная на теореме Котельникова. Согласно этой теореме любой непрерывный сигнал S(t), имеющий ограниченный спектр частот (0...f гp), может быть без потерь информации представлен значениями этого сигнала S di . взятыми в дискретные моменты времени t n =nT (п=1,2,3,... -- целые числа) при условии, что T?0,5/t rp (Т -- период, или интервал дискретизации). Минимально допустимая частота дискретизации по Котельнику t д.мин =2f гp .

Понятно, чем меньше интервал дискретизации (выше частота дискретизации), тем меньше различия между исходным сигналом и его дис-кретизированной копией. Ступенчатая структура дискретизированного сигнала может быть сглажена с помощью фильтра нижних частот. Таким образом и осуществляется восстановление аналогового сигнала из дискретизированного.

За дискретизацией при преобразовании аналогового сигнала в цифровую форму следует процесс квантования, который заключается в замене полученных после дискретизации мгновенных значений отсчетов S di ближайшими значениями из набора отдельных фиксированных уровней (рис.3). Квантование также представляет собой дискретизацию сигнала S q , но не во времени, а по уровню. Фиксированные уровни, к которым "привязываются" отсчеты, называются уровнями квантования. Динамический диапазон изменения сигнала S(t), разбитый уровнями квантования на отдельные области значений (шаги квантования), образует шкалу квантования.

Последняя может быть как линейной, так и нелинейной, в зависимости от условий преобразования. Округление отсчета до ближайшего уровня (верхнего или нижнего) определяется положением порога квантования внутри шага квантования.

Дискретизированный и квантованный сигнал S dq уже является цифровым. Действительно, если амплитуда импульсов дискретизированного сигнала S d может принимать любые произвольные значения в пределах исходного динамического диапазона сигнала S(t), то операция квантования привела к замене возможных значений амплитуды сигнала ограниченным числом значений, равным числу уровней квантования. Таким образом, квантованная выборка сигнала выражается некоторым числом, определяемым числом уровней квантования.

Для передачи такого сигнала по каналам связи его лучше всего преобразовать в двоичную форму, т.е. каждое значение уровня сигнала записать в двоичной системе счисления. При этом номер (значение уровня) преобразуется в кодовую комбинацию символов "0" или "1" (рис.4). В этом состоит третья, заключительная oneрация по преобразованию аналогового сигнала S(t) в цифровой S dq , называемая кодированием.

Все эти три операции выполняются одним техническим устройством -- аналого-цифровым преобразователем (АЦП). Обратное преобразование цифрового сигнала в аналоговый производится в устройстве, называемом цифро-аналоговым преобразователем (ЦАП). Аналого-цифровые и цифро-аналоговые преобразователи -- непременные блоки любых цифровых систем передачи, хранения и обработки информации.

При непосредственном кодировании телевизионного сигнала кодовые комбинации создаются с частотой, равной частоте отсчетов (частоте дискретизации f д). Каждая кодовая комбинация соответствует определенному отсчету и содержит некоторое число m двоичных символов (битов). Кодовые слова можно передавать в параллельной или последовательной формах. Для передачи в параллельной форме надо использовать к линий связи (на рис.4 к=4).

Символы кодового слова одновременно передаются по линиям в пределах интервала дискретизации. Для передачи в последовательной форме интервал дискретизации надо разделить на подинтервалы-такты. В этом случае символы слова передаются последовательно по одной линии, причем на передачу одного символа слова отводится один такт.

При передаче цифровой информации по каналам связи скоростью передачи называется число передаваемых двоичных символов в единицу времени. За единицу скорости принимается 1 бит/с. Скорость передачи сигнала в цифровой форме будет равна произведению частоты дискретизации? д и числа двоичных символов в одном дискретном отсчете m:

Если верхняя граничная частота ТВ-сигнала равна 6 МГц, то минимальная частота дискретизации, по теореме Котельникова, равна 12 МГц. Как правило, в системах цифрового телевидения частоту f д выбирают немного выше минимально допустимой. Связано это с необходимостью унификации цифрового ТВ-сигнала для различных стандартов телевидения. В частности, для студийного цифрового оборудования рекомендована частота дискретизации 13,5 МГц.

Число уровней квантования сигнала должно быть выбрано не меньше максимального числа градаций яркости, различимых глазом, которое, в зависимости от условий наблюдения, колеблется в пределах 100...200. Отсюда m=6,6...7,6.

Очевидно, число символов в кодовой комбинации может быть только целым, а значит, разрядность кодовой комбинации m=7 (или 8). В первом случае кодовая комбинация может нести информацию о 128 возможных уровнях сигнала (градациях яркости), во втором случае -- 256. Если принять m =8, то скорость передачи цифровой информации

V n =13,5 8=108 (Мбит/с).

Если учесть, что, кроме сигнала яркости, должна быть передана информация о цвете, то общий цифровой поток удвоится и будет равен 216 Мбит/с. Столь высоким быстродействием должны обладать как устройства преобразования ТВ-сигнала, так и каналы связи.

Передавать такой большой цифровой поток по каналам связи экономически нецелесообразно, поэтому следующей задачей является "сжатие" цифрового ТВ-сигнала. Резервы для уменьшения цифрового потока без ущерба для качества воспроизводимого изображения существуют. Эти резервы заключены в специфике ТВ-сигнала, обладающего значительной информационной избыточностью. Эту избыточность обычно разделяют, несмотря на некоторую условность такого деления, на статистическую и физиологическую.

Статистическая избыточность определяется свойствами изображения, которое не является в общем случае хаотическим распределением яркости, а описывается законами, устанавливающими определенные связи (корреляцию) между яркостями отдельных элементов. Особенно велика корреляция между соседними (в пространстве и во времени) элементами изображения. Знание корреляционных связей позволяет не передавать многократно одну и ту же информацию и сократить цифровой поток.

Второй тип -- физиологическая избыточность -- обусловливается ограниченностью зрительного аппарата человека. Учет физиологической избыточности позволяет не передавать в сигнале ту информацию, которая не будет воспринята нашим зрением.

Аналогично, несовершенство слухового аппарата человека позволяет "избавиться" от избыточной аудиоинформации в сигнале.

Наверное, каждый, кто хоть раз слушал SDR приемник или трансивер, не смог остаться равнодушным к его приему, а особенно к удобству, которое проявляется в том, что станции на диапазоне можно не только слышать, но и видеть. Обзор диапазона на панораме SDR трансивера позволяет быстро и визуально находить станции в полосе приема, что значительно ускоряет поиск корреспондентов во время контестов, да и при повседневной работе в эфире. С помощью «водопада» визуально отслеживается история сигналов на диапазоне и можно легко осуществить переход на интересного корреспондента. К тому же сама панорама показывает нам АЧХ принимаемых станций, их полосу и ширину излучения, что позволяет оперативно находить свободный участок на диапазоне для вызова других радиолюбителей.
Это только если говорить о визуальной части SDR, но также не стоит забывать и об обработке сигналов, как на прием, так и на передачу. Полный контроль ширины и всего, что находится в полосе приема. При правильном выборе необходимых параметров в пунктах меню настроек, сигнал на передачу тоже звучит великолепно.
Но есть одно обстоятельство, чтобы заставить работать SDR, нужны дополнительные устройства: собственно компьютер с качественной звуковой картой, на которой происходит основная обработка сигнала и хороший монитор с высоким разрешением экрана. Естественно, необходимо соответствующее программное обеспечение к нему и к SDR трансиверу, которое стоит не дёшево. Всё это уже влечет за собой определенные специфические требования к знаниям компьютера у радиолюбителя. Что не всегда, и не у всех, к сожалению присутствует.
Имеется еще один недостаток. Если на прием этого не заметно, то на передачу, в связи со специфической обработкой звукового сигнала в компьютере, возникает значительная задержка сигнала более 150 мс, что полностью исключает нормальную работу самоконтроля во всех видах излучения. Спасает только дополнительный контрольный приемник или товарищ, у которого тоже имеется SDR трансивер, который сделает запись принимаемого сигнала.
В настоящее время, с появлением поколения доступных микропроцессоров от STM, появилась возможность разработки устройств, способных частично заменить некоторые основные функции больших компьютеров. А именно, обработка DSP звука и управление трансивером, а также графическое отображение информации на дисплее трансивера.
Как итог, основные узлы такого трансивера, позволяют отказаться от внешнего компьютера . Но при этом, как на внешнем компьютере, сохраняется удобный сервис по управлению трансивером, различные режимы записи сигналов, как на прием, так и на передачу, с последующим воспроизведением записей через наушники или в эфир во время передачи, сохранение необходимой информации на внешней SD-карте, которая выводится на собственный большой дисплей с широкой полосой обзора, а так же обработка DSP и формирование сигнала со всеми основными видами излучения. Такие трансиверы обеспечивают качественный прием сигнала, высокую крутизну фильтров с плавными настраиваемыми границами, автоматический Notch фильтр. В них на передачу применяется многополосные графические эквалайзеры, компрессоры, ревербераторы, а самое главное, получается минимальное время задержки. При наличии внешнего синтезатора, контроллеры трансиверов легко работают с аналоговыми SDR. В этих современных трансиверах широко применяются радиотракты HiQSDR и HiQSDR-mini 2.0, которые управляются отдельной шине SPI, или через плату DSP по основной шине SPI при минимуме связующих проводов.
Ещё несколько лет назад начался выпуск SDR-трансиверов, работающих по принципу непосредственного преобразования радиочастотного сигнала на звуковую ПЧ, в которых в одном корпусе располагается упрощённая (по сравнению с классической схемой) плата радиоканала и специализированный компьютер. Основной упор здесь делается на программное обеспечение. Основная стоимость готового изделия так же определяется стоимостью софта. Оборудование Flex и Sun SDR построены именно по такому принципу.
В настоящее время принцип обработки сигналов на основе методов ЦОС (DSP) перешёл к следующему этапу своей эволюции. Появился новый метод прямой оцифровки сигнала с антенны с последующим непосредственным формированием сигнала из цифры, позволяющий избавиться практически от всех видов проблем присущих как классике, так и SDR-технологиям с аппратаной обработкой сигнала.
Радиоприёмники и трансиверы с прямой оцифровкой сигнала имеют аббревиатуру DDC (от Digital Down-Converter). Обратное преобразование из цифры в аналог имеют аббревиатуру DUC (от Digital Up-Converter). Речь идёт о цифровом преобразовании сигнала программным методом. Сразу нужно отметить, что аббревиатура SDR (Software Define Radio) - программно определяемое радио - это только общее определение класса технологий обработки сигналов, куда входит и DDC - архитектура, как один из методов.

Уже сегодня, с появлением поколения доступных микропроцессоров, появилась возможность разработки устройств, способных частично заменить некоторые основные функции больших компьютеров. А именно, обработка DSP звука и управление трансивером, а также графическое отображение информации на дисплее трансивера. В архитектуре DDC мгновенно оцифровывается весь спектр сигналов от 0 Гц до частот, которые способна обработать микросхема АЦП. Самые современные микросхемы АЦП на сегодня могут работать в полосе до 1ГГц, но их стоимость сегодня пока очень высока. В тоже время, наиболее ходовые и относительно дешёвые микросхемы АЦП оцифровывают спектр полосой от 0 Гц до 60...100 МГц, что для радиолюбительских задач вполне подходит. После оцифровки спектра сигналов в полосе 0 Гц - 30...60 МГц на выходе микросхемы АЦП получается очень большой цифровой поток данных, который в дальнейшем обрабатывается высокоскоростными микросхемами ПЛИС. В них программным способом реализован алгоритм DDC/DUC, т.е. цифровой понижающий или повышающий конвертер.
Цифровой понижающий конвертер производит выборку спектра необходимой полосы и передачу его в компьютер для обработки - т.е. создаётся цифровой поток существенно меньшей полосы и скорости. В компьютере происходит программная обработка потока методами ЦОС и конечная демодуляция сигнала.
В практической деятельности очень редко возникает необходимости работать со всем спектром сигналов в полосе 0 Гц - 30...60 МГц. Максимальные полосы, которые нам нужны для обработки - это 10...50 кГц для демодуляции АМ, ЧМ сигналов и 3...5 кГц для SSB сигналов.
Этот самый передовой метод обработки сигналов был реализован в радиолюбительских трансиверах TULIP-DSP и отечественном аналоге – Тюльпан-DDС/DUC.

Подобный принцип формирования сигнала применяется и в трансиверах одной известной фирмы, начавший выпуск новых моделей ещё в 2015 году. Фрагмент структурной схемы такого трансивера представлен ниже.

Если раньше, ещё несколько лет назад, даже в таких передовых трансиверах типа ICOM IC-756Pro3 и IC-7600 применяется метод последовательной развёртки спектра и был заметен процесс обновления картинки - т.е. быстрое сканирование, то теперь наблюдение и обработка сигнала происходит в комплексе, параллельно, так как перестройка частоты происходит мгновенно программным методом. За счёт того, что оцифровывается сразу большой частотный участок 30...60 МГц, не теряя настройку на текущую радиостанцию, появляется возможность увидеть, что происходить на соседнем участке спектра. Мало того, вызвав второй виртуальный приёмник вы одновременно можете слышать, о чём говорят на одном и втором диапазоне. Но и два приёмника это не предел. Есть возможность вызвать три, пять, десять... сколько угодно приёмников. Микшируя их звук определённым образом, вы в курсе происходящих событий на диапазонах. А графика «облаком» позволит быстро выбрать нужную станцию.
Тоже самое относится и к отображению спектра. На практике, редко когда нужен сразу весь участок 30...60 МГц. При необходимости, можно сравнительно легко выделить из общего цифрового потока второй, третий, четвёртый и вообще, сколько необходимо малых потоков и передать их в компьютер, создав тем самым одновременно несколько каналов приёма. Таким методом реализуются два, три или сколько нужно «виртуальных приёмников» во всей полосе оцифровки. Например, создаём отдельную панораму на диапазон 40 метров, отдельную на 20-ти метровый диапазон и на остальные диапазоны..., размещаем их на отдельном мониторе и вот мы получили возможность наблюдать в реальном формате времени за условиями прохождения на выбранных нами участках.

С одной стороны, наличие зеркальных полос - это недостаток. Так как понятие ДД относится ко всему спектру оцифровки, то значительно разгрузить вход АЦП можно, уделив внимание входным цепям приёмника, которые лучше делать высокодобротными и перестраиваемыми. Как альтернативный вариант – применение во входных цепях ФНЧ с частотой среза половины частоты тактирования или диапазонных полосовых фильтров. Они могут дополнительно ослаблять сильные внеполосные сигналы, отстоящие от рабочей полосы достаточно далеко. При этом, теряется возможность обзора всего диапазона оцифровки. Такие методы предварительной селекции оправданы, в случае, если планируется использовать DDC-приёмник совместно с большими антеннами или в местности со сложной помеховой обстановкой.
С другой стороны - этот недостаток предоставляет технологическую возможность простыми средствами реализовать не только приём на КВ диапазоне, но и на УКВ и даже на ДЦВ диапазонах. Необходимо всего лишь делать сменные диапазонные полосовые фильтры с МШУ, полосами равными половине тактовой частоты.
Например, в некоторые DDC приёмники ставят отключаемый фильтр на СВ-ДВ диапазон, а в одном из DDC-приёмников компании WiNRADiO и DDC-приёмнике Perseus, есть гибко конфигурируемые узкополосные фильтры.
Ещё каких-нибудь 20 лет назад ни о чём подобном мы не могли даже и мечтать, когда панорамная приставка к трансиверу была размером в 2 раза больше самого трансивера и стоила в 5-10 раза дороже. Про сервис с качеством и говорить не приходится. Появившаяся в начале 2000-ых годов технология SDR позволила взглянуть на эфир и услышать его совсем иначе. Мы увидели настоящий живой эфир! Не статическую «замороженную» картинку после медленного сканирования, а именно, живой эфир в реальном времени.
Если, для того что бы увидеть урезанную панораму других диапазонов в первых SDR трансиверах с аппаратным преобразованием сигналов, необходимо иметь отдельный приёмный тракт для каждого диапазона, то в приёмном тракте, выполненным по современной технологии DDC доступен как любой из участков диапазона, так и весь диапазон, и при этом параллельно с отдельными участками его участками. Реализация всех этих возможностей возможна только благодаря методам ЦОС и прямой оцифровки сигнала.
Касательно радиолюбительской тематики, одной из самых востребованных функций в настоящее время и ближайшем будущем - это пространственная селекция сигналов и методы фазового подавления шумов. На сегодня существует фазовый метод селекции сигналов и подавления шумов, реализуемый аппаратно. Кроме того, используя математические алгоритмы, легко реализуемы любые функции по вычитанию мешающих и сложению полезных сигналов, образуемые парой, четвёркой или большим количеством АЦП.
С применением этих современных разработок появилась возможность дистанционного управления трансивером и удалённая работа в эфире. Современные способы передачи информации способны пропускать достаточно большие потоки данных и практически без потерь. Общий поток информации из/в трансивер совсем получается небольшой. Используя IP-стек, появляется возможность использовать трансивер как сегмент сети даже без использования компьютера. Установив трансивер за пределами большого города в достаточно тихой местности, - вы можете иметь доступ к радиоэфиру не выходя из своей квартиры. Организовав гостевой доступ к трансиверу, вы предоставляете возможность друзьям поработать в эфире. Ещё одной полезной функцией, применяемой специальными службами, является возможность записывать весь радиоэфир, или заданные куски радиоэфира, на винчестер компьютера с отсроченной обработкой. Эта функция позволяет быстро проводить статистическую обработку сигналов, вести поиск и наблюдение за целевыми сигналами, а также совершать множество операций, о которых знать обычному пользователю не положено.

Вы можете выбрать интересующие Вас рации в

Несмотря на то, что большую часть внешней информации мы усваиваем с помощью зрения, звуковые образы для нас ничуть не менее важны, а часто даже и более. Попробуйте посмотреть кино с выключенным звуком – через 2-3 минуты вы потеряете нить сюжета и интерес к происходящему, каким бы большим ни был экран и качественным изображение! Поэтому в немом кино за кадром играл тапер. Если же убрать изображение и оставить звук, кино вполне можно «слушать» как увлекательную радиопостановку.

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы. При этом наш слух с большой точностью может локализовать невидимый источник звука по направлению, расстоянию, скорости перемещения.

Звук научились преобразовать в электрические колебания задолго до изображения. Этому предшествовала механическая запись звуковых колебаний, история которой началась еще в 19 веке.

Ускоренный прогресс, включая возможность передачи звука на расстояние, стал возможен благодаря электричеству, с появлением усилительной техники, акустоэлектрических и электроакустических и преобразователей – микрофонов, звукоснимателей, динамических головок и прочих излучателей. Сегодня звуковые сигналы передаются не только по проводам и через эфир, но и по оптоволоконным линиям связи, в основном в цифровом виде.

Акустические колебания преобразуются в электрический сигнал обычно с помощью микрофонов. Любой микрофон имеет в своем составе подвижный элемент, колебания которого порождают ток или напряжение определенной формы. Наиболее распространенный тип микрофона – динамический, представляющий собой «динамик наоборот». Колебания воздуха приводят в движение мембрану, жестко связанную со звуковой катушкой, находящейся в магнитном поле. Конденсаторный микрофон, по сути, и есть конденсатор, одна из обкладок которого колеблется в такт со звуком, а вместе с ней изменяется емкость между обкладками. В ленточных микрофонах используется тот же принцип, только одна из пластин свободно подвешена. Схож с конденсаторным электретный микрофон, пластины которого в процессе колебаний сами вырабатывают электрический заряд, пропорциональный амплитуде колебаний. Многие модели микрофонов имеют встроенный усилитель (уровень сигнала непосредственно с акусто-электрического преобразователя очень мал). В отличие от микрофона, звукосниматель электромузыкального инструмента регистрирует колебания не воздуха, а твердого тела: струны или деки инструмента. Головка звукоснимателя считывает канавку грампластинки с помощью иглы, механически соединенной с подвижными катушками, находящимися в магнитном поле, либо магнитами, если катушки неподвижны. Либо колебания иглы передаются на пьезоэлемент, который при механических воздействиях вырабатывает электрический заряд. В магнитной записи звуковой сигнал записывается на магнитную ленту, а затем считывается специальной головкой. Наконец, в кинематографе традиционно была принята оптическая запись: с краю пленки наносилась непрозрачная звуковая дорожка, ширина которой менялась в такт со сигналом, и при протягивании пленки через проекционный аппарат электрический сигнал снимался с помощью фотосенсора.

В синтезаторах звук рожается непосредственно в виде электрических колебаний, здесь отсутствует первичное преобразование акустических волн в электрический сигнал.

Современные источники звука осень разнообразны, и все большее распространение получают цифровые носители: компакт-диски, DVD, хотя сохраняются еще и виниловые пластинки. Мы продолжаем слушать радио, как эфирное, так и кабельное (радио-точки). Звук сопровождает телепередачи и кинофильмы, не говоря уже о таком привычном явлении, как телефония. Все больший удельный вес в мире аудио получает компьютер, позволяющий с удобством архивировать, комбинировать и обрабатывать звуковые программы в виде файлов. В век цифровых технологий оцифрованная речь и музыка передается по цифровым каналам, включая сеть Интернет, без серьезных потерь на транспортировку. Это обеспечивается цифровым кодированием, и потери возникают исключительно из-за сжатия, которое чаще всего при этом используется. Однако на цифровых носителях его либо нет вовсе (CD, SACD), либо применяются алгоритмы сжатия звука без потерь (DVD Audio, DVD Video). В остальных случаях степень сжатия определяется требуемым уровнем качества фонограммы (файлы MP3, цифровая телефония, цифровое телевидение, некоторые типы носителей).

Рис. 1. Преобразование акустических звуковых колебаний в электрический сигнал

Обратное преобразование из электрических колебаний в акустические осуществляются с помощью громкоговорителей, встроенных в радиоприемники и телевизоры, а также отдельных акустических систем, головных телефонов.

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц. Ниже (инфразвук) и выше (ультразвук) человеческое ухо не слышит, да и в пределах звукового диапазона чувствительность слуха весьма неравномерна, ее максимум приходится на частоту 4 кГц. Чтобы слышать звуки всех частот одинаково громко, нужно воспроизводить их с разным уровнем. Такой прием, называемый тонкомпенсацией, часто реализуется в бытовой аппаратуре, хотя результат его нельзя признать однозначно положительным.

Рис. 2. Кривые равной громкости
(Нажмите на изображение для увеличения)

Физические свойства звука обычно представляются не в линейных, а в относительных логарифмических величинах – децибелах (дБ), поскольку это гораздо нагляднее в цифрах и компактнее на графиках (в противном случае пришлось бы оперировать с величинами, имеющими множество нулей до запятой и после, и вторые с легкостью потерялись бы на фоне первых). Отношение двух уровней A и B в дБ (скажем, напряжения или тока) определяется как:

С u [дБ] = 20 lg A/B. Если же речь идет о мощностях, то С p [дБ] = 10 lg A/B.

Кроме частотного диапазона, определяющего чувствительность человеческого слуха к высоте звука, существует также понятие диапазона громкостей, который показывает чувствительность уха к уровню громкости и охватывает интервал от самого тихого звука, различимого слухом (порог чувствительности), до самого громкого, за которым лежит болевой порог. Порог чувствительности принят как звуковое давление в 2 х 10 -5 Па (Паскаль), а болевой порог – давление, в 10 миллионов раз большее. Иными словами, диапазон слышимости, или отношение давления самого громкого звука, к самому тихому, составляет 140 дБ, что заметно превосходит возможности любой аудио аппаратуры ввиду ее собственных шумов. Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона (отношение самого громкого звука, воспроизводимого аппаратурой, к уровню шума) 120 дБ, компакт-диск обеспечивает 90 дБ, виниловая пластинка – порядка 60 дБ.

Рис. 3. Диапазон чувствительности слуха

Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона

Шумы всегда присутствуют в звуковом тракте. Это как собственные шумы усилительных элементов, так и внешние наводки. Искажения сигнала делятся на линейные (амплитудные, фазовые) и нелинейные, или гармонические. В случае линейных искажений спектр сигнала не обогащается новыми компонентами (гармониками), изменяются лишь уровень или фаза уже существующих. Амплитудные искажения, нарушающие изначальные соотношения уровней на разных частотах, приводят к слышимым искажениям тембра. Долгое время считалось, что фазовые искажения некритичны для слуха, однако на сегодня доказано обратное: и тембр, и локализация звука в значительной мере зависимы от фазовых соотношений частотных компонентов сигнала.

Любой усилительный тракт нелинеен

Любой усилительный тракт нелинеен, поэтому всегда возникают гармонические искажения: новые частотные компоненты, отстоящие по частоте в 3, 5, 7 и т.д. от порождающего их тона (нечетные гармоники) или в 2, 4, 6 и т.д. раз (четные). Порог заметности гармонических искажений сильно варьирует: от нескольких десятых и даже сотых долей процента до 3-7%, в зависимости от состава гармоник. Четные гармоники менее заметны, поскольку находятся в консонансе с основным тоном (разница по частоте в два раза соответствует октаве).

Помимо гармонических, имеют место интермодуляционные искажения, представляющие собой разностные продукты частот спектра сигнала и их гармоник. Например, на выходе усилителя, на вход которого подано две частоты 8 и 9 Гц (при достаточно нелинейной его характеристике) появится третья (1 кГц), а также целый ряд других: 2 кГц (как разность вторых гармоник основных частот) и т.д. Интермодуляционные искажения особенно неприятны на слух, поскольку порождают множество новых звуков, включая диссонансные по отношению к основным.

То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя

Шумы и искажения в значительной степени маскируются сигналом, однако они и сами маскируют сигналы малого уровня, которые исчезают или теряют отчетливость. Поэтому чем выше отношение сигнал/шум, тем лучше. Фактическая чувствительность к шумам и искажениям зависит от индивидуальных особенностей слуха и его натренированности. Уровень шумов и искажений, не влияющий на передачу речи, может быть абсолютно неприемлемым для музыки. То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя.

ПЕРЕДАЧА АНАЛОГОВОГО АУДИО

Традиционно аудио сигналы передавались по проводам, а также эфиру (радио).

Различают небалансную линию передачи (классическая проводная) и балансную. Небалансная имеет в своем составе два провода: сигнальный (прямой) и обратный (земля). Такая линия весьма чувствительна к внешним помехам, поэтому для передачи сигнала на большие расстояния не подходит. Часто реализуется с помощью экранированного провода, экран при этом соединяется с землей.

Рис. 4. Небалансная экранированная линия

Балансная линия предполагает три провода: два сигнальных, по которым течет один и тот же сигнал, но в противофазе, и землю. На приемной стороне синфазные помехи (наведенные на оба сигнальных провода) взаимно вычитаются и полностью исчезают, а уровень полезного сигнала удваивается.

Рис. 5. Балансная экранированная линия

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная.

На рисунках точки подключения экрана показаны условно, поскольку их приходится каждый раз подбирать «по месту» для достижения наилучших результатов. Чаще всего экран подключается только на стороне приемника сигнала.

Аудиосигналы нормируются по уровню действующего напряжения (0,707 от амплитудного значения):

микрофонный 1-10 мВ (для микрофонов без встроенного усилителя),
линейный 0,25-1 В, обычно 0,7 В.

На выходе усилителя мощности, с которого сигнал поступает на громкоговорители, его уровень гораздо выше и может достигать (в зависимости от громкости) 20-50 В при токах до 10‑20 А. Иногда – до сотен вольт, для трансляционных линий и озвучивания открытых пространств.

Используемые кабели и разъемы:

для балансных линий и микрофонов – экранированная пара (часто витая), 3-контактные разъемы XLR или клеммы, винтовые или зажимные;

Рис. 6. Разъемы для балансных линий: клеммы и XLR

для небалансных линий – экранированный кабель, разъемы RCA («тюльпан»), реже DIN (а также ГОСТ), а также различные штекеры;

Рис. 7. Разъемы для небалансных линий: RCA, 3,5-мм и 6,25-мм штекеры

для мощных сигналов для громкоговорителей – неэкранированные (за редким исключением) акустические кабели большого сечения, клеммы или зажимы, разъемы типа «банан» или «игла»

Рис. 8. Разъемы акустических кабелей

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах. Имеют значение материалы проводника и диэлектрика, сечение, геометрия кабеля. В самых дорогих моделях межблочных и акустических кабелей применяется сверхчистая медь и даже цельное серебро, а также тефлоновая изоляция, отличающаяся минимальным уровнем диэлектрической абсорбции, увеличивающей потери сигнала, причем неравномерно по полосе частот. Рынок кабельной продукции очень разнообразен, часто разные модели одинакового качества отличаются друг от друга лишь ценой, причем во много раз.

Любые кабели характеризуются потерями аналогового сигнала, которые растут с ростом частоты и расстояния передачи. Потери определяются омическим сопротивлением проводника и контактов в разъемах, а также распределенными реактивными составляющими: индуктивностью и емкостью. По сути, кабель представляет собой фильтр низких частот (режет высокие).

Помимо передачи на разные расстояния, сигналы часто приходится разветвлять и коммутировать. Коммутаторы (селекторы входов) являются неотъемлемой частью многих компонентов аудиотракта, как профессионального, так и пользовательского. Существуют и специализированные усилители-распределители, разветвляющие сигнал и обеспечивающие согласование с линией передачи и другими компонентами по уровню и импедансам (а также часто компенсирующих спад на высоких частотах) и коммутаторы, обычные (несколько входов и один выход) и матричные (множество входов и выходов).

ОБРАБОТКА АНАЛОГОВОГО АУДИО

Любая обработка аналогового аудиосигнала сопровождается определенными потерями его качества (возникают частотные, фазовые, нелинейные искажения), однако она необходима. Основные виды обработки следующие:

усиление сигнала до уровня, нужного для передачи, записи или воспроизведения громкоговорителем: подав сигнал с микрофона на динамик, мы ничего не услышим: требуется предварительно усилить его по уровню и мощности, обеспечив при этом возможность регулировки громкости.

Рис. 9

фильтрация по частотам: от полезного звукового диапазона (20 Гц – 20 кГц) отсекают инфразвук, который на определенных частотах вреден для здоровья, и ультразвук. Во многих случаях диапазон намеренно сужают (речевой телефонный канал имеет полосу от 300 Гц – 3400 Гц, существенно ограничена полоса частот метровых радиостанций). Для акустических систем, имеющих как правило 2-3 полосы, также необходимо разделение, которое осуществляется обычно в фильтрах кроссоверов уже на уровне усиленного (мощного) сигнала.

Рис. 10. Схема кроссовера для трехполосной акустической системы

Рис. 11. Пример прибора-эквалайзера

подавление шумов: существуют специальные схемы динамического шумопонижения, которые анализируют сигнал и сужают полосу пропорционально уровню и частоте ВЧ-составляющих («денойзеры», «дехиссеры»). При этом шум, находящийся выше полосы сигнала, отрезается, а оставшийся более или менее маскируется самим сигналом. Подобные схемы всегда приводят к весьма заметной на слух деградации сигнала, но в отдельных случаях их применение уместно (например, при работе с записанной речью или в переговорных радиостанциях). Для аналоговой звукозаписывающей техники также используются шумоподавители на основе компрессоров/экспандеров («компандерные», например, системы Dolby B, dbx), работа которых на слух менее заметна.
воздействие на динамический диапазон: для того чтобы воспроизведение музыкальных программ на обычных бытовых системах, включая автомобильные магнитолы, было достаточно сочным и выразительным, динамический диапазон сжимают, делая звучание тихих звуков более громким. В противном случае, не считая отдельных всплесков фортиссимо (на классической музыке), придется слушать тишину из динамиков, особенно с учетом шумной окружающей обстановки. Для этой цели служат приборы, называемые компрессорами. В некоторых случаях, наоборот, требуется расширить динамический диапазон, тогда применяются экспандеры. А чтобы исключить превышение максимального уровня, которое приведет к клиппированию (ограничение сигнала сверху, сопровождаемое очень высокими нелинейными искажениями, воспринимаемыми как хрип), в студиях используются лимитеры. Они как правило обеспечивают «мягкое» ограничение, а не просто срезают верхушки сигнала;

Рис. 12. Пример студийного процессора динамической обработки звука

спецэффекты для студий, ЭМИ и пр.: в распоряжении звукорежиссеров и музыкантов имеется большое количество спец-техники для придания звучанию нужной окраски или получения определенного эффекта. Это различные дистортеры (звук электрогитары становится хриплым, зернистым), приставки вау-вау (модуляция по амплитуде, вызывающая характерный «квакающий» эффект), энхенсеры и эксайтеры (приборы, влияющие на окраску звука, в частности, могущие придавать звучанию «ламповый» оттенок); фленжеры, хорусы и т.д.

Рис. 13. Примеры процессоров и приставок для электрогитар

смешивание звуков, эхо/реверберация: запись на студиях обычно ведется в многоканальном виде, затем с помощью микшеров фонограмма сводится в нужное количество каналов (чаще всего 2 или 6). При этом звукорежиссер может «выдвинуть вперед» тот или иной солирующий инструмент, записанный на отдельной дорожке, изменить соотношение громкостей разных дорожек. Иногда на сигнал накладываются многократные копии меньшего уровня с определенным сдвигом по времени, тем самым имитируется естественная реверберация (эхо). В настоящее время подобные и прочие эффекты достигаются в основном с помощью сигнальных процессоров, обрабатывающих цифровой сигнал.

Рис. 14. Современный микшерный пульт

ЗАПИСЬ АНАЛОГОВОГО АУДИО

Считается, что механическая запись звука была впервые реализована Эдисоном в 1877 году, когда он изобрел фонограф – валик, покрытый слоем мягкой станиоли, на который иглой, передающей колебания воздуха, наносился след (впоследствии вместо станиоли использовался воск, а сам метод стали называть глубинной записью, поскольку дорожка модулировалась по глубине). Однако в том же году француз Шарль Кро подал заявку в Академию наук по поводу своего изобретения – звук записывался на плоском стеклянном диске, покрытым сажей, с помощью соединенной с мембраной иглы, получалась поперечная дорожка, затем диск предполагалось просвечивать и снимать с него фотокопии для тиражирования (сам способ еще предстояло разработать). В конце концов поперечная запись, которая оказалась намного совершеннее глубинной, дала начало грамзаписи. В мире появились три компании, серийно выпускавших пластинки (CBS в Америке, JVC в Японии, Odeon в Германии – эта компания подарила миру двустороннюю пластинку) и аппараты для их воспроизведения. От Дойче Граммофон (Германия) произошло название «граммофон», от Пате (Франция) – патефон. Затем начали производить портативные патефоны с раструбом на шарнире, с электрическим двигателем вместо ручного привода, позже – с электромагнитными адаптерами. Пластинки становились все совершеннее, вмещали больше материала по времени звучания, расширялся диапазон частот, первоначально ограниченный 4 кГц. На смену хрупкому шеллаку пришел винилит, а недолговечные стальные иглы уступили место сапфировым, затем и алмазным. Началась эпоха стерео: в одной канавке нарезались две дорожки под углом в 45°. К началу 80-х годов прошлого века, когда наметилась глобальный переход к цифровому формату звука, виниловая пластинка подошла в апогее своего развития.

Рис. 15. Граммофон, патефон, электропроигрыватель

Магнитная запись более совершенна и издавна применялась в студиях. Первый аппарат для магнитной записи – телеграфон – создал Вальдемар Паульсен (Дания) в 1878 году, причем запись велась на стальную проволоку (струну от фортепьяно). В 20-х годах 20 века появились магнитофоны, использовавшие магнитную ленту. Массовое производство магнитофонов началось в 40-х. Сначала появились магнитные ленты на целлюлозной, а затем на лавсановой основе. Запись аудиосигналов производится на продольные дорожки с помощью пишущей (или универсальной) головки с магнитным зазором. Лента протягивается вплотную к зазору головки, и на ней образуется дорожка остаточного намагничивания. Нелинейная часть характеристики «размывается» с помощью высокочастотного тока подмагничивания (обычно порядка 100 кГц), на который накладывается полезный сигнал. Студийные аналоговые магнитофоны наряду с цифровыми до сих пор применяются для первичной записи фонограмм. Бытовые бывают двух- и трехголовочными (отдельно записывающая, воспроизводящая и стирающая головки либо стирающая и универсальная). Иногда присутствуют две воспроизводящие головки, если предусмотрен реверс.

Даже при очень бережном отношении магнитная лента со временем начинает осыпаться

Магнитная лента обладает шумами, которые уменьшаются (частично выводятся за пределы слышимого диапазона) с ростом скорости протяжки. Поэтому студийные магнитофоны имеют скорость 38, в то время как бытовые катушечные – 19 и 9,5 см/с. Для бытовых кассетных магнитофонов была принята скорость 4,76 см/с. Шумы ленты эффективно подавляются с помощью компандерной системы Dolby B: при записи уровень высокочастотной части для слабых сигналов поднимается на 10 дБ, а при воспроизведении на столько же опускается.

Профессиональная аналоговая магнитная запись на высокой скорости обеспечивает очень высокое качество. Именно на магнитных мастер-лентах долгое время архивировались музыкальные записи, и с них фонограмма переносилась на виниловые пластинки с некоторой потерей качества. Однако даже при очень бережном отношении магнитная лента со временем начинает осыпаться, ей свойственно постепенное размагничивание, деформация, копир-эффект (соседние слои в рулоне взаимно намагничиваются), она подвержена влиянию внешних магнитных полей. Затруднен также быстрый поиск нужного фрагмента (хотя это неудобство относится скорее к бытовой сфере). Поэтому с появлением цифровых форматов компания Sony, владелец огромного архива записей CBS/Columbia, озаботившись проблемой сохранности бесценных оригиналов записей второй половины 20 века, разработала метод записи в формате дискретной широтно-импульсной модуляции (поток DSD – Direct Stream Digital, который в дальнейшем дал начало пользовательскому формату Super Audio CD). Если аналоговая магнитная запись обеспечивает сохранность фонограммы в несколько десятилетий при постепенно увеличивающихся потерях, то цифровые архивы вечны и выдерживают неограниченное количество копирований без какой-либо деградации. По этой, как и по многим другим причинам (сервисные преимущества, универсальность, огромные возможности обработки) все большее распространение нынче получают цифровые форматы аудио.

ПОЛУЧЕНИЕ ЦИФРОВОГО АУДИОСИГНАЛА

По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала

Цифровой сигнал получают из аналогового или синтезируют непосредственно в цифре (в электромузыкальных инструментах). Аналого-цифровое преобразование предполагает две основные операции: дискретизацию и квантование. Дискретизация – замена непрерывного сигнала на ряд отсчетов его мгновенных значений, взятых через равные промежутки времени. По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала. Затем отсчеты квантуются по уровню: каждому из них присваивается дискретное значение, ближайшее к реальному. Точность квантования определяется разрядностью двоичного представления. Чем выше разрядность, тем больше уровней квантования (2N, где N – число разрядов) и ниже шумы квантования – погрешности из-за округления до ближайшего дискретного уровня.

Рис. 16. Оцифровка аналогового сигнала и получение цифровых отсчетов

Формат CD предполагает частоту дискретизации 44,1 кГц и разрядность 16 бит. То есть получается 44 тысячи отсчетов в секунду, каждый из которых может принимать один из 2 16 = 65536 уровней (для каждого из стереоканалов).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD)

Помимо формата 44,1 кГц / 16 бит в цифровой записи применяются и другие. Студийная запись обычно производится с разрядностью 20-24 бит. Затем данные переводятся в стандартный CD-формат путем пересчета. Лишние биты затем отбрасываются либо (лучше) округляются, иногда подмешивается псевдослучайный шум для уменьшения шумов квантования (dither).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD). В DVD Audio принят алгоритм сжатия данных без потерь MLP, разработанный компанией Meridian. А SACD, в отличие от других форматов, использует не импульсно-кодовую модуляцию (ИКМ, или PCM), а однобитовое кодирование DSD-потока (дискретная широтно-импульсная модуляция). Диски SACD бывают однослойными и двухслойными (гибридными), с обычным CD-слоем.

Наиболее популярным аудио носителем на сегодня остается компакт-диск, несмотря на определенные ограничения по качеству звучания, отмечаемые аудиофилами. Причина их – в низкой частоте дискретизации: для точного восстановления сигналов, близких к верхней границе звукового диапазона, необходим фильтр, не реализуемый физически (его импульсная реакция захватывает область отрицательного времени). Это в определенной степени компенсируется с помощью цифровой фильтрации с повышением частоты дискретизации и разрядности. Для обеспечения бесперебойного воспроизведения в реальном времени данные на диске записываются с избыточным кодированием (код Рида-Соломона).

Цифровые носители, чатоты дискретизации и разрядности кодирования

Носитель	Авторство	Размеры	Время звучания, мин.	Кол. каналов	Fs, кГц	Разрядн., бит
CD-DA	Sony, Philips	120, 90 мм	до 90	2	44,1	16
S-DAT		кассета, лента 3,81 мм	2	32, 44,1, 48	16
R-DAT		кассета, лента 3,81 мм		2, 4	44,1	12, 16
DASH		лента 6,3, 12,7 мм		2…48	44,056, 44,1, 48	12, 16
DAT	Alesis	кассета S-VHS	60	8	44,1, 48	16, 20
DСС	Philips	кассета		2, 4	32, 44,1, 48	16, 18
MiniDisk	Sony	64 мм	74	2, 4	44,1	16
DVD Audio		120 мм		5.1	192	24
SACD	Sony, Philips	120 мм		2, 5	2800	1

Для передачи цифрового звука нужна широкополосная линия связи, особенно для несжатого многоканального потока высокого разрешения.

ПЕРЕДАЧА ЦИФРОВОГО АУДИО

Линиями связи для передачи цифрового аудио могут служить кабели, оптические линии и радиоэфир.

Для передачи ИКМ-сигналов по проводным линиям разработаны интерфейсы AES/EBU (балансный, коаксиальный), S/PDIF (небалансный коаксиальный), обеспечивающие передачу нескольких сигналов (тактовую частоту, частоту следования цифровых слов, данные каналов) по одному проводу. Внутри аппаратов эти сигналы передаются по отдельности, на выходе транспортного механизма кодируются, а на входе цифро-аналогового преобразователя (в двухблочных системах) вновь разделяются в цифровом приемнике.

Как правило, для передачи цифрового аудио используется высококачественный коаксиальный кабель. Существуют также преобразователи S/PDIF для оптоволоконных линий: AT&T ST и Toslink (последний является стандартным для бытовой аппаратуры). А также – для использования витых пар в составе кабельных сетей Ethernet. Средой распространения сжатого аудио в виде архивированных файлов является и сеть Интернет.

Рис. 17. Оптический кабель с разъемом Toslink

Как любой цифровой сигнал, оцифрованное аудио распределяют и коммутируют с помощью специальных устройств – усилителей-распределителей, обычных и матричных коммутаторов.

Имеется фактор, отрицательно влияющий на цифровые сигналы и часто сводящий на нет практически все преимущества цифрового аудио перед аналоговым, в числе которых возможность многократного копирования, передачи и архивирования программ без потерь качества - речь идет о джиттере. Джиттер представляет собой дрожание фазы, или неопределенность момента перехода из 0 в 1 и наоборот. Происходит это из-за постепенной деформации прямоугольных импульсов с практически идеальными фронтами, которые становятся все более пологими из-за реактивных элементов кабелей, что и приводит к неопределенности момента перепада, хотя крутизна фронтов в каждом последующем цифровом устройстве полностью восстанавливается. С джиттером все современные цифровые устройства успешно борются с помощью блоков перетактирования (reclocking). Подробнее см. брошюру «Коммутация и управление сигналами».

Рис.18. Распределение и коммутация

Для передачи и записи на различные цифровые носители применяются сжатые форматы аудио: Dolby Digital (AC-3) и DTS. Это позволяет разместить на диске DVD Video емкостью 4,7 Гб полнометражный фильм с многоканальным звуковым сопровождением, а также разного рода дополнительные материалы. Формат Dolby Digital предлагает 5 независимых каналов: 2 фронтальных, 2 тыловых и 1 сабвуферный для спец-эффектов. Сжатие производится с помощью адаптивного алгоритма MPEG Audio, основанного на психоакустических особенностях восприятия звука и обеспечивающего минимальную заметность сжатия. Все это позволяет воссоздать полноценную трехмерную звуковую панораму. Однако для качественного воспроизведения музыки Dolby Digital подходит гораздо меньше, чем CD, обладая меньшим разрешением. Скорость потока в режиме Dolby Digital (отсчеты по каждому каналу передаются друг за другом) составляет 384-640 кбит/с, в то время как в обычном двухканальном формате CD – 1411,2 кбит/с. Формат Dolby Digital 5.1 неоднократно совершенствовался, в основном в направлении наращивания количества каналов. Сейчас доступен вариант DD 7.1, предполагающий 2 фронтальных, 2 боковых и 2 тыловых канала, не считая канала спецэффектов (известна также модификация DD 6.1 с одним тыловым каналом).

Формат DTS имеет меньшую степень сжатия и большую скорость потока данных – 1536 кбит/с. Поэтому он используется не только для кодирования многоканальных саундтреков на DVD Video, но для многоканальных аудиодисков. Формат DTS, помимо традиционного DTS 5.1, известен в модификациях DTS ES Discrete 6.1, а также нескольких матричных вариантах, в которых, как и в Dolby Pro Logic II, задействован принцип матрицирования дополнительных каналов, которые синтезируются на основе дополнительной информации, содержащейся в основных.

В компьютерной сфере и мультимедиа (на уровне пользователя) требуется компактность данных, поэтому здесь находят широкое применение сжатые форматы звука. Например, MP-3, Windows Media Audio, OGG Vorbis. Благодаря сжатию становится возможным быстро скачивать музыкальные файлы из сети Интернет, организовывать потоковый аудио сервис (WMA, Real Audio, Winamp).

ОБРАБОТКА ЦИФРОВОГО АУДИО

Обработка производится с помощью мощных DSP (сигнальных) процессоров, например Shark производства Analog Devices. Благодаря высокому быстродействию многие операции удается реализовать в реальном времени: например, изменение разрядности и тактовой частоты с интерполяцией, регулировка тембрального баланса, эквализация, подавление шумов, компрессия, экспандирование или ограничение динамического диапазона, спец-эффекты (эхо, разные типы звучания, например «стадион», «концертный зал» и пр.), микширование нескольких дорожек. Обычно сигнальные процессоры работают при высокой разрядности сигнала (например, 32 бита с плавающей децимальной точкой), что уменьшает набег ошибки в процессе сложных математических вычислений, которые производятся на основе быстрого преобразования Фурье, вычисления набора соответствующих коэффициентов и последующего перемножения.

Сигнальные процессоры по мере их распространения дешевеют, на сегодня их можно обнаружить любом ресивере или Surround-процессоре, где они выполняют самые разнообразные функции, включая декодирование форматов объемного звука, эквализацию и управление басом, калибровка каналов по амплитуде и фазе и т.д.

Сигнальные процессоры по мере их распространения дешевеют, на сегодня их можно обнаружить любом ресивере или Surround-процессоре

Но, как обычно, программные технологии обработки сигнала развиваются еще стремительнее, чем аппаратные. Все, что может сделать DSP-процессор, доступно с помощью специальных компьютерных приложений, причем в данном случае пользователь получает более широкий простор деятельности и гибкость самой программы, которая периодически обновляется и дополняется (хотя и программное обеспечение специализированных устройств в наше время чаще всего можно обновлять, скажем, через порт USB с компьютера или даже прямо из сети Интернет, с сайта производителя оборудования. Но такое обновление, конечно, возможно только в пределах одного поколения «железа», по мере устаревания которого приходится заменять модуль или весь аппарат). Компьютерных программ для глубокой обработки цифрового звука достаточно как для пользовательских, так и профессиональных целей (например, Adobe Audition). Основная часть студийной обработки производится на компьютере. Это очень удобно и эффективно, а, главное, позволяет не привязываться к реальному времени, делая доступными операции любой степени сложности без особых требований по быстродействию. Например, можно вручную вычистить фонограмму (скажем, снятую с реликтового винилового носителя) от щелчков или подвергнуть ее «интеллектуальной» обработке по избавлению от шумов, спектральный состав которых заранее определяется в паузах и на тихих фрагментах.

Сжатие цифрового аудио основано на психоакустических особенностях слуха и использует эффект маскировки более тихих звуков более громкими

Наконец, сжатие с целью уменьшения скорости потока данных или перенос на другую тактовую частоту с возможным изменением разрядности тоже производится как аппаратно, так и программно, на компьютере.

Существует несколько стандартных компьютерных форматов аудио, как без сжатия, так и с ним.

Наиболее распространенный несжатый формат – Microsoft Riff/Wave (расширение «.wav»). Данные кодируются 8 или 16 битами. Во втором (приемлемом для качественного аудио) случае и при частоте дискретизации 44,1 кГц одна минуты музыки занимает 5,3 МБ дискового пространства. Помимо самих данных, файл.wav содержит заголовок, описывающий общие параметры файла, и один или более фрагментов с дополнительной информацией о режимах и порядке воспроизведения, пометками, названиями и координатами различных участков сигнала.

В отличие от Riff/Wave, файлы RAW представляют собой данные, как они есть – без вспомогательной информации. Которая присутствует в стандартных для платформы Macintosh файлах Apple AIFF, схожих с WAV.

Сжатие цифрового аудио основано на психоакустических особенностях слуха и использует эффект маскировки более тихих звуков более громкими, при этом тихие просто отбрасываются, а «порог актуальности» маскируемых звуков определяется их удаленностью по частоте от маскирующих, а также другими параметрами.

Из форматов, предполагающих сжатие с потерями, самым популярным является MP3 (MPEG 1/2/2.5 Layer 3). Позволяет применять множество различных способов сжатия, стандартным является лишь способ кодирования уже сжатых данных. Возможен вариант с постоянным битрейтом, определяемым исходя из требуемых размеров файлов или уровня качества, или с переменным, когда битрейт меняется на разных фрагментах музыки, поддерживая уровень качества постоянным. В целом MP3 характеризуется весьма удовлетворительным звучанием на средних и высоких битрейтах, но на низких уступает другим форматам. Исключение составляет новая версия MP3 Pro, ориентированная именно на низкий битрейт и в связи с этим весьма затребованная в сетях Интернет.

WMA, или Windows Media Audio, успешно конкурируют с MP3 на низких битрейтах (например, музыка при 64 кбит/с в WMA субъективно звучит не хуже, чем в MP3 с битрейтом 128 кбит/с. Кроме этого, данный формат обеспечивает защитную кодировку от несанкционированного копирования.

Ogg Vorbis в целом схож с WMA и MP3, но отличается математическим аппаратом обработки и ориентирован на частоту дискретизации 48 кГц. К тому же может поддерживать не 2, а до 255 каналов звука. Битрейт до 512 кбит/с, при сжатии, на 20-5-% более эффективном, чем в MP3, музыка субъективно звучит лучше. Серьезный конкурент MP3 и WMA, хотя и в неравной борьбе с фирмами-гигантами.

AAC (Advanced Audio Coding) разработан на основе MP3 (и той же компанией – Институтом Фраунгофера), но отличается расширенными возможностями: поддерживает частоту дискретизации 96 кГц, до 48 каналов. Более высокое качество звука «оплачивается» относительно более медленной процедурой кодировки и повышенными требованиями к «железу» по быстродействию при воспроизведении. Одна из последних версий AAC под названием Liquid Audio, допускающая включение в поток данных не только «водяных знаков», как AAC, но и другой информации (об исполнителях, правообладании и пр.), в какой-то момент явилась серьезным претендентом на преемственность MP3.

Во многом похож на AAC японский формат VQF (SoundVQ), который скорее всего в скором времени исчезнет из поля зрения, хотя и поддерживается компанией Yamaha.

Цифровой звук можно записывать на различные носители. В основном оптические диски, хотя по логике вещей рано ли поздно на арене останется одна лишь флэш-память, для которой не требуется никаких приводов с моторчиками.

Магнитная цифровая запись на сегодня в основном остается в профессиональной сфере и все увереннее покидает бытовую

Тиражируют компакт-диски, как и прочие похожие носители (DVD, SACD), путем штамповки поликарбонатных заготовок с алюминиевых матриц, на которые наносятся питы – углубления. Кроме этого, при наличии обычного компьютера с пишущим CD (DVD) приводом музыкальные файлы различных форматов можно записывать на матрицы CD-R, CD-RW и т.д. Файлы также хранят на жестком диске компьютера или специального аудиосервера, в котором может быть создана обширная фонотека, причем степень сжатия файлов (от нуля) выбирается пользователем.

Магнитная цифровая запись на сегодня в основном остается в профессиональной сфере и все увереннее покидает бытовую. Оптический диск боле привлекателен для потребителя, чем кассета, даже притом, что она имеет небольшие размеры. Кроме этого, их массовой востребованности не способствовали сложные отношения с обладателями прав на музыкальный контент (как, впрочем, и в случае с DVD Audio и SACD). DAT-магнитофоны записывают цифровой звук без сжатия с высоким 3качеством. Существует несколько типов цифровых магнитофонов: со стационарными головками (S-DAT) и с вращающимися (R-DAT), записывающих сигнал на кассету; бобинный DASH, DAT, использующий кассеты S-VHS и поперечно-наклонную запись. Формат DCC (запись с сжатием в PASC) в настоящее время признан неперспективным. Магнитооптические диски MiniDisc используют запись с алгоритмом сжатия ATRAC.

ВОСПРОИЗВЕДЕНИЕ ЗВУКА

В конце любого аудиотракта присутствуют аналоговые электроакустические преобразователи – громкоговорители или наушники. Цифровые излучатели пока что находятся на стадии ранних идей. Усилители мощности также в основном аналоговые, хотя постепенно пробивают себе дорогу и цифровые (точнее, импульсные, работающие по принципу широтно-импульсной модуляции). Этот класс усилителей – D – обеспечивает небывало высокий по сравнению с аналоговыми КПД (порядка 90%), малые размеры и вес, отсутствие тепловыделения. Чтобы за усилителями класса D закрепилось прочное положение лидеров, необходимо, тем не менее, решить многие важные проблемы, и в первую очередь проблему фильтрации высокочастотных компонентов модулированного сигнала, уровень которых на выходе очень высок. Кроме этого, практически отсутствуют усилители класса D с цифровым входом: аналоговый сигнал подается на встроенный АЦП. Это, пожалуй, и есть основной фактор, тормозящий развитие данного направления: ведь основная ценность самой идеи не в высоком КПД, а в возможности организовать полностью цифровой аудиотракт без лишних преобразований и аналоговых линий передач. Тем более цифровой выход на проигрывателях DVD не редкость. В последнее время в данной области стали появляться новые разработки. Компания Tripath выпустила специальный процессор, управляющий параметрами импульсного усиления на основании анализа входного сигнала, который (в цифровой форме) на некоторое время задерживается в буфере. В частности, в зависимости от текущего спектра сигнала подбирается оптимальная с точки зрения последующей фильтрации тактовая частота. Такие усилители (их называют «интеллектуальными») дали начало новой категории – усилители класса T. Подробнее см. брошюру «Усиление сигналов».

На смену традиционным стерео- и моно- усилителям все чаще приходят многоканальные, чаще всего строенные в AV-ресиверы, где имеется также все необходимое для глубокой обработки многоканальных сигналов, декодирования и преобразования из одного формата в другой. Многоканальный звук становится все популярнее, причем не только в качестве сопровождения к кино, но и сам по себе.

Займемся сначала общими принципами аналого-цифрового преобразования. Основной принцип оцифровки любых сигналов очень прост и показан на рис. 17.1, а. В некоторые моменты времени t\, ti, h мы берем мгновенное значение аналогового сигнала и как бы прикладываем к нему некоторую меру, линейку, проградуированную в двоичном масштабе. Обычная линейка содержит крупные деления (метры), поделенные каждое на десять частей (дециметры), каждая из которых также поделена на десять частей (сантиметры), и т. д. Двоичная линейка содержала бы деления, поделенные пополам, затем еще раз пополам и т. д. - сколько хватит разрешающей способности. Если вся длина такой линейки составляет, допустим, 2,56 м, а самое мелкое деление - 1 см (то есть мы можем померить ей длину с точностью не хуже 1 см, точнее, даже половины его), то таких делений будет ровно 256, и их можно представить двоичным числом размером 1 байт или 8 двоичных разрядов.

Ничего не изменится, если мы меряем не длину, а напряжение или сопротивление, только смысл понятия «линейка» будет несколько иной. Так мы получаем последовательные отсчеты величины сигнала xi, хг, хз. Причем заметьте, что при выбранной разрешающей способности и числе разрядов мы можем померить величину не больше некоторого значения, которое соответствует максимальному числу, в данном случае 255. Иначе придется или увеличивать число разрядов (удлинять линейку) или менять разрешающую способность в сторону ухудшения (растягивать ее). Все изложенное и есть сущность работы аналого-цифрового преобразователя - АЦП.

На рис. 17.1, а график демонстрирует этот процесс для случая, если мы меряем какую-то меняющуюся во времени величину. Если измерения производить регулярно с известной частотой (ее называют частотой дискретизации или частотой квантования), то записывать можно только значения сигнала. Если стоит задача потом восстановить первоначальный сигнал по записанным значениям, то, зная частоту дискретизации и принятый масштаб (то есть какому значению физической величины соответствует максимальное число в принятом диапазоне двоичных чисел), мы всегда можем восстановить исходный сигнал, просто отложив точки на графике и соединив их плавной линией.

Но что мы при этом теряем? Посмотрите на рис. 17.1,6, который иллюстрирует знаменитую теорему Котельникова (как водится, за рубежом она носит другое имя - Найквиста, на самом деле они оба придумали ее независимо друг от друга). На этом рисунке показана синусоида предельной частоты, которую мы еще можем восстановить, располагая массивом точек, полученных с частотой дискретизации /д. Так как в формуле для синусоидального колебания As\n(2nft) имеется два независимых коэффициента (А - амплитуда, и /- частота), то для того чтобы вид графика восстановить однозначно, нужно как минимум две точки на каждый периоде то есть частота оцифровки должна быть как минимум в два раза больше, чем самая высокая частота в спектре исходного аналогового сигнала. Это и есть одна из расхожих формулировок, теоремы Котельникова-Найквиста.

Попробуйте сами нарисовать другую синусоиду без сдвига по фазе, проходящую через указанные на графике точки, и вы убедитесь, что это невозможно. В то же время можно нарисовать сколько угодно разных синусоид, проходящих через эти точки, если их частота в целое число раз выше частоты дискретизации/д. В сумме эти синусоиды, или гармоники (то есть члены разложения сигнала в ряд Фурье, см. главу 5) дадут сигнал любой сложной формы, но восстановить их нельзя, и если такие гармоники присутствуют в исходном сигнале, то они пропадут навсегда. Только гармонические составляющие с частотами ниже предельной восстанавливаются однозначно. То есть процесс оцифровки равносилен действию ФНЧ с прямоугольным срезом характеристики на частоте, равной ровно половине частоты дискретизации.

Теперь об обратном преобразовании. В сущности, никакого преобразования цифра-аналог в ЦАП, которые мы будем здесь рассматривать, не происходит, просто мы выражаем двоичное число в виде пропорциональной величины напряжения, то есть занимаемся, с точки зрения теории, всего лишь преобразованием масштабов. Вся аналоговая шкала поделена на кванты - то есть градации, соответствующие разрешающей способности нашей двоичной «линейки». Если максимальное значение сигнала равно, к примеру, 2,56 В, то при восьмиразрядном коде мы получим квант в 10 мВ, и что происходит с сигналом между этими значениями, а также и в промежутки времени между отсчетами, мы не знаем и узнать не можем. Если взять ряд последовательных отсчетов некоего сигнала, например, тех, что показаны на рис. 17.1, а, то мы в результате получим ступенчатую картину, показанную на рис. 17.2.

Рис. 17.2. Восстановление оцифрованного сигнала с рис. 17.1, а

Если вы сравните графики на рис. 17.1, а и на рис. 17.2, то увидите, что второй график представляет первый, мягко говоря, весьма приблизительно. Для того чтобы повысить степень достоверности полученной кривой, следует, во-первых, брать отсчеты почаще, и во-вторых, увеличивать разрядность. Тогда ступеньки буд)т все меньше и меньше, и есть надежда, что при некотором достаточно высоком разрешении, как по времени, так и по квантованию, кривая станет, в конце концов, неотличима от непрерывной аналоговой линии.

Заметки на полях

Очевидно, что в случае звуковых сигналов дополнительное сглаживание, например, с помощью ФНЧ здесь попросту не требуется, ибо оно только ухудшит картину, отрезая высокие частоты еще больше. К тому же всякие аналоговые усилители сами сгладят сигнал, и органы чувств человека тоже поработают в качестве фильтра. Так что наличие ступенек само по себе несущественно, если они достаточно мелкие, а вот резкий спад частотной характеристики выше некоторой частоты сказывается на качестве звука фатальным образом. Многие люди с хорошим музыкальным слухом утверждают, что они безошибочно отличают цифровой звук CD-качества (дискретизация которого производится с частотой 44,1 кГц, то есть со срезом на частоте заведомо более высокой, чем уровень восприятия человеческого слуха, и с числом градаций не менее 65 тысяч на весь диапазон) от настоящего аналогового звука, например, с виниловой пластинки или с магнитофонной ленты. По этой причине качественный цифровой звук записывается с гораздо более высокими частотами дискретизации, чем формально необходимо, например, 192 и даже 256 кГц, и тогда он становится действительно неотличим от исходного. Правда, напрямую оцифрованный звук записывают разве что на диски в формате Audio CD (с указанными характеристиками), а почти для всех остальных форматов используют компрессию - сжатие по специальным алгоритмам. Если бы не компрессия, для записи не хватило бы ни емкости современных носителей, ни быстродействия компьютерных сетей: всего одна минута стереозвука с параметрами CD-качества занимает на носителе около 10 Мбайт, можете проверить самостоятельно.

Углубляться в особенности дискретизации аналоговых периодических сигналов мы не будем, так как это очень обширная область в современной инженерии, связанная в первую очередь с оцифровкой, хранением, тиражированием и воспроизведением звука и видео, и об этом нужно, как минимум, писать отдельную книгу. Для наших же целей достаточно изложенных сведений, а теперь мы перейдем непосредственно к задаче оцифровки и обратного преобразования отдельного значения сигнала.

65 нанометров - следующая цель зеленоградского завода «Ангстрем-Т», которая будет стоить 300-350 миллионов евро. Заявку на получение льготного кредита под модернизацию технологий производства предприятие уже подало во Внешэкономбанк (ВЭБ), сообщили на этой неделе «Ведомости» со ссылкой на председателя совета директоров завода Леонида Реймана. Сейчас «Ангстрем-Т» готовится запустить линию производства микросхем с топологией 90нм. Выплаты по прошлому кредиту ВЭБа, на который она приобреталась, начнутся в середине 2017 года.

Пекин обвалил Уолл-стрит

Ключевые американские индексы отметили первые дни Нового года рекордным падением, миллиардер Джордж Сорос уже предупредил о том, что мир ждет повторение кризиса 2008 года.

Первый российский потребительский процесор Baikal-T1 ценой $60 запускают в массовое производство

Компания «Байкал Электроникс» в начале 2016 года обещает запустить в промышленное производство российский процессор Baikal-T1 стоимостью около $60. Устройства будут пользоваться спросом, если этот спрос создаст государство, говорят участники рынка.

МТС и Ericsson будут вместе разрабатывать и внедрять 5G в России

ПАО "Мобильные ТелеСистемы" и компания Ericsson заключили соглашения о сотрудничестве в области разработки и внедрения технологии 5G в России. В пилотных проектах, в том числе во время ЧМ-2018, МТС намерен протестировать разработки шведского вендора. В начале следующего года оператор начнет диалог с Минкомсвязи по вопросам сформирования технических требований к пятому поколению мобильной связи.

Сергей Чемезов: Ростех уже входит в десятку крупнейших машиностроительных корпораций мира

Глава Ростеха Сергей Чемезов в интервью РБК ответил на острые вопросы: о системе «Платон», проблемах и перспективах АВТОВАЗа, интересах Госкорпорации в фармбизнесе, рассказал о международном сотрудничестве в условиях санкционного давления, импортозамещении, реорганизации, стратегии развития и новых возможностях в сложное время.

Ростех "огражданивается" и покушается на лавры Samsung и General Electric

Набсовет Ростеха утвердил "Стратегию развития до 2025 года". Основные задачи – увеличить долю высокотехнологичной гражданской продукции и догнать General Electric и Samsung по ключевым финансовым показателям.