Hardware или Software для формирования ESSB. Часть 1. Звуковой интерфейс
За окном 21 век, "цифра" завоевывает новейшие горизонты человеческой жизни. Что характерно в мире "цифры" возможно практически все то, что в аналоге было труднодостижимым или же достижимым, но сопряженным с большими финансовыми затратами. Можно еще много говорить о преимуществах цифровых алгоритмов, но они и так очевидны. Можно ли говорить о существующих плюсах обработки звукового сигнала с помощью приборов. Конечно можно - всегда приятно крутить ручки "живых" приборов, на этом, пожалуй, плюсы заканчиваются. Конечно может быть прибор лучше компьютера, но современный прибор может быть лучше только в качестве маркетинга - если фирма-производитель не захочет выпускать прибор в виде VST-плагина, потому как в любом современном приборе, а уж тем более если этот прибор стоит дорого - происходит цифровая обработка - т.е. по сути тот же компьютер. Всего несколько лет назад я бы рассмеялся, услышав подобное, но стремительное развитие компьютерных технологий изменили мое мнение.
На сегодняшний день практически все физические процессы возможно описать с помощью математических функций, а следовательно перевести в цифровой вид. Не исключением стала и сфера звукообработки.
Сегодня компьютеры обладают производительностью с избытком достаточной для обработки звуковых потоков в широких диапазонах частот и с широким динамическим диапазоном. Если добавить в этот строй моделирование аналоговых устройств, или же не моделирование, а новые цифровые решения для обработки звука - получаем, что компьютер позволит нам иметь дома целую студию с множеством приборов, которых в "железе" либо нет в природе, либо есть но стоимость этих приборов, просто, не разумная для применения в любительском радио, при формировании SSB или ESSB модуляции. Ну и стоит ли говорить о том, что многие из "железных" приборов сегодня внутри по сути имеют компьютер, который сигнал принимает, оцифровывает, обрабатывает и обратно конвертирует в аналог (или передает дальше по цифровому каналу на другое устройство). А популярные у радиовещателей специализированные процессоры - изначально могли быть только цифровыми. В борьбе за громкостью - аналоговые скорости отработки лимитеров уже не хватает. Более того в таких процессорах обработка происходит перед появлением пика. То есть работа устройства опережает сам сигнал, разумеется в аналоге это практически не возможно.
Что же нужно для того, что бы начать обрабатывать на компьютере экономя при этом существенные средства... Как указано выше, компьютерная система способна обрабатывать широкий спектр звуковых частот с большим динамическим диапазоном, нам нужно лишь устройство которое преобразует наш звук в цифровой поток и подаст его компьютеру в "понятном" формате. НУжно стремится к тому, что бы цифровая копия сигнала получалась максимально точной к оригиналу. Для этих целей служит звуковой интерфейс или как принято называть в быту - звуковая карта. Звуковой интерфейс - это основа-основ при программной обработке звука (softwear processing for ESSB). Звуковой интерфейс
Звуковые интерфейсы отличаются между собой качеством АЦП и ЦАП, конечно есть определенные параметры о которых я напишу чуть ниже, стоит отметить, что при одних и тех же документируемых параметрах звучат разные АЦП/ЦАП по разному. И тут в общем случае зависимость проста. Чем выше стоимость устройства - тем лучше качество. Параметр который мы рассматривать не будем - это THD (коэффициент гармонических искажений) АЦП/ЦАП. Не будем рассматривать в виду простоты понимания - чем меньше гармонические искажения - тем лучше(и тут опять работает зависимость - чем дороже - тем меньше искажений).
Основными параметрами являются частота дискретизации и глубина оцифровки(разрядность). От первого параметра зависит диапазон частот который оцифровывается, от второго - динамический диапазон звука который оцифровывается.
Частота дискретизации
Существуют стандарты частоты дискретизации. Сегодня это частоты 44100 Гц (44,1 кГц), 48000 Гц (48 кГц), 96000 Гц (96кГц), 192000 Гц (192 кГц). Согластно теоремы Котельникова высшая частота звукового сигнала который будет оцифрован равен половине частоты дискретизации. Таким образом имеем:
44,1 кГц - 22,05 кГц (22050 Гц)
48 кГц - 24 кГц (24000 Гц) 96 кГц - 48 кГц (48000 Гц) 192 кГц - 96 кГц (96000 Гц)
Как видим даже при частоте 44,1 - имеем полосу оцифровки реального звука до 22050 Гц, что казалось бы, более чем достаточно. Однако это не совсем так. Этого достаточно для воспроизведения звуковых частот, а вот для записи(оцифровки) при частоте дискретизации вы не получите точной копии входного сигнала в цифровом виде. Связано это с природой звука. Тут, возможно, кто-то возмутится, однако этот проверено на практике не только мной, но и любым человеком который сталкивался с процессом оцифровки звука. Столкнетесь с этим и Вы, если попробуете, например, сравнить оцифровку с помощью встроеной в материнскую плату звуковой карты и внешним интерфейсом профессионального(полупрофессионального) уровня. 48 кГц позволяет получить практически полную копию сигнала, а если говорить о речевых оцифровках(что нас и интересует) - то можно говорить, что получим точную копию. Разницу на речевом сигнале между оцифровкой 48 кГц и оцифровкой 96 кГц услышать можно, для этого необходима дорогостоящая мониторинговая звуковая система, хорошая аккустика комнаты и при этом у Вас будет ощущение разности скорее на уровне эмоций, чем слуха. 96 кГц - без тени сомнения могу сказать, что в этом режиме оцифровки Вы получаете точную копию входного сигнала - просто поверьте, проверено не единожды как на речевых, так и на музыкальных сигналах. 192 кГц - стандарт для получения очень точной копии аналогового широкополосного сигнала - например подобный формат применяют при записи живых оркестров, где инструменты имеют гармоники уходящие далеко за условную звуковую границу в 20000 Гц(таких инструментов на самом деле достаточно много). Для работы с речевыми сигналами, применение данного режима частоты дискретизации - является избыточным.
Глубина оцифровки (разрядность)
Глубина оцифровки выражается в битах. От этого параметра зависит динамический диапазон сигнала который будет оцифрован, то есть разница в уровнях между самым громким и самым тихим звуком и выражается в децибеллах (дБ) Верхняя граница обозначается 0 дБ, если входной сигнал превысит этот уровень - все, что выше будет отброшено АЦП, а в цифровой копии на временном интервале превышения - будет искаженный сигнал. Эти искажения звукорежиссеры называют - Клип (Clip), то есть происходит клипирование звукового сигнала, но звучит это очень неприятно. Поэтому есть правило при работе с цифровыми источниками уровень сигнала никогда не должен превышать 0 дБ. Так же нужно помнить о том, что не все биты используются для непосредственной оцифровки, так снизу часть битов отбрасывается. Я не буду вникать в то почему так происходит - мне как звукорежиссеру разбираться в этом вопросе совсем не нужно, мне нужно просто знать это (хотя и это несет очень мало информации для работы со звуком :-) )
Также существуют стандартные частоты для звуковой индустрии - 16 бит, 24 бита, 32 бита. И хоть 16 бит звуковой карты - это динамический диапазон 96 дБ, тут все также не однозначно. Так например для воспроизведения 96 дБ это очень и очень прилично, в конце концов - именно с такой разрядностью выпускают компакт диски - но нужно понимать, что компакт диск это записанный, сведенный и отмастеренный продукт. А вот запись этого продукта всегда ведется в режиме 24 бита. И дело тут в том, что младшие разряды как уже было отмечено уходят на оцифровку собственных шумов(АЦП и ЦАП тоже имеют свойство шуметь), таким образом получит точную копию звука от уровня "нет звука"(но есть фоновый шум - который есть всегда) до максимально громкого звука, без перегрузки АЦП можно при 24 битах, тогда мы уверены, что наш сигнал находится с "серединке" динамического диапазона цифрового интерфейса - как итог в режиме 24 бита мы получим чистый, а следовательно максимально точную копию звукового сигнала. И снова я прошу Вас просто поверить мне. Вы можете иметь радиотехническое образование и думать, что я дурак, однако я готов с Вами поспорить на 1000 долларов, что моя запись в режиме 24 бит, будет звучать лучше и полноценней Вашей в 16 битах, потому, что это проверено на практике многими и многими людьми на аппаратных комплексах в десятки и сотни тысячь долларов и ошибок тут быть не может.
Стандарт же в 32 бита применяется только в очень дорогих программно - аппаратных решениях. И очень часто применяется в программных комплексах, например с такой разрядностью способен работать Adobe Audition (ex. CoolEdit), однако для работы в этом режиме происходит конвертация входных данных - это рождает много других проблем, с которыми компания Adobe справляется, но все же чем больше конвертаций - тем дальше от точной копии уходим - это закон совершенно природный и никуда от него не дется. Таким образом обработка звука для получения ESSB с помощью программного метода (softwear processing) доступна при наличии цифрового интерфейса работающего в режиме оцифровки минимум 24 бита/ 48 кГц(24/48), а лучше 24 бита / 96 кГц (24/96). Это основные параметры для выбора звукового интерфейса, однако есть еще один не очевидный параметр - способ связи с компьютером. Существуют зуковые интерфейсы работающие по USB шине, FireWire (IEEE1394), PCI, PCI-e. Самые простые - это USB карты - они выполняются отдельным блоком с питанием от отдельного сетевого адаптера, реже питание подается по шине USB. Не хочу никого обманывать и выскажу скорее свое субъективное мнение, мне попадались где-то пять интерфейсов с USB от именитых производителей, и все они имели определнные нестабильности в своей работе. Часто эти интерфейсы "отваливались", начинали трещать. Думаю это связанно с тем, что шина USB универсальная и частые обращения к другой перефирии "висящей" на этой же шине - приводят к этим сбоям. Поэтому мое личное отношение к подобным интерфейсам скорее негативное. Звуковые интерфейсы на основе FireWire(IEEE1394) с которыми сталкивался я были надежными и проблем с ними не возникало. Был единственный случай - когда к компьютеру в студии был подключен звуковой интерфейс RME Fire Face 400, и к ней подключалась HD-камера(а по шине FireWire возможно соединять перефирию только "паровозиком") - камера не могла работать корректно, но это скорее проблема камеры Sony, чем звукового интерфейса. Звуковые интерфейсы на базе шин PCI и PCI-e также не вызывают проблем и никогда не доставляли проблем. Что можно порекомендовать - советов боюсь давать, порекомендую смотреть и задавать вопросы в сообществе профессинальных музыкантов и звукорежиссеров о каждой приглянувшейся карте. Их великое множество и конечно с ними кто-то работает. Всегда лучше получить живой отзыв от человека который использует то или иное решение. А основные моменты для выбора вроде доступно изложил в настоящей статье. Лично я использую для формирования ESSB модуляции звуковой интерфейс ESI Juli@, ранее использовал Lexicon Omega, однако с этим USB-интерфейсом имелись проблемы в виде сбоев в работе драйвера звукового устройства. В данной статье рассмотрены параметры выбора звукового интерфейса для обработки звукового сигнала для формирования SSB и ESSB модуляции. В следующей части я расскажу о программах обработки которые помогут звучать Вам в эфире красиво.