Мои Конспекты
Главная | Обратная связь

...

Автомобили
Астрономия
Биология
География
Дом и сад
Другие языки
Другое
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Металлургия
Механика
Образование
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Туризм
Физика
Философия
Финансы
Химия
Черчение
Экология
Экономика
Электроника

Абсолютные частотные пороги 2 страница





Помощь в ✍️ написании работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой
Рис. 1 Осциллограммы (волновая) форма звуков

У ударных и щипковых инструментов, например гитары, короткий временной отрезок стационарной фазы и атаки и длинный по времени - фазы затухания. В звуке органной трубы можно видеть достаточно длинный отрезок стационарной фазы и короткий период затухания и т. д. Если представить отрезок стационарной части звучания более растянутым во времени (Рис. 2), то можно отчетливо видеть периодическую структуру звука. Как уже было сказано в предыдущих статьях, эта периодичность является принципиально важной для определения музыкальной высоты тона, поскольку слуховая система только для периодических сигналов может определить высоту, а непериодические сигналы воспринимаются ею как шумовые.

Как утверждает классическая теория, развиваемая, начиная с Гельмгольца почти все последующие сто лет, восприятие тембра зависит от спектральной структуры звука, то есть от состава обертонов и соотношения их амплитуд. Позволю себе напомнить, что обертоны - это все составляющие спектра выше фундаментальной частоты, а обертоны, частоты которых находятся в целочисленных соотношениях с основным тоном, называются гармониками.

Как известно, для того, чтобы получить амплитудный и фазовый спектр, необходимо выполнить преобразование Фурье от временной функции (t), т. е. зависимости звукового давления р от времени t.

Рис. 2 Периодическая структура звуков. а-орган; б-кларнет, саксофон

С помощью преобразования Фурье любой временной сигнал можно представить в виде суммы (или интеграла) составляющих его простых гармонических (синусоидальных) сигналов, а амплитуды и фазы этих составляющих образуют соответственно амплитудный и фазовый спектры.

С помощью созданных за последние десятилетия цифровых алгоритмов быстрого преобразования Фурье (БПФ или FFT), выполнить операцию по определению спектров можно также практически в любой программе обработки звука. Например, программа SpectroLab вообще является цифровым анализатором, позволяющим построить амплитудный и фазовый спектр музыкального сигнала в различной форме. Формы представления спектра могут быть различными, хотя представляют они одни и те же результаты расчетов. На рисунке 3 представлены в виде АЧХ амплитудные спектры различных музыкальных инструментов (осциллограммы которых были показаны на рисунке 2). АЧХ представляет здесь зависимость амплитуд обертонов в виде уровня звукового давления в дБ, от частот.

Иногда спектр представляют в виде дискретного набора обертонов с разными амплитудами. Спектры могут быть представлены в виде спектрограмм, где по вертикальной оси отложена частота, по горизонтальной - время, а амплитуда представлена интенсивностью цвета (Рис. 4). Кроме того, существует форма представления в виде трехмерного (кумулятивного) спектра, о котором будет сказано далее.

Для построения указанных на рисунке 3 спектров, в стационарной части осциллограммы выделяется некоторый временной отрезок, и проводится расчет усредненного спектра по данному отрезку. Чем больше этот отрезок, тем точнее получается разрешающая способность по частоте, но при этом могут теряться (сглаживаться) отдельные детали временной структуры сигнала. Такие стационарные спектры обладают индивидуальными чертами, характерными для каждого музыкального инструмента, и зависят от механизма звукообразования в нем.

Например, флейта использует в качестве резонатора открытую с двух концов трубу, и поэтому содержит в спектре все четные и нечетные гармоники. При этом уровень (амплитуда) гармоник быстро уменьшается с частотой. У кларнета используется в качестве резонатора труба, закрытая с одного конца, поэтому в спектре, в основном, содержатся нечетные гармоники. У трубы в спектре много высокочастотных гармоник. Соответственно, тембры звучания у всех этих инструментов совершенно разные: у флейты - мягкий, нежный, у кларнета - матовый, глуховатый, у трубы - яркий, резкий.

Рис. 3 Амплитудные спектры а-органа, б - кларнета, саксофона

Исследованию влияния спектрального состава обертонов на тембр посвящены сотни работ, поскольку эта проблема чрезвычайно важна как для проектирования музыкальных инструментов и высококачественной акустической аппаратуры, особенно в связи с развитием аппаратуры Hi-Fi и High-End, так и для слуховой оценки фонограмм и др. задач, встающих перед звукорежиссером. Накопленный огромный слуховой опыт наших замечательных звукорежиссеров - П.К. Кондрашина, В.Г. Динова, Е.В. Никульского, С.Г. Шугаля и др. - мог бы представить бесценные сведения по этой проблеме (особенно если бы они написали о нем в своих книгах, чего хотелось бы им пожелать).

Поскольку этих сведений чрезвычайно много и они часто противоречивы, приведем только некоторые из них.

Анализ общей структуры спектров различных инструментов, показанных на рисунке 5, позволяет сделать следующие выводы:
- при отсутствии или недостатке обертонов, особенно в нижнем регистре, тембр звука становится скучным, пустым - примером может служит синусоидальный сигнал от генератора;
- присутствие в спектре первых пяти-семи гармоник с достаточно большой амплитудой придает тембру полноту и сочность;
- ослабление первых гармоник и усиление высших гармоник (от шестой-седьмой и выше) придает тембру резкость, скрипучесть;

Анализ огибающей амплитудного спектра для различных музыкальных инструментов позволил установить (Кузнецов "Акустика музыкальных инструментов"):
- плавный подьем огибающей (увеличение амплитуд определенной группы обертонов) в области 200…700 Гц позволяет получить оттенки сочности, глубины;
- подьем в области 2,5…3 кГц придает тембру полетность, звонкость;
- подьем в области 3…4,5 кГц придает тембру резкость, пронзительность и др.

Одна из многочисленных попыток классифицировать тембровые качества в зависимости от спектрального состава звука приведена в вышеуказанной книге (Рис. 6).

Рис. 4 Спектрограмма звука скрипки

Многочисленные эксперименты с оценкой качества звучания (а, следовательно, тембра) акустических систем позволили установить влияние различных пиков-провалов АЧХ на заметность изменения тембра. В частности, показано, что заметность зависит от амплитуды, расположения по частотной шкале и добротности пиков-провалов на огибающей спектра (т. е. на АЧХ). В средней области частот пороги заметности пиков, т. е. отклонения от среднего уровня, составляют 2…3 дБ, причем заметность изменения тембра на пиках больше, чем на провалах. Узкие по ширине провалы (менее 1/3 октавы) почти не заметны на слух - по-видимому, это обьясняется тем, что именно такие узкие провалы вносит помещение в АЧХ различных звуковых источников, и слух к ним привык.

Существенное влияние оказывает группировка обертонов в формантные группы, особенно в области максимальной чувствительности слуха. Поскольку именно расположение форматных областей служит главным критерием различимости звуков речи, наличие формантных частотных диапазонов (т. е. подчеркнутых обертонов) значительно влияет на восприятие тембра музыкальных инструментов и певческого голоса: например, формантная группа в области 2…3 кГц придает полетность, звонкость певческому голосу и звукам скрипки. Эта третья форманта особенно выражена в спектрах скрипок Страдивари.

Таким образом, безусловно справедливо утверждение классической теории, что воспринимаемый тембр звука зависит от его спектрального состава, то есть расположения обертонов на частотной шкале и соотношения их амплитуд. Это подтверждается многочисленной практикой работы со звуком в разных областях. Современные музыкальные программы позволяют легко проверить это на простых примерах. Например, можно в Sound Forge синтезировать с помощью встроенного генератора варианты звуков с различным спектральным составом, и послушать, как изменяется тембр их звучания.

Из этого следуют еще два очень важных вывода:
- тембр звучания музыки и речи изменяется в зависимости от изменения громкости и от транспонирования по высоте.

При изменении громкости меняется восприятие тембра. Во-первых, при увеличении амплитуды колебаний вибраторов различных музыкальных инструментов (струн, мембран, дек и др.) в них начинают проявляться нелинейные эффекты, и это приводит к обогащению спектра дополнительными обертонами. На рисунке 7 показан спектр фортепиано при разной силе удара, где штрихом отмечена шумовая часть спектра.

Рис. 5 Виды спектров различных инструментов

Во-вторых, с увеличением уровня громкости изменяется чувствительность слуховой системы к восприятию низких и высоких частот (о кривых равной громкости было написано в предыдущих статьях). Поэтому при повышении громкости (до разумного предела 90…92 дБ) тембр становится полнее, богаче, чем при тихих звуках. При дальнейшем увеличении громкости начинают сказываться сильные искажения в источниках звука и слуховой системе, что приводит к ухудшению тембра.

Транспонирование мелодии по высоте также меняет воспринимаемый тембр. Во-первых, обедняется спектр, поскольку часть обертонов попадает в неслышимый диапазон выше 15…20 кГц; во-вторых, в области высоких частот пороги слуха значительно выше, и высокочастотные обертоны становятся не слышны. В звуках низкого регистра (например, в органе) обертоны усиливаются из-за повышения чувствительности слуха к средним частотам, поэтому звуки низкого регистра звучат сочнее, чем звуки среднего регистра, где такого усиления обертонов нет. Следует отметить, что поскольку кривые равной громкости, как и потери чувствительности слуха к высоким частотам, в значительной степени индивидуальны, то и изменение восприятия тембра при изменении громкости и высоты также очень различаются у разных людей.

Однако, накопленные к настоящему времени экспериментальные данные позволили выявить определенную инвариантность (стабильность) тембра при целом ряде условий. Например, при транспонировании мелодии по частотной шкале оттенки тембра, конечно, меняются, но в целом тембр инструмента или голоса легко опознается: при прослушивании, например, саксофона или другого инструмента через транзисторный радиоприемник можно опознать его тембр, хотя спектр его был значительно искажен. При прослушивании одного и того же инструмента в разных точках зала его тембр так же меняется, но принципиальные свойства тембра, присущие данному инструменту, остаются.

Рис. 6 Классификация тембров

Некоторые из этих противоречий удалось частично обьяснить в рамках классической спектральной теории тембра. Например, было показано, что для сохранения основных признаков тембра при транспонировании (переносе по частотной шкале) приниципиально важным является сохранение формы огибающей амплитудного спектра (т. е. его формантной структуры). Например, на рисунке 8 показано, что при переносе спектра на октаву в том случае, когда структура огибающей сохраняется (вариант "а"), вариации тембра менее значительны, чем при переносе спектра с сохранением соотношения амплитуд (вариант "б"). Этим обьясняется то, что звуки речи (гласные, согласные) можно распознать независимо от того, с какой высотой (частотой фундаментального тона) они произнесены, если при этом сохраняется расположение их формантных областей относительно друг друга.

Таким образом, подводя итоги, полученные классической теорией тембра с учетом результатов последних лет, можно сказать, что тембр, безусловно, существенно зависит от усредненного спектрального состава звука: количества обертонов, их относительного расположения на частотной шкале, от соотношения их амплитуд, то есть формы спектральной огибающей (АЧХ), а точнее, от спектрального распределения энергии по частоте.

Однако, когда в 60-х годах начались первые опыты синтеза звуков музыкальных инструментов, попытки воссоздать звучание, в частности, трубы по известному составу ее усредненного спектра оказались неудачными - тембр был совершенно не похож на звук медных духовых инструментов. То же относится и к первым попыткам синтеза голоса. Именно в это период, опираясь на возможности, который предоставили компьютерные технологии, началось развитие другого направления - установление связи восприятия тембра с временной структурой сигнала.

Прежде, чем переходить к результатам, полученным в этом направлении, надо сказать следующее.

Первое. Довольно широко распространено мнение, что при работе со звуковыми сигналами достаточно получить информацию об их спектральном составе, поскольку перейти к их временной форме всегда можно с помощью преобразования Фурье, и наоборот. Однако, однозначная связь между временным и спектральным представлениями сигнала существует только в линейных системах, а слуховая система является принципиально нелинейной системой, как при больших, так и при малых уровнях сигнала. Поэтому обработка информации в слуховой системе происходит параллельно как в спектральной, так и во временной области (см. "Звукорежиссер" 6/1999 г.).

Разработчики высококачественной акустической аппаратуры сталкиваются с этой проблемой постоянно, когда искажения АЧХ акустической системы (то есть неравномерность спектральной огибающей) доведены почти до слуховых порогов (неравномерность 2 дБ, ширина полосы 20 Гц…20 кГц и т. д.), а эксперты или звукорежиссеры говорят: "скрипка звучит холодно" или "голос с металлом" и т.п. Таким образом, информации, полученной из спектральной области, для слуховой системы недостаточно, нужна информация о временной структуре. Неудивительно, что методы измерений и оценки акустической аппаратуры существенно изменились за последние годы - появилась новая цифровая метрология, позволяющая определить до 30 параметров, как во временной, так и в спектральной областях.

Рис. 7 Зависимость состава спектра от силы удара

Следовательно, информацию о тембре музыкального и речевого сигнала слуховая система должна получать как из временной, так и из спектральной структуры сигнала.

Второе. Все полученные выше результаты в классической теории тембра (теории Гельмгольца) базируются на анализе стационарных спектров, полученных из стационарной части сигнала с определенным усреднением, однако принципиально важным является то обстоятельство, что в реальных музыкальных и речевых сигналах практически нет постоянных, стационарных частей. Живая музыка - это непрерывная динамика, постоянное изменение, и это связано с глубинными свойствами слуховой системы.

Исследования физиологии слуха позволили установить, что в слуховой системе, особенно в ее высших разделах, имеется множество так называемых нейронов "новизны" или "опознавания", т. е. нейронов, которые включаются и начинают проводить электрические разряды, только если есть изменения в сигнале (включение, выключение, изменение уровня громкости, высоты и т. д. ). Если же сигнал стационарный, то эти нейроны не включаются, и контроль за сигналом осуществляет ограниченное количество нейронов. Это явление широко известно из повседневной жизни: если сигнал не меняется, то часто его просто перестают замечать.

Рис. 8 Изменение огибающей спектра при сдвиге высоты

Для музыкального исполнения всякие монотонность и постоянство являются губительными: у слушателя отключаются нейроны новизны и он перестает воспринимать информацию (эстетическую, эмоциональную, смысловую и др), поэтому в живом исполнении всегда есть динамика (музыканты и певцы широко используют различную модуляцию сигнала - вибрато, тремоло и пр.).

Кроме того, каждый музыкальный инструмент, включая голос, обладает особой системой звукообразования, которая диктует свою временную структуру сигнала и его динамику изменения. Сравнение временной структуры звука (Рис. 1) показывает принципиальные различия: в частности, длительности всех трех частей - атаки, стационарной части и спада - у всех инструментов различаются по продолжительности и по форме. У ударных инструментов очень короткая стационарная часть, время атаки 0,5…3 мс и время спада 0,2…1 с; у смычковых время атаки 30…120 мс, время спада 0,15…0,5 с; у органа атака - 50…1000 мс и спад 0,2…2 с. Кроме того, принципиально отличается форма временной огибающей (Рис. 1).

Эксперименты показали, что, если удалить часть временной структуры, соответствующей атаке звука, или поменять местами атаку и спад (проиграть в обратном направлении), или атаку от одного инструмента заменить атакой от другого, то опознать тембр данного инструмента становится практически невозможным. Следовательно, для распознавания тембра не только стационарная часть (усредненный спектр которой служит основой классической теории тембра), но и период формирования временной структуры, как и период затухания (спада) являются жизненно важными элементами.

Действительно, при прослушивании в любом помещении первые отражения поступают на слуховую систему после того, как атака и начальная часть стационарной части уже была услышана. В то же время на спад звука от инструмента накладывается реверберационный процесс помещения, что значительно маскирует звук, и, естественно, приводит к модификации восприятия его тембра. Слух обладает определенной инерционностью, и короткие звуки воспринимаются как щелчки. Поэтому длительность звука должна быть больше 60 мс, чтобы можно было распознать высоту, и, соответственно, тембр. По-видимому, постоянные должны быть близки.

Тем не менее, времени между началом прихода прямого звука и моментами поступления первых отражений оказывается достаточно, чтобы распознать тембр звучания отдельного инструмента - очевидно, этим обстоятельством и определяется инвариантность (стабильность) распознавания тембров разных инструментов в разных условиях прослушивания. Современные компьютерные технологии позволяют достаточно детально проанализировать процессы установления звука у разных инструментов, и выделить самые существенные акустические признаки, наиболее важные для определения тембра. Детальный анализ этих признаков будет выполнен во второй части статьи.

 

 

 

  Часть 14.2 Тембр. Часть 2 Ирина Алдошина Как уже было отмечено в первой части этой статьи ("Звукорежиссер", 2/2001), существенное влияние на восприятие тембра музыкального инструмента или голоса оказывает структура его стационарного (усредненного) спектра: состав обертонов, их расположение на частотной шкале, их частотные соотношения, распределения амплитуд и форма огибающей спектра, наличие и форма формантных областей и т.д., что полностью подтверждает положения классической теории тембра, изложенные еще в трудах Гельмгольца. Однако экспериментальные материалы, полученные за последние десятилетия, показали, что не менее существенную, а, может быть, и гораздо более существенную роль в распознавании тембра играет нестационарное изменение структуры звука и, соответственно, процесс развертывания во времени его спектра, в первую очередь, на начальном этапе атаки звука. Процесс изменения спектра во времени особенно наглядно можно "увидеть" с помощью спектрограмм или трехмерных спектров (они могут быть построены с помощью большинства музыкальных редакторов Sound Forge, SpectroLab, Wave Lab и др.). Их анализ для звуков различных инструментов позволяет выявить характерные особенности процессов "развертывания" спектров. Например, на рисунке 1 показан трехмерный спектр звучания колокола, где по одной оси отложена частота в Гц, по другой время в секундах; по третьей амплитуда в дБ. На графике отчетливо видно, как происходит процесс нарастания, установления и спада во времени спектральной огибающей. Рис.1. Трехмерный спектр звучания колокола Процесс атаки у большинства музыкальных инструментов и голоса продолжается несколько десятков миллисекунд. За этот период времени (иногда с переходом на стационарную часть) слух воспринимает постепенное расширение спектра во времени, поскольку вступают все новые обертоны с различной скоростью и амплитудой, и распознает тембр данного инструмента. На этот процесс распознавания оказывают влияние также многочисленные другие признаки: начальный скрип смычка, начало ноты на медном инструменте, шум дыхания, начальное прохлопывание язычка, ударный глухой звук молоточка на пианино, небольшая негармоничность обертонов и т.д. все это создает живые акустические признаки идентификации инструмента (об их роли поговорим позднее). Рис.2. Атака звука для закрытой и открытой лабиальной (флейтовой) органной трубы Как известно, процесс атаки особенно важен для распознавания тембра также еще и потому, что он является устойчивой характеристикой звучания данного инструмента, менее всего подверженной "окрашиванию" со стороны помещения, в котором данное произведение исполняется, поскольку первые отражения поступают к слушателю с определенным запаздыванием, после того, как фаза атаки звука уже завершена и поступила к слушателю неокрашенной в виде прямого звука. Если бы этого не было, то распознать тембр инструмента при исполнении в различных помещениях было бы практически невозможно. Эксперименты показали, что слушатели не могут распознать инструмент, если фаза атаки удалена или изменена. Если поменять фазы атаки и спада местами (проиграть, например, запись любого инструмента в обратном направлении),то тембр меняется до неузнаваемости. Измерения показывают существенные различия в структуре атаки у разных инструментов. На рисунках 2…4 показаны примеры уровнеграмм (зависимостей уровня звукового давления от времени) и их спектрограмм (зависимостей частоты обертонов от времени, амплитуда при этом отмечается яркостью) для начального периода установления колебаний (атаки) тона С4 для различных инструментов: органных труб, деревянных духовых и медных духовых. Сравнение спектрограмм для двух типов органных труб открытая флейтовая (principal 8', рис. 2) и закрытая флейтовая (Gedakt 8') показывает, что у открытой трубы первой в спектре начинает устанавливаться вторая гармоника (на октаву выше первой). Она опережает первую гармонику (основную частоту) почти на 30 мс, почти одновременно с основным тоном появляется третья гармоника, четвертая и выше гармоники малы по амплитуде. У закрытой трубы первой в спектре появляется пятая гармоника, на две октавы + большую терцию выше первой; затем появляется первая гармоника; и только затем третья, на дуодециму (октаву + квинту) выше первой. Такое различие в процессе атаки отражает физический механизм звукообразования в разных трубах, поскольку у открытых труб возбуждаются все гармоники, а у закрытых только нечетные, что определяет различный тембр их звучания. Рис.3. Атака звука для деревянных духовых инструментов: кларнет, гобой, флейта Сравнение атаки тона С4 у различных деревянных инструментов показывает, что процесс установления колебаний у каждого инструмента имеет свой особый характер (рис. 3): - у кларнета доминируют нечетные гармоники 1/3/5, причем третья гармоника появляется в спектре на 30 мс позже первой, затем постепенно "выстраиваются" более высокие гармоники; - у гобоя установление колебаний начинается со второй и третьей гармоники, затем появляется четвертая и только через 8 мс начинает появляться первая гармоника; - у флейты сначала появляется первая гармоника, затем только через 80 мс постепенно вступают все остальные. На рисунке 4 показан процесс установления колебаний для группы медных инструментов: трубы, тромбона, валторны и тубы. Отчетливо видны различия: - у трубы компактное появление группы высших гармоник, у тромбона первой появляется вторая гармоника, затем первая, и через 10 мс вторая и третья. У тубы и валторны видна концентрация энергии в первых трех гармониках, высшие гармоники практически отсутствуют. Рис.4. Атака звука для медных духовых инструментов: труба, тромбон, валторна, туба Анализ полученных результатов показывает, что процесс атаки звука существенно зависит от физической природы звукоизвлечения на данном инструменте: - от использования амбушюров или тростей, которые, в свою очередь, делятся на одинарные или двойные; - от различных форм труб (прямые узкомензурные или конусные широкомензурные) и т.д. Это определяет количество гармоник, время их появления, скорость выстраивания их амплитуды, а соответственно и форму огибающей временной структуры звука. У некоторых инструментов, например, флейты (Рис. 5а), огибающая в период атаки имеет плавный экспоненциальный характер, а у некоторых, например, фагота(Рис.5б), отчетливо видны биения, что и является одной из причин существенных различий в их тембре. Во время атаки высшие гармоники иногда опережают основной тон, поэтому могут происходить флуктуации высоты тона периодичность, а значит, и высота суммарного тона, выстраиваются постепенно. Иногда эти изменения периодичности носят квазислучайный характер. Все эти признаки помогают слуховой системе "опознать" тембр того или иного инструмента в начальный момент звучания. Рис.5. Временная огибающая атаки: а) флейты, б) фагота Для оценки тембра звучания важен не только момент его распознавания (т.е. способность отличить один инструмент от другого), но и возможность оценить изменение тембра в процессе исполнения. Здесь важнейшую роль играет динамика изменения спектральной огибающей во времени на всех этапах звучания: атаки, стационарной части, спада. Характер поведения каждого обертона во времени также несет важнейшую информацию о тембре. Например, в звучании колоколов особенно четко видна динамика изменения, как по составу спектра, так и по характеру изменения во времени амплитуд его отдельных обертонов: если в первый момент после удара в спектре отчетливо видно несколько десятков спектральных составляющих, что создает шумовой характер тембра, то через несколько секунд в спектре остаются несколько основных обертонов (основной тон, октава, дуодецима и минорная терция через две октавы), остальные затухают, и это создает особый тонально окрашенный тембр звучания. Рис.6. Изменения во времени амплитуд обертонов для звука колокола Пример изменения амплитуд основных обертонов во времени для колокола показан на рисунке 6. Видно, что для него характерна короткая атака и длинный период затухания, при этом скорость вступления и спада обертонов различных порядков и характер изменения их амплитуд во времени существенно отличаются. Поведение различных обертонов во времени зависит от типа инструмента: в звучании рояля, органа, гитары и др. процесс изменения амплитуд обертонов имеет совершенно разный характер. Опыт показывает, что аддитивный компьютерный синтез звуков, учитывающий специфику развертывания отдельных обертонов во времени, позволяет получить значительно более "жизненное" звучание. Вопрос о том, динамика изменения каких именно обертонов несет информацию о тембре, связан с существованием критических полос слуха. Как уже было сказано в первой статье цикла ("Звукорежиссер", 6/1999), посвященной определению высоты тона, периферическая слуховая система выполняет спектральный анализ поступившего звука. Базилярная мембрана в улитке действует как линейка полосовых фильтров, ширина полосы которых зависит от частоты: выше 500 Гц она равна примерно 1/3 октавы, ниже 500 Гц она составляет примерно100 Гц. Ширина полосы этих слуховых фильтров называется "критической полосой слуха" (существует специальная единица измерения 1 барк, равная ширине критической полосы во всем диапазоне слышимых частот). Внутри критической полосы слух производит интегрирование поступившей звуковой информации, что играет также важную роль в процессах слуховой маскировки. Если проанализировать сигналы на выходе слуховых фильтров, то можно видеть, что первые пять-семь гармоник в спектре звучания любого инструмента попадают обычно каждая в свою критическую полосу, поскольку они достаточно далеко отстоят друг от друга в таких случаях говорят, что гармоники "развертываются" слуховой системой. Разряды нейронов на выходе таких фильтров синхронизированы с периодом каждой гармоники. Рис.7. Вид сигналов на выходе слуховых фильтров для "развернутых" и "неразвернутых" гармоник Гармоники выше седьмой обычно находятся достаточно близко друг к другу по частотной шкале, и не "развертываются" слуховой системой внутрь одной критической полосы попадает несколько гармоник, а на выходе слуховых фильтров получается сложный сигнал. Разряды нейронов в этом случае синхронизированы с частотой огибающей, т.е. основного тона (рис. 7). Соответственно, механизм обработки информации слуховой системой для развернутых и неразвернутых гармоник несколько отличается в первом случае используется информация "по времени", во втором "по месту". Существенную роль при распознавании высоты тона, как было показано в предыдущих статьях, играют первые пятнадцать-восемнадцать гармоник. Эксперименты с помощью компьютерного аддитивного синтеза звуков показывают, что поведение именно этих гармоник оказывает также наиболее существенное влияние на изменение тембра. Поэтому в ряде исследований предлагалось размерность тембра считать равной пятнадцати-восемнадцати, и оценивать его изменение по этому количеству шкал это одно из принципиальных отличий тембра от таких характеристик слухового восприятия, как высота или громкость, которые могут быть шкалированы по двум-трем параметрам (например, громкость), зависящих в основном от интенсивности, частоты и длительности сигнала. Достаточно хорошо известно, что если в спектре сигнала присутствует достаточно много гармоник с номерами от 7-ой до15…18-ой, с достаточно большими амплитудами, например, у трубы, скрипки, язычковых труб органа и т.п., то тембр воспринимается как яркий, звонкий, резкий и т. д. Если в спектре присутствуют в основном низшие гармоники, например, у тубы, валторны, тромбона, то тембр характеризуется как темный, глухой и т.д. (см. рис. 2…4). Кларнет, у которого в спектре доминируют нечетные гармоники, обладает несколько "носовым" тембром и т.д. В соответствии с современными взглядами, важнейшую роль для восприятия тембра имеет изменение динамики распределения максимума энергии между обертонами спектра. Рис.8. Определение центроида Для оценки этого параметра введено понятие "центроид спектра", который определяется как средняя точка распределения спектральной энергии звука, его иногда определяют как "балансную точку" спектра. Способ определения его состоит в том, что рассчитывается значение некоторой средней частоты: , где Ai амплитуда составляющих спектра, fi их частота . Для примера, показанного на рисунке 8, это значение центроида составляет 200 Гц. F =(8 х 100 + 6 х 200 + 4 х 300 + 2 х 400)/(8 + 6 + 4 + 2) = 200. Смещение центроида в сторону высоких частот ощущается как повышение яркости тембра. Существенное влияние распределения спектральной энергии по частотному диапазону и ее изменения во времени на восприятие тембра связано, вероятно, с опытом распознания звуков речи по формантным признакам, которые и несут информацию о концентрации энергии в различных областях спектра (неизвестно, правда, что было первичным). Эта способность слуха имеет существенное значение при оценке тембров музыкальных инструментов, поскольку наличие формантных областей характерно для большинства музыкальных инструментов, например, у скрипок в областях 800…1000 Гц и 2800…4000 Гц, у кларнетов 1400…2000 Гц и т.д. Соответственно, их положение и динамика изменения во времени влияют на восприятие индивидуальных особенностей тембра. Известно, какое значительное влияние на восприятие тембра певческого голоса оказывает наличие высокой певческой форманты (в области 2100…2500 Гц у басов, 2500…2800 Гц у теноров, 3000…3500 Гц у сопрано). В этой области у оперных певцов сосредоточивается до 30% акустической энергии, что обеспечивает звонкость и полетность голоса. Удаление с помощью фильтров певческой форманты из записей различных голосов (эти опыты были выполнены в исследованиях проф. В.П. Морозова) показывает, что тембр голоса становится тусклым, глуховатым и вялым. Рис.9. Изменение положения центроида для звуков скрипки Изменение тембра при изменении громкости исполнения и транспонировании по высоте также сопровождается сдвигом центроида за счет изменения количества обертонов. Пример изменения положения центроида для звуков скрипки разной высоты показан на рисунке 9 (по оси абсцисс отложена частота расположения центроида в спектре). Исследования показали, что у многих музыкальных инструментов имеется почти монотонная связь между увеличением интенсивности (громкости) и сдвигом центроида в высокочастотную область, за счет чего тембр становится ярче. По-видимому, при синтезе звуков и создании различных компьютерных композиций следует учитывать динамическую связь между интенсивностью и положением центроида в спектре для того, чтобы получать более естественный тембр. Наконец, различие в восприятии тембров реальных звуков и звуков с "виртуальной высотой", т.е. звуков, высоту которых мозг "достраивает" по нескольким целочисленным обертонам спектра (это характерно, например, для звуков колоколов), можно объяснить с позиций положения центроида спектра. Поскольку у этих звуков значение частоты основного тона, т.е. высоты, может быть одинаковым, а положение центроида разное из-за разного состава обертонов, то, соответственно, тембр будет восприниматься по-разному. Интересно отметить, что еще более десяти лет назад для измерения акустической аппаратуры был предложен новый параметр, а именно трехмерный спектр распределения энергии по частоте и по времени, так называемое распределение Вигнера, которое достаточно активно используется различными фирмами для оценки аппаратуры, поскольку, как показывает опыт, позволяет установить наилучшее соответствие с ее качеством звучания. Учитывая изложенное выше свойство слуховой системы использовать динамику изменения энергетических признаков звукового сигнала для определения тембра, можно предположить, что этот параметр распределение Вигнера может быть полезен и для оценки музыкальных инструментов. Оценка тембров различных инструментов всегда носит субъективный характер, но если при оценке высоты и громкости можно на основе субъективных оценок расположить звуки по определенной шкале (и даже ввести специальные единицы измерения "сон" для громкости и "мел" для высоты), то оценка тембра значительно более трудная задача. Обычно для субъективной оценки тембра слушателям предъявляются пары звуков, одинаковых по высоте и громкости, и их просят расположить эти звуки по разным шкалам между различными противоположными описательными признаками: "яркий"/"темный", "звонкий"/"глухой" и т.д. (О выборе различных терминов для описания тембров и о рекомендациях международных стандартов по этому вопросу мы обязательно поговорим в дальнейшем). Существенное влияние на определение таких параметров звука, как высота, тембр и др., оказывает поведение во времени первых пяти-семи гармоник, а также ряда "неразвернутых" гармоник до 15…17-ой. Однако, как известно из общих законов психологии, кратковременная память человека может одновременно оперировать не более чем семью-восьмью символами. Поэтому очевидно, что и при распознавании и оценке тембра используется не более семи-восьми существенных признаков. Попытки установить эти признаки путем систематизации и усреднения результатов экспериментов, найти обобщенные шкалы, по которым можно было бы идентифицировать тембры звуков различных инструментов, связать эти шкалы с различными временно-спектральными характеристиками звука, предпринимаются уже давно. Одной из самых известных является работа Грея (1977 г.), где было проведено статистическое сравнение оценок по различным признакам тембров звуков различных инструментов струнных, деревянных, перкуссионных и др. Звуки были синтезированы на компьютере, что позволяло менять в требуемых направлениях их временные и спектральные характеристики. Классификация тембральных признаков была выполнена в трехмерном (ортогональном) пространстве, где в качестве шкал, по которым по которым производилась сравнительная оценка степени подобия тембральных признаков (в пределах от 1 до 30), были выбраны следующие: - первая шкала - значение центроида амплитудного спектра (по шкале отложено смещение центроида, т.е. максимума спектральной энергии от низких к высоким гармоникам); - вторая - синхронность спектральных флуктуаций, т.е. степень синхронности вступления и развития отдельных обертонов спектра; - третья - степень наличия низкоамплитудной негармонической высокочастотной энергии шума в период атаки. Обработка полученных результатов с помощью специального пакета программ для кластерного анализа позволила выявить возможность достаточно четкой классификации инструментов по тембрам внутри предложенного трехмерного пространства . Рис.10. Двухмерная диаграмма для классификации тембров инструментов Попытка визуализировать тембральное различие звуков музыкальных инструментов в соответствии с динамикой изменения их спектра в период атаки была предпринята в работе Полларда (1982 г.), результаты показаны на рисунке 10. По оси Y отложена величина, пропорциональная общей энергии низших ("развернутых") гармоник, по оси Х энергии высших "неразвернутых" гармоник. Если рассмотреть, как меняется энергия, приходящаяся на долю гармоник в период атаки звука (который продолжается от 10 до 160 мс для кларнета, от10 до 65 мс для скрипки, от 10…100 мс для трубы), то можно достаточно четко разделить звуки различных инструментов по этим признакам. Процесс изменения соотношения гармоник в разные периоды атаки показан черной линией, переход к стационарному состоянию белым кружком. У кларнета в начальный период превалирует спектральная энергия в низших гармониках (0,25), затем увеличивается доля энергии высших гармоник (до 0,55), затем, при переходе к стационарному состоянию (отмечено кружком), устанавливается определенное соотношение в распределении энергии между низшими и высшими гармониками (0,2/0,45). У скрипки в начальный период превалируют (энергетически) высокие гармоники, затем, по мере перехода к стационарному состоянию, уменьшается доля высоких гармоник, возрастает энергия в низших гармониках. Особенно наглядно видно перемещение энергетического максимума от высших гармоник в начальный момент атаки к низшим гармоникам по мере перехода к стационарному состоянию у органной трубы (principal 8'). Как следует из данных, приведенных на рисунке 10, все инструменты достаточно четко разделяются по этим спектральным признакам, что еще раз подчеркивает важность динамики изменения спектра в период атаки для идентификации тембра различных инструментов. Рис.11. Трехмерное пространство тембров Поиски методов многомерного шкалирования тембров и установление их связей с спектрально-временными характеристиками звуков активно продолжаются. Эти результаты чрезвычайно важны для развития технологий компьютерного синтеза звуков, для создания различных электронных музыкальных композиций, для коррекции и обработки звука в звукорежиссерской практике и т.д. Интересно отметить, что еще в начале века великий композитор ХХ века Арнольд Шёнберг высказал идею, что "…если рассматривать высоту тона, как одну из размерностей тембра, а современную музыку построенной на вариации этой размерности, то почему бы не попробовать использовать другие размерности тембра для создания композиций". Эта идея реализуется в настоящее время в творчестве композиторов, создающих спектральную (электроакустическую) музыку. Именно поэтому интерес к проблемам восприятия тембра и его связям с объективными характеристиками звука настолько высок. Таким образом, полученные результаты показывают, что, если в первый период изучения восприятия тембра (на основе классической теории Гельмгольца) была установлена четкая связь изменения тембра с изменением спектрального состава стационарной части звучания (составом обертонов, соотношением их частот и амплитуд и др.), то второй период этих исследований (с начала 60-х годов) позволил установить принципиальную важность спектрально-временных характеристик. Это изменение структуры временной огибающей на всех этапах развития звука: атаки (что особенно важно для распознавания тембров различных источников), стационарной части и спада. Это и динамическое изменение во времени спектральной огибающей, в т.ч. смещение центроида спектра, т.е. смещение максимума спектральной энергии во времени, а также развитие во времени амплитуд спектральных составляющих, особенно первых пяти-семи "неразвернутых" гармоник спектра. В настоящее время начался третий период изучения проблемы тембра центр исследований переместился в сторону изучения влияния фазового спектра, а также к использованию психофизических критериев в распознавании тембров, лежащих в основе общего механизма распознавания звукового образа (группировка в потоки, оценка синхронности и др.). О полученных в этом направлении результатах в следующих статьях.  

 

 

Доверь свою работу ✍️ кандидату наук!
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой



Поиск по сайту:







©2015-2020 mykonspekts.ru Все права принадлежат авторам размещенных материалов.