Эстетическая информация, близкая по своей природе к эмоциональной и потому нередко объединяемая под термином эмоционально-эстетическая, играет особо важную роль в различных видах изобразительного искусства (живопись, скульптура и др.), а также сценического (драматического, вокального, музыкального, инструментального). Так, например, в вокальном искусстве различные типы певческих голосов: бас, баритон, тенор, сопрано, меццо-сопрано, контральто – являются по сути дела эстетическими категориями с определенными звуковысотными и тембровыми характеристиками, обеспечивающими создание определенных сценических образов музыкально-художественных произведений, характеризующихся яркой индивидуальностью. По критериям эмоционально-эстетической информации различаются также разные жанры и виды вокально-музыкального искусства (академическое, оперно-концертное, эстрадное, церковное, хоровое, сольное, ансамблевое пение и т. п.).
Вокальное искусство принадлежит к числу комплексных, синтетических видов, поскольку эмоционально-эстетическое воздействие осуществляется как вербальными средствами – словом, – так и невербальными, т. е. особым характером акустического строения вокальной речи: а) увеличением длительности гласных, б) большим диапазоном изменения силы (более 30 дБ) и высоты голоса (до 2-х октав и более), г) наличием вибрато (амплитудно-частотных модуляций голоса с периодичностью 5–7 Гц), д) особым певческим тембром, характеризующимся повышенной звонкостью и полетностью, что определяется наличием в спектре певческого голоса так называемой высокой певческой форманты (представляющей собой зону значительно усиленных обертонов в области 2300–3000 Гц, расположенных в зоне максимальной чувствительности слуха, см. рисунок 12), наконец – е) особым использованием фонетических средств эмоционально-эстетического воздействия (Морозов, 1977).
Рис. 12. Важнейшее эстетическое свойство голоса хороших профессиональных певцов – приятная на слух звонкость, «серебристый тембр» – зависит от присутствия в голосе усиленных по амплитуде высоких обертонов (в области 2300–3000 Гц), получивших название высокая певческая форманта (ВПФ).
На рисунке представлены наложенные друг на друга спектры голоса известных мастеров вокального искусства: 1 – Ф. Шаляпина (гласн. А, нота mi1), 2 – П. Лисициана (гласн. А, нота sol1), 3 – Э. Карузо (гласн. О, нота la1, 4 – Г. Зобиана (гласн. А, нота la1). Хорошо видно, что ВПФ, отмеченная стрелкой, у баса, баритона и двух теноров имеет большой уровень энергии и практически совпадает по своему расположению на шкале частот (см.: Морозов, 1977).
В последнее время обнаружено, что такие эмоционально-эстетические категории, как минор и мажор реализуются в вокальном искусстве специфическим перераспределением частотного расположения обертонов голоса (Морозов, Кузнецов, 1994). Указанное явление, получившее название «феномен квазигармоничности», лежит в основе эмоциональной выразительности голоса (как в пении, так и в речи).
Экспериментальные исследования показали, что голоса певцов разных жанров характеризуются разной степенью эмоциональности и гармоничности обертонов. Для академических певцов в целом характерно преобладание положительных эмоций (радость благополучие, уравновешенность), а для солистов тяжелого рока – отрицательных (гнев, беспокойство, страх). Далее были проведены исследования степени гармоничности обертонов голоса у певцов указанных групп: с помощью специальных компьютерных методов вычислялись усредненные значения степени отклонения каждого из первых десяти обертонов (%) от их идеального гармонического положения на оси частот амплитудного спектра. Оказалось, что минимальные отклонения характерны для певцов академического жанра (0,1–3 %), а максимальные – для ряда рок-солистов (4–9 %) (см. рисунок 13).
Рис. 13а. Примеры гармонических спектров певческого голоса. Эмоционально спокойный звук.
Певец академического жанра В. В. Вертикальные линии соответствуют идеальному гармоническому расположению обертонов на шкале частот по отношению к частоте основного тона (Морозов, Кузнецов, Харуто, 1995).
Рис. 13б. Примеры негармоничных спектров голоса при выражении гнева. Солист тяжелого рока.
Обозначения те же, что и на рис. 13а (Морозов, Кузнецов, Харуто, 1995).
Эти и другие исследования показывают, что выражение отрицательных эмоций, прежде всего гнева, реализуется дисгармоничностью обертонов голоса, а для положительных характерна гармоничность (Morozov, 1996, Морозов, 1997b).
Эмоционально-эстетические характеристики речи особенно важны для лиц речевых профессий (дикторы радио, ТВ, лекторы, пропагандисты, педагоги, политики, общественные деятели и т. п.). Многомиллионная слушательская аудитория радио и ТВ не только дает свою критическую оценку выступающим (по эстетическому, психологическому воздействию их речи), но и формирует под их воздействием эстетические свойства собственной речи. Средства массовой коммуникации – радио, ТВ – всегда были образцом, эталоном высокой эстетической культуры речи. Достаточно вспомнить хотя бы голоса наших выдающихся дикторов Ю. Левитана, О. Высоцкой и других мастеров дикторской речи. Сегодня, к сожалению, мы становимся свидетелями резкого снижения эстетических свойств речи выступающих по радио и ТВ: высокопрофессиональных дикторов сменили журналисты, часто не имеющие никакой дикторской подготовки, порой с множеством речевых недостатков, как вербальных, так и невербальных: тембра голоса, орфоэпии, интонации и т. п. Факт, достойный сожаления, поскольку воспитательная сила радио и ТВ огромна. Вульгарная манера публичного речевого поведения предлагается как норма. Эстетический эталон высококультурной русской речи предан забвению. По мнению ряда авторитетных специалистов по дикторской речи, в частности И. Е. Прудовского, лингвистов, фонетиков, психологов, искусствоведов – авторов многочисленных писем слушателей радио и ТВ, – необходимо принятие серьезных мер к возрождению культуры речевого поведения и прежде всего – профессиональной речи на радио и ТВ.
Индивидуально-личностная информация, позволяющая узнавать знакомых по голосу (например, по телефону), принадлежит к числу наиболее специфичных характеристик для каждого конкретного человека. В этом отношении она соизмерима с дактилоскопическими узорами на отпечатках пальцев и внешним видом человека. Встречающееся иногда сходство голосов, вызванное, например, семейной мимикрией или искусным звукоподражанием, тем не менее при детальном анализе как на слух опытных экспертов-аудиторов, так и особенно с помощью современных акустических методов (фоноскопия) выявляет целый ряд существенных различий. Практическая неповторимость голоса каждого человека позволяет использовать данное свойство в банковском деле как средство верификации личности и автоматического обеспечения строго индивидуального доступа к сейфу его владельца, а также в криминалистике для опознания правонарушителей и т. п.
Высокая специфичность индивидуально-личностной информации речи определяется характерными для каждого человека особенностями тембра голоса, его высоты, интонационных модуляций речи, темпоритмических характеристик, а также характерных атипичных речевых проявлений: покашливание, смех, особенности фонетики, нарушения речеобразования, заикание, картавость, дизартрии и т. п. По данным В. И. Воячека, в старой Италии в паспорте человека наряду с другими его отличительными чертами отмечались свойства голоса. Звуковысотные и тембральные особенности голоса обусловлены неповторимыми индивидуальными различиями в строении гортани, голосовых складок, их длины, толщины, жесткости, а также объема и формы резонаторных полостей, влияющих на тембр. Весьма существенное влияние на голос оказывают индивидуальные психофизиологические особенности личности: тип нервной системы, темперамент, пол, возраст и другие свойства, рассматриваемые в соответствующих разделах данной работы (см. также «Биофизическая информация», «Акустические основы НК» и др.).
Экспериментальные исследования показывают высокую степень надежности распознавания людей на основе индивидуально-личностной информации голоса: до 98 % и более на выборке в несколько десятков магнитофонных записей знакомых и незнакомых голосов (речевые фразы длительностью 5–10 сек) при наличии типичного комнатного шума. Существенно, что высокая надежность опознавания знакомых голосов сохраняется и при их инвертированном во времени звучании (Пашина, Морозов, 1990), что свидетельствует о большой помехоустойчивости данного вида невербальной информации.
Биофизическая информация, характеризующая половые, возрастные различия людей, а также – рост и вес человека, в определенной мере отражает и индивидуально-личностные особенности людей. Ее основное отличие от индивидуально-личностной информации состоит в том, что она характеризует принадлежность человека к определенной категории по биофизическим критериям (пола, возраста, роста, веса), т. е. несет не сугубо индивидуальные, а типологические, групповые (среднестатистические) черты указанных категорий людей. По этому критерию данный вид информации может быть причислен к социально-групповой категории (см. следующий раздел), поскольку, по крайней мере, половые и возрастные группы можно рассматривать и как социальные категории. Специфичность биофизической информации в том, что она связана в основном с биологическими, физическими (анатомическими) свойствами людей фактически ими определяется.
Надежность определения биофизических характеристик говорящего по его голосу достаточно высока и соответственно составляет: для пола – 98,4 %, возраста – 82,4 %, (7,4 ± 2,9 лет), роста – 96,7 %, (5,6 ± 2,6 см), веса – 87,2 %, (8,6 ± 3,1 кг) (Морозов, 1993a). Точность определения указанных характеристик существенно зависит от возраста слушателей, которые лучше всего определяют возраст говорящих, близкий к собственному. При этом молодые слушатели (17–25 лет) склонны занизить возраст старших, и тем более, чем больше возрастная разница говорящий – слушатель. Дети допускают существенно (в 1,5–2 раза) бо́льшие ошибки в определении биофизических характеристик говорящих, равно как и лица другой национальности. Таким образом, адекватность восприятия биофизической информации речи определяется социальным опытом аудиторов.
Цель работы состояла в исследовании разрешающих возможностей слушателей по определению относительных размеров рта говорящего по его голосу. Из теории речеобразования известно, что изменение размера и формы ротового отверстия как излучателя звука и составной части ротового резонатора существенно влияет на спектральные характеристики речи, что отражается в изменении тембровых качеств речевых звуков (Г. Фант, 1964; В. Н. Сорокин, 1985). Таким образом, имеется объективная основа для субъективной оценки размеров рта по голосу.
В первой предварительной серии экспериментов была установлена способность слушателей (8 чел.) с достаточной уверенностью определять относительные размеры рта двух дикторов (методом схематических графических зарисовок), ширина рта которых в норме различалась на 18,6 %. Все аудиторы безошибочно определили как диктора с большей, так и с меньшей шириной рта. Ошибки аудиторов в определении соотношений ширины рта составляли от 5 до 22 % от истинных различий.
Во второй серии были проведены более обширные статистические исследования по оценке аудиторами относительных изменений ширины рта одного и того же диктора при произнесении им стандартной фразы (по магнитофонным записям его голоса). Изменение ширины рта диктора включало три основных градации (норма, широко, узко) и две промежуточных (слегка узко, слегка широко) при среднем изменении ширины рта между соседними градациями» 6 мм. Контроль за шириной рта производился с помощью специальной методики измерения линейных размеров, а также с помощью компьютерной программы оценки спектральных характеристик речи. Психоакустический тест на ширину рта состоял из 30 реализаций стандартной фразы с варьированием вышеуказанных размеров рта в случайном порядке.
Было обследовано пять групп предварительно не тренированных аудиторов общей численностью 60 человек (студенты МГК и МПГУ). Установлено, что способность к определению относительной ширины рта говорящего по вышеуказанному тесту у разных аудиторов колеблется от 40 % до 87 % правильных оценок и в среднем для всего контингента обследованных (60 чел.) составляет 64,8 ± 8,5 %. Расчеты показали, что основное число ошибок аудиторов (32,7 %, что составляет 77,3 % правильных определений) приходится на спутывание соседних градаций ширины рта (например, вместо узко – слегка узко и т. п.), соответствующих изменениям ширины рта на ΔL = ±6 мм и резко уменьшается для более широких диапазонов изменения ротового отверстия.
Таким образом, можно сделать вывод, что разрешающие возможности слуховой системы человека при определении ширины рта говорящего по звуку его голоса составляют в среднем около ±6 мм (с учетом трудноучитываемых погрешностей). Такого рода изменение ширины рта (±6 мм) уже приводит к едва заметным на слух (многих людей) изменениям тембра голоса говорящего, что объективно соответствует определенным изменениям спектральных характеристик речевых звуков (при расширении рта происходит относительное повышение уровня высокочастотных составляющих спектра, а при сужении – их понижение, пропорционально степени расширения или сужения).
Рис. 14. Вероятность ошибок (%) определения относительной ширины рта говорящего как функция ΔL (мм)
Полученные результаты, равно как и предложенный метод представляются существенными для дальнейшей разработки теории психологического портрета человека по его голосу (Морозов, 1993a, 1995c, 1998c), а в практическом плане – системы «фоторобот по голосу», что немаловажно для криминалистики. Большие индивидуальные различия среди аудиторов при оценке ширины рта по голосу дают основания использовать предложенный метод в качестве невербального теста для оценки индивидуально-личностных психологических особенностей людей по критерию слухо-зрительных ассоциаций (образов), а также при отборе и тренировке экспертов аудиторской бригады.
Медицинская информация отражает состояние здоровья говорящего и характеризуется известными терминами (голос «больной», «болезненный» и т. п.). Они указывают как на специфические виды заболеваний, связанные с нарушением работы голосового аппарата и органов артикуляции, так и на общее болезненное состояние организма. В этой связи можно выделить три основных подвида медицинской информации.
Фониатрическая информация характеризует состояние голосового аппарата по формированию гласных звуков, т. е. нарушение голоса. Например, при различного рода простудных заболеваниях (острый ларингит) голос приобретает сиплый характер (дисфония) или вообще пропадает (афония) ввиду несмыкания голосовых складок. Острый ринит приводит к характерной при насморке гнусавости тембра. Фониатрическая информация является важным диагностическим показателем степени выраженности профессиональных нарушений голоса (у лекторов, педагогов, певцов, актеров и др.) и используется врачами-фониатрами в клинической практике (фоническое прослушивание). Применение современной аппаратуры позволяет объективизировать этот вид диагностики, придав ему количественные критерии (нарушение силы голоса, тембра по спектральным характеристикам и т. п.). Весьма распространенным профессиональным заболеванием этого вида является фонастения, характеризующаяся слабостью голоса, уменьшением звуковысотного и динамического диапазонов и др. В отличие от острых воспалительных заболеваний фонастения характеризуется отсутствием видимых их проявлений в лорорганах, что заставляет искать ее причины в переутомлении центрально-нервных механизмов регулирования голосового аппарата.
Логопедическая информация характеризует степень нарушения артикуляторных процессов речеобразования. Они, в свою очередь, подразделяются на виды, связанные с периферическими нарушениями артикуляции (дизартрии, косноязычие, картавость и др.) и с центральными нарушениями, например заиканием, которому подвержены и дети и взрослые (до 5–8 % населения). Последний вид недуга является крайне неприятным, ввиду психологического угнетения больного, у которого еще с детства, вследствие постоянных насмешек товарищей, может сформироваться комплекс неполноценности. По этой причине, а также ввиду неясности психофизиологических механизмов заикания и неэффективности терапии, это нарушение речи стоит в числе серьезных социально-психологических и медицинских проблем.
Информация об общем медицинском состоянии связана с источником заболевания не напрямую (как фониатрическая и логопедичес кая информация), а опосредовано, главным образом через психику больного в результате понижения общего тонуса, угнетенностью его психического состояния, озабоченностью исходом болезни и т. п., а в определенной мере и нарушением физического состояния (затрудненное дыхание и др.). Все три вида медицинской информации в той или иной степени связаны со спецификой заболевания и используются опытными клиницистами в диагностических целях.
Информация о помехах, сопровождающих процесс речи, также немаловажна для слушателя. Помехи могут быть разного происхождения. Так, например, электроакустические шумы в телефонном тракте, никак не связанные с личностью говорящего, являются индифферентной помехой. Шумы же в помещении, откуда ведется телефонный разговор, могут быть значимой помехой, т. е. нести уже определенную информацию о говорящем, свидетельствуя о взаимодействии его с другими людьми, его местонахождении, например на вечеринке (гул голосов, музыка) или на улице (шумы транспорта) и т. п. Этот вид информации может иметь особое значение в криминалистике для выяснения обстоятельств дела, связанных с личностью данного человека и т. п.
Пространственная информация – это информация о пространственном расположении говорящего по отношению к слушателю: азимут (справа, слева, спереди, сзади), расстояние, движение (удаление, приближение, передвижение вокруг слушателя и т. п.). В основе пространственного восприятия лежит бинауральный механизм слуха, т. е. восприятие двумя ушами. Установлено, что смещение источника звука в сторону по отношению к фронтальному центру восприятия, например вправо, приводит к запаздыванию прихода звуковой волны в левое ухо по сравнению с правым (эффект предшествования), Величина запаздывания определяется разностью расстояний от источника звука до правого и левого уха, деленной на скорость звука в воздухе (340 м/с). В случае максимальной разности (для расположения говорящего сбоку слушателя) запаздывание приблизительно определяется разностью расстояний между ушами, т. е. около 21 см и составляет около 0,6 мс. При небольших смещениях источника звука, близких к фронтальному расположению, запаздывание может составить около 0,04 мс (минимально ощутимая разность во времени). Этого опаздывания достаточно, чтобы человек идентифицировал источник звука либо немного справа, либо слева. Другим фактором является экранирующее действие головы, в результате чего звук к дальнему уху приходит не только с запаздыванием, но и ослабленный по интенсивности. Порог пространственной идентификации источника звука для слуха человека составляет всего 2,5–3,00. Простейший опыт позволяет убедиться в справедливости временной теории пространственной локализации звука: если у обычного врачебного фонендоскопа удлинять или укорачивать одну из ветвей, т. е. трубок, ведущих к ушам, то субъективный звуковой образ, вызванный постукиванием по мембране фонендоскопа, соответственно будет смещаться в сторону, противоположную удлиненной ветви, или наоборот – в сторону укороченной трубки (опыт Урбанчича).
Важным психологическим свойством пространственного восприятия говорящего слушателем является так называемый social party effect («эффект вечеринки»). Точнее его можно назвать «эффектом направленного внимания» или «эффектом пространственной психологической избирательности». Он состоит в том, что при наличии многих говорящих вокруг слушателя человек способен сознательно направлять свое внимание на интересующего его собеседника, избирательно улучшать восприятие его речи при одновременном подавлении (игнорировании) речи других говорящих людей. Специальные опыты показали, что данный эффект избирательного пространственного восприятия (т. е. обострение слуха) составляет свыше 10 дБ (Альтман, 1983). Эффект направленного внимания может улучшить восприятие речи до 10–15 % (по критерию разборчивости). Весьма важно, что данный психологический эффект направленного внимания проявляется не только при бинауральном пространственном восприятии, но и в определенной мере при восприятии монофонических магнитофонных записей, например одновременно звучащих голосов, и не только в условиях бинаурального (т. е. в свободном звуковом поле), но и монаурального прослушивания, как, например, при телефонном разговоре.