.
Самой крупной из единиц, на которые делится речевой поток, является фонетическое предложение, или период. На конце периода всегда имеется пауза. Более мелкие единицы — фонетические синтагмы. Между ними паузы необязательны, а внутри них отсутствуют — именно это имеют в виду, когда говорят, что в устной речи нет пробелов между словами. Фонетические синтагмы и фонетические предложения имеют просодическую организацию — определенный рисунок темпа, изменений громкости, движения основного тона голоса (т.е. интонации). Просодический контур несет смысловую нагрузку — с его помощью мы различаем сообщение, вопрос, побуждение, переспрос, повторение, восхищение, возмущение, отличаем главную часть сообщения от побочной, законченное предложение от незаконченного и т.д. Так, например, переспрос характеризуется убыстрением темпа (Во сколько, ты говоришь, поезд приходит?), о незавершенности предложения сообщает подъем интонации (ср., например, интонацию, с которой произносится слово «приехал» в предложении Артем приехал и в предложении Артем приехал, а Никита уехал).
Рис. 1.7. За счет отсутствия пауз между словами в устной речи все три строки произносятся одинаково. А вот пример из английского:
Good can decay many ways
Good candy came anyways55.
«Добро может угасать по-разному»
«Как бы там ни было, но появились хорошие конфеты».
Средства просодии, как и слова, являются знаками с произвольной связью между формой и смыслом; самое простое доказательство этого — то, что в разных языках одно и то же значение может выражаться по-разному. Например, в русском языке вопрос характеризуется повышением интонации, а в японском — резким падением.
Фонетические синтагмы делятся на фонетические слова. У фонетического слова во многих языках есть ударение — и при этом (обычно) только одно. Чередование ударных и безударных слогов задает ритмическую схему фонетической синтагмы и предложения, на ударном слоге реализуются фразовые акценты. Звуки внутри фонетического слова могут вести себя не так, как на его границах: например, в русском языке звонкие согласные на конце слова оглушаются, но в предлоге, составляющем одно фонетическое слово с последующим существительным или прилагательным, оглушения не происходит (ср. [в] лесу и отло[ф] лисиц).
Фонетические слова делятся на слоги. Каждый слог — один «квант» выдоха. Если эти выдохи сделать более сильными и разделить паузами, получится скандирование («Шайбу! Шай-бу!»). В слоге имеется вершина — самый «звучный» звук (обычно гласный) — и края — согласные (которые, впрочем, могут и отсутствовать). Скорость смены слоговых вершин определяет темп речи. Слог можно разделить на отдельные звуки. У всех людей, владеющих звучащей речью, в языковую компетенцию входит понятие о том, какие гласные и согласные звуки возможны в его языке (другие звуки расцениваются либо как дефекты произношения, либо как иностранный акцент) и какие движения органов артикуляции должны им соответствовать (хотя реально в речи, особенно в беглой, эти движения зачастую смазываются).
Непросто устроены и сами звуки. Наш речевой тракт — природный резонатор, изменяя его форму при помощи движений языка, губ, нижней челюсти, нёбной занавески, надгортанника, мы ослабляем одни частоты и усиливаем другие. Такие области усиления частот получили название «форманты». Каждый гласный характеризуется своим собственным «узором» формант. Согласные тоже имеют свои частотные максимумы и минимумы, но распознаются в значительной степени по тому влиянию, которое они оказывают на форманты соседствующих с ними гласных. Например, после заднеязычного согласного (г или к) у последующего гласного сближаются начальные точки контуров второй и третьей формант. Если звуки в слоге поменять местами, человек услышит не слог, произнесенный наоборот, а бессмысленную абракадабру, поскольку привычные ему правила перехода от звука к звуку не будут соблюдены.
Рис. 1.8. Сонограммы (динамические спектрограммы) некоторых речевых звуков. Интенсивность цвета обозначает интенсивность звука56.
Рис. 1.9. Сонограммы слов кот и ток (поскольку слова были произнесены отдельно, на конце слышен — и виден на сонограмме — вокалический призвук). Если взять, например, слово кот, разделить его на части, соответствующие к, о и т и переставить их в обратном порядке, мы не услышим слова ток, поскольку переходы от звука к звуку окажутся неправильными: например, при переходе к гласному о надо уже с самого начала произнесения согласного вытягивать губы в трубочку, и это имеет вполне определенный акустический эффект57.
Формантные переходы между соседствующими звуками нередко позволяют нам «услышать» нужный звук даже в том случае, когда он не был реально произнесен, — и мы вполне можем не осознать, что вместо, скажем, Он — человек ответственный услышали …чек ответственный. В ходе исторического развития языка такой эффект восприятия дает почву для выпадения звуков, ср., например, франц. vie «жизнь» с лат. vīta (t между гласными сначала озвончилось в d, затем несколько ослабилось, и в конце концов, к XI в. выпало совсем58).
Существует несколько теорий для объяснения того, как люди распознают речевые звуки. Согласно одной, акустическое представление связано с представлением артикуляторным: для распознаваемого звука подбирается комбинация артикуляторных движений, которая могла бы его произвести, причем эти комбинации у разных людей могут различаться59. Так же, через подбор артикуляторных движений, осуществляется нередко распознавание зрительных образов слов: это отчетливо видно на примере людей малограмотных или читающих на плохо знакомом языке — во время чтения они заметно шевелят губами (а иногда даже тихонько проговаривают каждое слово). Но даже у грамотных людей при чтении про себя отмечается усиление биотоков в мышцах, связанных с произнесением речевых звуков60[6]. Как показали исследования основателя отечественной нейропсихологии Александра Романовича Лурии (в дальнейшем его результаты были подтверждены и дополнены), чем сложнее воспринимаемый текст, тем сильнее нарушается его понимание при искусственном затруднении артикуляции61. Согласно другой теории, в мозгу существуют акустические образы звуков речи — как должно выглядеть «прототипическое» а, как — б и т.д. Таких прототипов может быть более одного, поскольку в разном окружении звуки реализуются по-разному. Третья теория предполагает, что главную роль при распознавании речевых звуков играют имеющиеся в мозгу особые нейронные распознающие устройства — детекторы, — настроенные на отдельные смыслоразличительные признаки фонем. Поскольку каждая фонема обладает уникальным набором таких признаков, комбинация показаний детекторов определяет фонему однозначно. Вероятно, все эти теории в определенной мере справедливы и дополняют друг друга.
Анализатор речевых звуков работает у человека чрезвычайно быстро (быстрее, чем распознаются неречевые звуки) — до 20–30, а при искусственном ускорении речи — до 40–50 фонем в секунду62, поэтому вероятно, что минимальной единицей восприятия является не отдельная фонема, а слог целиком. Длительность типичного слога — примерно 250 миллисекунд — это как раз тот объем акустической информации, который человек может удерживать в так называемой «эхоической памяти» (т.е. помнить сразу после предъявления, пока еще не начался процесс распознавания). Показательно, что дети, начиная произносить свои первые похожие на речевые звуки, произносят их не по отдельности, а в составе слогов.
Уникально ли все это для человека? Ученые (среди них следует упомянуть в первую очередь психолога из университета Алабамы Джоан Синнотт) поставили огромное количество экспериментов, призванных выяснить, могут ли животные анализировать человеческую речь, и делают ли они это так, как мы, люди, или как-то иначе. Было показано, что крысы63 и воробьи64 способны отличать один язык от другого по общей мелодике речи, что песчанки (Meriones unguiculatus)65 могут отличить гласный [u] от гласного [i], а обезьяны и вовсе распознают все человеческие фонемы. Есть, разумеется, и отличия. Например, шиншиллы, перепела, волнистые попугайчики, макаки и люди в разных местах ставят «границы» между разными фонемами66 — если плавно менять характеристики звука, делая его всё менее похожим на одну фонему и всё более похожим на другую, момент, когда испытуемый начнет считать поступающий сигнал уже не первой фонемой, а второй, у разных видов наступает при разных значениях изменяемых параметров сигнала[7]. Животные не могут оперировать формантными переходами при различении согласных разного места образования67 (например, отличать da от ba по тому влиянию, который согласный оказывает на звук a) или при отличении слога типа stay от слога типа