Фонетический разбор слова для чего нужен: ? , . :: Textologia.ru

Содержание

Домашняя школа грамотности Екатерины Бунеевой — ЗАЧЕМ НУЖЕН ФОНЕТИЧЕСКИЙ РАЗБОР? На уроках русского языка и в домашних работах дети часто получают задание выполнить фонетический разбор слов. Делать этот разбор никто не любит, очень часто ни ребёнок, ни родители не понимают смысла этого задания. А между тем если его делать правильно, в нужное время и в нужном месте и при этом объяснить смысл этой работы, фонетический разбор будет очень полезен, прежде всего для развития орфографических умений. 1. Как правильно сделать фонетический разбор и оформить запись? Слово нужно разделить на слоги, поставить ударение, написать транскрипцию и дать характеристику каждого звука, указывая, какой буквой он обозначен в слове. В конце надо указать, сколько в слове букв и сколько звуков. Сделаем фонетический разбор слова «съешь». СЪЕШЬ – 1 слог, [cй’эш] Буква С обозначает звук [с] – согласный, твёрдый парный, глухой парный. Буква Ъ не обозначает звука. Буква Е обозначает два звука: [й’] – согласный звонкий непарный, мягкий непарный; [э] – гласный, ударный. Буква Ш обозначает звук [ш] – согласный, глухой парный, шипящий; твёрдый непарный. Буква Ь не обозначает звука. В слове 5 букв и 4 звука. 2. Как связать фонетический разбор с правописанием? Для фонетического разбора нужно выбирать слова, в которых не более двух слогов и есть актуальные орфограммы. Обязательно нужно понаблюдать и проанализировать вместе с ребёнком, где произношение не совпадает с написанием и почему слово пишется именно так. Как в этом случае проанализировать слово «съешь», которое мы только что разобрали? В слове «съешь» видим в транскрипции, что буква ш обозначает твёрдый согласный звук, но в слове после неё написан ь. Разбираемся почему. Здесь ь не обозначает мягкость согласного, более того – звук [ш] постоянно твёрдый. Буква ь указывает на форму 2-го лица глагола и стоит после буквы шипящего. А что разделяет разделительный ъ в этом слове? Он разделяет согласный звук [c] и звук [й’], этот звук мы видим в транскрипции и слышим, когда произносим слово.

С – приставка, со звука [й’] начинается корень слова, буква ъ написана в слове между приставкой и корнем. По окончании разбора в слове СЪЕШЬ нужно подчеркнуть обе орфограммы и графически обозначить условия их выбора. Именно такой анализ должен обязательно следовать за фонетическим разбором, тогда будут понятны цель и смысл этого вида разбора. Совершенно очевидно, что на одном уроке вполне достаточно выполнить фонетический разбор одного слова. 3. Нужно ли давать задания сделать буквенную запись на основе транскрипции? В некоторых учебниках (в наших тоже) предлагается задание повышенной трудности: прочитать транскрипцию слова и сделать буквенную запись. По сути это задание, обратное фонетическому разбору. Приведу пример. Даны слова в транскрипции: [уч’ица], [праз’н’ик], [крушк’и] (во всех словах ударение на первый слог). Ребёнок, читая транскрипцию, находит в словах орфограммы по их опознавательным признакам: в первом слове [ца] на конце глагола, во втором – стечение согласных [з’н’] в середине слова, в третьем – стечение глухих согласных [шк] в середине слова. Чтобы слова правильно записать, нужно применить соответствующие правила. Получается: учится, праздник, кружки. Такие задания даются для того, 1) чтобы дети наблюдали, что в русском языке написание не совпадает с произношением; 2) чтобы они учились находить в словах опасные места по опознавательным фонетическим признакам и 3) чтобы, найдя точки приложения орфографических правил, орфографически верно записывали слова, применяя правила. Понятно, что таким заданиям должна предшествовать серьёзная работа по фонетике и по орфографии. Если такая предварительная работа не проводилась, подобные задания способны вместо пользы принести вред: сработает зрительная память, и ребёнок может запомнить неверное написание. Автор: Екатерина Бунеева #Бунеева_родителям #Бунеева_коллегам

Домашняя школа грамотности Екатерины Бунеевой на Facebook. Если вам интересны новости Домашняя школа грамотности Екатерины Бунеевой, регистрируйтесь на Facebook сегодня!

Фонетический разбор слова: головная боль или важный навык? | Бегом в школу — клуб родителей

Раскладывать слова на звуки школьники начинают раньше, чем учить правила их написания.

Фонетика – не каждому понятно это слово и то, что оно в себе таит. Но как только ребенок идет в школу, практически каждый взрослый начинает учить этот раздел русского языка вместе со своим ребенком, порой не понимающим, зачем ему это надо и что со всем этим делать.

Что такое фонетический разбор слова?

Сегодняшние первоклашки, только переступившие порог школы, начинают активно постигать азы наук и, прежде всего, родного, любимого и могучего русского языка, который на протяжении 11 лет будет удивлять своей сложностью и многогранностью. Фонетика является неотъемлемой частью русского языка. Это наука о звуках и произношении слов. Дети начинают знакомство с фонетикой с отображения звуков с помощью букв, то есть в транскрипции.

Многие родители с первых же дней учебы ребенка вынуждены вырезать из картона квадратики с черточками и кружочки с ударением или без. Вот с этих геометрических фигур и начинается фонетический разбор слова. Педагоги начинают объяснять отличие букв от звуков, что, например, согласные бывают глухими и звонкими, мягкими или твердыми, парными и непарными, а гласные – ударными и безударными.

Еще до освоения написания строчных букв с помощью квадратиков и кружочков дети складывают транскрипции элементарных слов, а потом по прошествии некоторого времени уже пишут их в тетради:

юла — [й’ула], мороз — [марос], енот — [й’энот].

Проблема заключается даже не в том, что звуковой разбор получается не у всех и не всегда, а в том, что большинство русских слов произносится совсем не так, как пишется. И ребенок старательно выводит «карова» еще до того, как узнает, что писать это слово нужно с буквой «о». Как правило, ничего хорошего из такого смещения понятий не получается, грамотность хромает, в родителях зарождается неприязнь к фонетике, обсуждение ее бессмысленности и даже непреодолимое желание устроить революцию в системе образования. Ведь их учили иначе, и раскладывать слова на звуки еще до изучения простейших правил не заставляли.

Фонетически разбор – важная и нужная вещь…

Фонетика, а следовательно и фонетический разбор слова, достаточно легко осваивается детьми, потому что правила, лежащие в его основе, достаточно просто выучить наизусть, а не пытаться их понять. Да простят меня учителя русского языка.

Например, чтобы разделить слово на слоги необходимо всего лишь знать сколько в нем гласных букв, а чтобы отличить глухой или звонкий согласный хватит зазубрить одну лишь фразу, которая содержит в себе все глухие звуки русского языка. Школьникам 90-ых годов, а я отношусь к их числу, педагоги как раз эту фразу и давали в помощь, а вот сейчас о ее существовании почему-то чаще всего замалчивают. Видимо не хотят, как модно сегодня говорить в школах, оказывать детям «медвежью услугу». По мне это только облегчит понимание. Вот это чудо-фраза, делюсь:

ФоКа, Ты ХоЧеШь ПоеСТь Щец?

Буквы, в нее не вошедшие, считаются звонкими.

Итак, нужен ли фонетический разбор детям? Педагоги – только «за», видя в нем следующие преимущества:

  • он помогает в раннем возрасте понять, что не все слова в русском языке пишутся так, как произносятся;
  • от 85 до 90% правил правописания слов основано на фонематическом принципе, то есть умение правильно слышать слово и каждый его звук облегчает выявление орфограммы, а следовательно заставляет подобрать проверочное слово и правильно его написать. Другими словами, именно на умении правильно слышать основывается правильная письменная речь;
  • азы фонетического разбора, которые даются в школе, могут в будущем облегчить участь при получении высшего образования, особенно это касается ВУЗов филологической направленности. Вот там действительно дебри – утверждаю это, как очевидец, на чью участь выпал этот нелегкий процесс.

… или головная боль и бессмысленная трата времени?

Ну вот, теперь дошла очередь и до минусов фонетического разбора, которые выделяет другая сторона образовательного процесса – родители. Сейчас все выстроятся в очередь и наперебой будут подсказывать:

  • фонетический разбор сложно понять и сделать многим взрослым. В связи с этим они копаются в дебрях интернета или учебных пособий, чтобы хоть как-то объяснить правила разбора своим детям. Отсюда и головная боль, как в прямом, так и в переносном смысле;
  • он вводит некоторых детей в заблуждение, и они начинают при написании слов путать буквы со звуками;
  • дети приносят плохие оценки, потому что не могут понять, что некоторые буквы в определенных моментах могут давать по два звука или на слух отличить глухой согласный от звонкого;
  • и главное – родители не понимают, зачем необходимо изучать фонетику, делать фонетический разбор, и как это может пригодиться в будущем.

А как вы относитесь к фонетическому разбору слов в младшей школе?

Зачем нужен фонетический разбор слов | НЕлингвист

Учителя русского языка наверное меня закидают тапками.

Не имею ничего против фонетики и фонетического разбора в общем, особенно когда этим занимаются в ВУЗах.

НО!

У меня большой вопрос, зачем это нужно в начальной школе?

К слову, я не помню, чтобы это было во времена моей учёбы в школе. Я даже поискала на просторах интернета оглавления учебников конца 70-х — начала 80-х. Я там не нашла фонетического разбора в таком виде, как это делается сейчас. Мы делили на слоги, ставили ударения, умели отличать звонкие от глухих, твёрдые от мягких и всё. И это не мешает мне писать правильно. А вот с грамотным письмом у современной молодёжи проблем куча. Откуда, например, вдруг взялись слова»типО», «ужОс» и т.п. Только не надо говорить, что это мемы. Масса молодых людей считает, что так правильно.

Когда моя дочь, учась в началке, начала выполнять задания, где надо было написать транскрипцию слов, я была сильно удивлена. Зачем? Я понимаю, когда это нужно при изучении иностранного языка. Но тут — не понимаю. Причём параллельно дети начинают уже изучать словарные слова. То есть, одновременно ребёнку надо выучить, что слово «мороз» пишется через «О» и оканчивается на «З», но при этом, делая фонетический разбор, ребёнок должен не забыть написать «А» вместо «О» и «С» вместо «З»: [марос]. Зачем закреплять визуально и механически то, что мы не должны воспроизводить на письме? Чтобы ребёнок больше путался?

Зато с фонетической точки зрения всё правильно.

А ещё нужно посчитать звуки и буквы. И тут появляется ещё одна сложность. Оказывается нет звуков [я], [ю], [е], [ё]. То есть мы не говорим [яблоко], мы говорим [й‘аблако]. Это может иностранцу, у которого в родном языке нет звука [я], так будет понятнее, но не носителю языка в семилетнем возрасте. Результатом этих разборов являются такие варианты написания слов, как «поздравляйю«. То есть ребёнок знает, что там «ю», но «й» тоже на всякий случай вставил.

По мне так половина вариантов «транскрипции» просто притянута за уши к правилам.

В общем вредительство это, на мой взгляд. Это те самые лишние знания, которые забивают и так переполненные информацией головы наших детей. А ведь кто-то наверное по итогам составления этой программы докторскую защитил…

Не забывайте подписаться на канал и поставить «палец вверх» 😉

Как делать звуко-буквенный разбор слова?

Звуко-буквенный раз­бор сло­ва — это харак­те­ри­сти­ка зву­ко­во­го и бук­вен­но­го соста­ва сло­ва. Чтобы  его выпол­нить, пишет­ся тран­скрип­ция — точ­ная запись зву­ко­во­го соста­ва слова.

Определение

Звуко-буквенный раз­бор — это ана­лиз зву­ко­во­го соста­ва сло­ва и его бук­вен­но­го отоб­ра­же­ния на письме.

Звуко-буквенный раз­бор сло­ва необ­хо­дим для осо­знан­но­го овла­де­ния рус­ским язы­ком, гра­мот­но­го напи­са­ния слов, осо­бен­но в тех слу­ча­ях, когда в сло­вах есть без­удар­ные глас­ные, непро­из­но­си­мые соглас­ные, бук­вы, обо­зна­ча­ю­щие два зву­ка, бук­вы, не обо­зна­ча­ю­щие зву­ков и пр.

Фонетический раз­бор выпол­ня­ет­ся в несколь­ко эта­пов.  Звуко-буквенный раз­бор пред­по­ла­га­ет деле­ние сло­ва на сло­ги в соот­вет­ствии с коли­че­ством глас­ных зву­ков, поста­нов­ку уда­ре­ния, запись зву­ча­ния сло­ва. Затем про­во­дит­ся фоне­ти­че­ский ана­лиз каж­до­го зву­ка. Фонетический раз­бор завер­ша­ет­ся под­сче­том коли­че­ства букв и звуков.

Буквы и звуки

Чтобы пра­виль­но выпол­нить звуко-буквенный раз­бор сло­ва, научим­ся раз­ли­чать, что на бума­ге мы видим бук­вы, а когда про­из­но­сим сло­во, то слы­шим зву­ки. Буквы — это гра­фи­че­ские зна­ки, с помо­щью кото­рых мож­но обо­зна­чить зву­ки речи.

В рус­ском язы­ке раз­ли­ча­ют глас­ные и соглас­ные звуки.

Гласные буквы и звуки

Гласные зву­ки обра­зу­ют­ся при сво­бод­ном про­хож­де­нии воз­ду­ха изо рта. Они состо­ят толь­ко из голо­са. В рус­ском язы­ке имеются

6 глас­ных зву­ков: [а], [о], [у], [э], [и], [ы]

и

10 глас­ных букв: а, о, у, э, и, ы, я, е, ё, ю, я

Гласные зву­ки [а], [о], [у], [э], [ы] зву­чат после твер­дых соглас­ных зву­ков, а бук­вы «и», «е», «ё», «ю», «я» и «ь» обо­зна­ча­ют, что преды­ду­щий соглас­ный звук явля­ет­ся мяг­ким. Эта фоне­ти­че­ская мяг­кость обо­зна­ча­ет­ся спе­ци­аль­ным знач­ком — апо­стро­фом:

  • лён [л’ о н]
  • редис [р’ и д’ и с]
  • соль [с о л’]

Для выпол­не­ния звуко-буквенного раз­бо­ра сле­ду­ет поста­вить в сло­ве ударение.

Под уда­ре­ни­ем глас­ные зву­ки зву­чат отчет­ли­во, а без уда­ре­ния они искажаются:

  •  бук­ва «о» обо­зна­ча­ет звук [а];

до́мик [д о м’ и к], окно́ [а к н о]

  • после соглас­ных бук­вы «е», «я» без уда­ре­ния соот­вет­ству­ет зву­ку [и]

cте­на́ [с т’ и н а] , ряби́на [р’ и б’ и н а]

Каждый глас­ный звук в оди­ноч­ку или в соче­та­нии с одним или с несколь­ки­ми соглас­ны­ми соглас­ны­ми обра­зу­ет фоне­ти­че­ский слог:

  • бо-ло-то
  • кра-со-та
  • у-ди-ви-тель-ный
  • ли-ни-я

Согласные буквы и звуки

В рус­ской речи зву­чат 36 соглас­ных зву­ков. При их про­из­но­ше­нии выды­ха­е­мый воз­дух трет­ся об губы, язык и щеки, в резуль­та­те чего воз­ни­ка­ет шум.

Всегда звон­кие соглас­ные [л], [м], [н], [р] про­из­но­сят­ся с уча­сти­ем голо­са и мини­маль­ным шумом.

Если соглас­ные зву­ки про­из­но­сят­ся с бо́льшей долей голо­са и шума, то обра­зу­ют­ся звон­кие согласные:

[б], [в], [г], [д], [ж], [з]

Каждому звон­ко­му соглас­но­му соот­вет­ству­ет пар­ный глу­хой соглас­ный, кото­рый про­из­но­сит­ся с боль­шей долей шума, чем голоса:

  • [б] — [п];
  • [в] — [ф];
  • [г] — [ к];
  • [д] — [т];
  • [ж] — [ш];
  • [з] — [с].

Буквы «х», «ц», «ч», «щ» обо­зна­ча­ют глу­хие соглас­ные [х], [ц], [ч’], [щ’], у кото­рых нет пар­ных звон­ких согласных.

Согласные зву­ки быва­ют твер­дые и мягкие:

[б] — [б’], [в] — [в’], [г] — [г’], [д] — [д’], [з] — [з’], [к] — [к’], [л] — [л’], [м] — [м’], [н] — [н’], [п] — [п’], [р] — [р’], [с] — [с’], [т] — [т’], [ф] — [ф’], [х] — [х’]

Выполняя звуко-буквенный ана­лиз, учи­ты­ва­ем, что бук­вы «й», «ч» и «щ» обо­зна­ча­ют все­гда мяг­кие зву­ки [й’], [ч’], [щ’],

а бук­вы «ж», «ш», «ц» —  твер­дые зву­ки [ж], [ш], [ц].

Как научиться делать звуко-буквенный разбор

Для того, что­бы научить­ся делать звуко-буквенный раз­бор сло­ва, важ­но пони­мать, что часто орфо­гра­фи­че­ская запись сло­ва и его зву­ча­ние не сов­па­да­ют. В сло­ве может быть:

  • оди­на­ко­вое коли­че­ство звуков;
  • зву­ков боль­ше, чем букв;
  • букв боль­ше, чем звуков.

Примеры

  • не́бо [н’ э б а] — 4 бук­вы, 4 звука
  • ярлы́к [й ‘а р л ы к] — 5 букв, 6 звуков
  • купа́ть [к у п а т’] — 6 букв, 5 звуков

При запи­си зву­ко­во­го соста­ва сло­ва сле­ду­ет учи­ты­вать, что бук­вы «е», «ё», «ю», «я» могут обо­зна­чать два зву­ка в сле­ду­ю­щих пози­ци­ях в слове:

1. в нача­ле слова:

  • е́дкий [й’ э т к’и й’]
  • ёмкий [й’ о м к’ и й’]
  • ю́ный [й’ у н ы й’]
  • я́сли [й’ а с’ л’ и]

2. после дру­гих глас­ных звуков:

  • поезди́ть [п а й’ э з’ д’ и т’]
  • поём [п а й’ о м]
  • каю́та [к а й’ у т а]
  • мая́к [м а й’ а к]

3. после раз­де­ли­тель­ных «ь» и «ъ»:

  • жюлье́н [ж у л’ й’ э’ н]
  • въе́хать [в й ‘э х а т’]
  • курьёз [к у р’ й’ о с]
  • отъём [а т й’ о м]
  • рья́ный [р’ й’ а н ы й’]
  • изъя́н [и з’ й’ а н]
  • вью́нок [в’ й’ у н о к]
  • предъюбиле́йный [п р’ и д  й’ у б’ и л’ э й’ н ы й’]

Как видим, в таких сло­вах все­гда боль­ше зву­ков, чем букв.

После соглас­ных зву­ков бук­вы «е», «ё», «ю», «я» обо­зна­ча­ют их мягкость:

  • сел [с’ э л]
  • нёс [н’ о с]
  • люк [л’ у к]
  • пять [п’ а т’]

Записывая зву­ча­ние сло­ва, сле­ду­ет учи­ты­вать, что в рус­ском язы­ке про­ис­хо­дит фоне­ти­че­ский про­цесс оглу­ше­ния звон­ких соглас­ных, нахо­дя­щих­ся перед глу­хим соглас­ным и в кон­це сло­ва, и, наобо­рот, озвон­че­ния глу­хих соглас­ных перед звон­ким соглас­ным, кро­ме «л», «м», «н», «р», «в», «й»

  • ло́жка [ло ш к а], ви́тязь [в’ и т’a с’], о́тблеск [о д б л’ и с к];
  • сма́зка [с м а с к а], дробь [д р о п’], сдви́нуть [з д в’ и н у т’];
  • все [ф с’ э], пруд [п р у т], вокза́л [в а г з а л].

В сло­вах с бук­во­со­че­та­ни­ем «зж» слы­шит­ся длин­ный мяг­кий звук [ж’]:

  • брюзжа́ть [б р’ у ж’ а т’]
  • мозжечо́к [м а ж’ и ч’ о к]

В кон­це гла­го­лов бук­во­со­че­та­ния -тся и -ться зву­чат как [ца]:

  • бои́тся [б а и ц а];
  • стели́ться [с’ т’ и л и ц а].

В сло­вах, в кото­рых есть «ь», кото­рый обо­зна­ча­ет мяг­кость преды­ду­ще­го соглас­но­го зву­ка или явля­ет­ся мор­фо­ло­ги­че­ским зна­ком, ука­зы­ва­ю­щим на при­над­леж­ность сло­ва к жен­ско­му роду, букв насчи­ты­ва­ем боль­ше, а зву­ков меньше:

  • знать [з н а т’] — 5 букв, 4 звука;
  • речь [р ‘э ч’] — 4 бук­вы, 3 звука.

Мягкие соглас­ные зву­ки могут смяг­чать преды­ду­щий соглас­ный звук.

Послушаем, как зву­чат слова:

  • све́чка [с’ в’ э ч’ к а]
  • гво́зди [г во з’ д’ и]
  • жизнь [ж ы з’ н’]
  • зо́нтик [з о н’ т’ и к]

Образец фонетического разбора

Источник изоб­ра­же­ния: fedsp.com

Пример звуко-буквенного разбора

Чтобы выпол­нить звуко-буквенный раз­бор, запи­шем сло­во и поста­вим в нем уда­ре­ние. Разделим его на фоне­ти­че­ские сло­ги. Учитывая все фоне­ти­че­ские изме­не­ния в сло­ве, запи­шем по вер­ти­ка­ли бук­вы и соот­вет­ству­ю­щие им зву­ки сло­ва в квад­рат­ных скоб­ках. Дадим фоне­ти­че­скую харак­те­ри­сти­ку каж­до­му звуку.

Например, выпол­ним фоне­ти­че­ский раз­бор сло­ва «ёлоч­ный»:

ёлоч­ный  [й’ о л а ч’ н ы й’]

ё-ло-чный  — 3 сло­га. Первый слог ударный.

  • бук­ва «ё» — [й’] — соглас­ный, звон­кий непар­ный, мяг­кий непарный;
  • [о] — глас­ный ударный;
  • бук­ва «л» — [л] — соглас­ный звон­кий непар­ный, твер­дый парный;
  • бук­ва «о» — [а] — глас­ный безударный;
  • бук­ва «ч» — [ч’] — соглас­ный, глу­хой непар­ный, мяг­кий непарный;
  • бук­ва «н»- [н] — соглас­ный звон­кий непар­ный, твер­дый парный;
  • бук­ва «ы» — [ы] — глас­ный безударный;
  • бук­ва «й» — [й’] — соглас­ный, звон­кий непар­ный, мяг­кий непарный.

В сло­ве «ёлоч­ный» 7 букв, 8 звуков.

Дополнительный мате­ри­ал

Если у вас воз­ник­нут труд­но­сти при про­ве­де­нии звуко-буквенного (фоне­ти­че­ско­го) раз­бо­ра сло­ва, то все­гда мож­но про­ве­рить себя на сай­те phoneticonline.ru.

Видеоурок «Фонетический разбор слов»

Для закреп­ле­ния мате­ри­а­ла посмот­ри­те видео по теме урока.

Скачать ста­тью: PDF

Статья «Фонетический разбор слова на уроках русского языка в начальных классах»

Вопрос о звуковом анализе – один из сложнейших в начальных классах. Впервые вопрос о предварительных звуковых упражнениях в русской методике (методике обучения чтению) был поставлен Ушинским К. Д..

Основоположник звукового метода в России считал необходимым развивать речевой слух у детей, умение слышать отдельные звуки и их последовательность в словах.

Фонетический разбор — основной вид упражнений, который развивает фонетические способности учащихся.

По мнению Д.Б. Эльконина, фонемный (звуковой) анализ в своей исходной форме есть установление последовательности фонем (звуков) в полном слове [ Эльконин Д.Б. -1976. – С.48] .

В методике различают собственно фонетический (звуковой) и фонетикографический (звукобуквенный).

Цель собственно звукового разбора – это характеристика звуковой структуры слова без обращения к буквам. Собственно звуковой разбор учащиеся выполняют в подготовительный период обучения грамоте. При переходе к изучению букв, как показывает практика преподавания, звуковой разбор полностью исключается из употребления.

Мы думаем, что звуковой разбор может использоваться на всём протяжении обучению языку в младших классах и даже применяться как особый вид фонетических упражнений в последующем обучении.

Во-первых, этот вид фонетического анализа убеждает, что со звуками можно работать и без букв, а это очень важно, чтобы освободить школьника от переоценки роли буквы.

Во-вторых, способы осознанного звукового анализа, сформированные без опоры на буквы, воспитывают у ученика отношение к материи языка как некой

реальности, с которой можно производить свои особые действия и которая предполагает специфические средства контроля за выполнением этих действий.

Рассмотрим и проанализируем программы и учебники по русскому языку разных образовательных систем.

Анализ программы Т.Г.Рамзаевой (образовательная система “Классическая начальная школа”) показывает, что выдвигаются такие требования к умениям учащихся: производить анализ делением слов на слоги, определять ударный слог, последовательность звуков и букв в словах типа конь, сова, стриж (2 класс).

В 4 классе программа предлагает проводить звукобуквенный анализ систематически в целях формирования навыков безошибочного написания слов и развития орфографических умений. Для анализа взяты слова типа лодка, школьный, площадь.

В учебнике Рамзаевой Т.Г. для 3 класса предлагается порядок звукобуквенного разбора слов на форзаце:

1. Напиши слово, поставь знак ударения.

2. Определи, сколько слогов в слове.

3. Сколько гласных букв и сколько согласных?

4. Какой звук обозначает согласные буквы: звонкий или глухой, мягкий или твердый.

Образец записи:

Льдинка – 2 слога, 6 звуков, 7 букв; 2 гласных, 4 согласных, [л ] — звонкий, мягкий; [д ]– звонкий, мягкий; [н ] — звонкий, твердый; [к ]– глухой, твердый.

Как видим, под фонетическим разбором понимается звукобуквенный анализ.

Составители учебника Русский язык 2. класс Бунеев Р.Н., Бунеева Е.В., Пронина О.В. предлагают такой порядок звукобуквенного анализа слова:

1. Прочитай слово, поставь ударение.

2. Раздели слово на слоги.

3. Прочитай ударный слог.

4. Прочитай безударные слоги.

5. Назови звуки, какими буквами они обозначены.

6. Дай характеристику звуков.

7. Сосчитай, сколько в слове звуков, сколько букв.

В данной системе обучения “Школа 2100” по программе Бунеевых Р.Н. и Е.В. в период обучения грамоте дети учатся произносить звуки, слушать звучащее слово, соотносить произношение и написание, делать звукобуквенный анализ доступных слов.

Основные требования к умениям второклассников: производить звукобуквенный анализ слов и соотносить количество звуков и букв в доступных словах.

Таким образом, в данной программе под фонетическим разбором понимается звукобуквенный [Программно-методические материалы. 2000. С.37, 44, 215, 227, 231, 236].

В учебниках Поляковой A.B. по русскому языку (система развивающего обучения Л.В.Занкова) порядок разбора не предлагается, хотя раздел “Фонетика” представлен с 1 по 4 классы.

В программе по развивающей системе Л.В. Занкова в основных требованиях к знаниям, умениям, навыкам за 1 класс написано, что учащиеся должны уметь:

• производить фонетический разбор: вычленять звуки в словах, определять последовательность звуков и букв в слове, соотносить количество звуков и букв в словах, делить слова на слоги, определять количество слогов и ударный слог;

• различать твердые и мягкие согласные;

• обозначать на письме мягкость согласных звуков буквами и, е, ё, ю, я и мягким знаком и различать эти способы обозначения мягкости согласных: с одной стороны, буквами, которые обозначают звуки, с другой — мягким знаком, который никакого звука не обозначает;

• различать звонкие и глухие согласные звуки [Сборник программ для четырехлетней начальной школы. Система Л.В. Занкова.; 2005. С.49].

В соответствии с действующей сейчас вариативной программой по русскому языку в системе Л.В.Занкова фонетические знания также являются ведущими в букварный период. Это вполне справедливо, так как они лежат в основе обучения детей важнейшим общеучебным умениям — чтению и письму.

В первый месяц обучения по букварю [Андрианова Т.М., Андрианова И.Л., 2003] на фоне знаний о речи, предложений, слове проводятся наблюдения позиционной смены звуков. Ученики, сопоставляя слова, слышат разницу в произношении гласных и согласных, составляют двуцветные схемы (гласные — красный цвет, согласные — бесцветные).

Затем также при сопоставлении слов (мал – мял, Маша — Миша) устанавливается разница в произношении твердых — мягких согласных. Делается вывод о том, что для правильного чтения согласного необходимо посмотреть, какой гласный следует за ним, составляются трехцветные схемы: (мягкий согласный — зеленый цвет, твёрдый согласный синий цвет, гласный — красный цвет).

Далее проводится сопоставление слов, раскрывающих явление глухости — звонкости: папа - баба.

Итак, на первом этапе обучения чтению по развивающей программе Занкова звуковой анализ превалирует над самой процедурой чтения.

В данный период ученики проводят звуковой разбор слов, наблюдают над звуками на коротких, простых по составу словах.

В системе развивающего обучения Л.В. Занкова работа над звуковым анализом ведется в основном в букварный период, а затем она проводится над звуком и буквой параллельно. Во 2, 3, 4 классах работа над собственно звуковым анализом не планируется, а в основном идет звукобуквенный разбор слов.

Как показывает школьная практика, собственно звуковому разбору на уроках уделяется недостаточно времени. Поэтому нами была разработана программа, направленная на формирование умений собственно звукового разбора слов и состоящая из блоков: 1 блок – “Звуки”, 2 блок – “Слоги”, 3 блок – “Ударение”.

Работа имела системный характер: начиналась в букварный период в первом классе и была продолжена во втором классе. Применение дидактических игр как одного из наиболее продуктивных средств обучения позволило, во-первых, учить детей без принуждения. Во-вторых, игра помогала, наряду с формированием и развитием фонематического восприятия, организовать учебную деятельность ребенка, обогащала его новыми сведениями по фонетике, активизировала мыслительную деятельность, внимание, развивала речь. В-третьих, игра применялась в различных вариантах (иногда использовался только фрагмент игры), при этом обновлялся учебный материал, включался в нее материал разноуровневого характера.

В первом блоке работа велась над гласными и согласными звуками.

Первоначальная работа (1 этап) проводилась с опорой на вспомогательные средства: графическую схему слова и фишки ( — гласный звук, — мягкий согласный звук, — твердый согласный звук).

По мере выделения звуков ребенок заполняет схему фишками. Действие, которое осуществлял ученик, представляло собой практическое действие по моделированию последовательности звуков в слове.

На 2 этапе формировались действия звукового разбора в речевом плане. Называлось слово, определялся первый, второй, третий звуки, уточнялось их количество, давалась характеристика звукам.

Второй блок – деление слова на слоги – не вызывал у учащихся трудностей, если слоги были открытыми. Формировались умения деления слов на слоги с неслоговым [й’]. Проводились наблюдения правил слогораздела (до-брый, у-до-бный).

В третьем блоке у учащихся формировалось представление о словесном ударении и его роли в русском языке. Дети учились находить и выделять в словах ударный слог.

Цели программы: развитие фонематического слуха ребенка, формирование умения сознательно выполнять собственно звуковой разбор слова, развитие памяти, внимания, наблюдательности.

С целью отслеживания эффективности данной программы проводился эксперимент. В эксперименте участвовали два класса (1 “А”, 1 “Б” (контрольный класс), [2”А”, 2”Б”]).

В 1 “А”, [2 “А”] классе с первого года обучения велась систематическая работа над звуковым разбором по разработанной нами программе. В 1 “Б”, [2 “Б”] обучение велось только в рамках учебной программы.

Первая диагностика была проведена в марте 2007 года в 1 “А” и 1 “Б” классах. Учащимся предлагалось провести звуковой разбор слов по вариантам.

1 вариант: пила, карась, стул, малина.

2 вариант: грибы, шарик, лиса, природа.

Слова состояли из одного, двух, трех слогов.

Задание: разделить данные слова на слоги, определить ударный слог, записать звуковую “рубашку” слова.

Были получены следующие результаты (см. таблицу 1):

Таблица 1

Анализ элементов звукового разбора слова в 1 “А” и 1 “Б” классах

Класс

Гласные

Ударные гласные

Безударные гласные

Твердые согласные

Мягкие согласные

Слоги

ударение

1 “А”

100%

91,3%

65,2%

91,3%

78,2%

82,6%

91,3%

1 “Б”

72,2%

66,6%

72,2%

83,3%

44,4%

83,3%

52,2%

Выводы: Наибольшие трудности учащиеся 1”А” класса испытывали при определении безударных гласных в слове (65,2%), ошибки были допущены в определении мягких согласных в слове (78,2%).

Учащиеся 1 “Б” класса допустили наибольшее количество ошибок при определении мягких согласных (44,4%), также много ошибок было в постановке ударения (52,2%).

Учащиеся 1 “А” класса лучше справились с заданиями при определении гласных звуков в слове, постановке ударения в словах, в нахождении мягких согласных.

Учащиеся 1 “Б” класса показали лучше результаты в нахождении безударных гласных, в делении слов на слоги.

Таким образом, в 1 “А” классе 73,9% учащихся выполнили задания без ошибок. 26% учащихся выполнили задания с ошибками.

В 1 “Б” классе только 27,7% учащихся выполнили задания без ошибок. 72,2% учащихся допустили ошибки при выполнении данной работы.

Проведенный нами констатирующий срез в двух первых классах показал, что осознанные умения звукового разбора слов у учащихся не сформированы.

В результате проведенного исследования перед нами возникла необходимость в выявлении эффективных методических приемов и разработке системы упражнений с целью ликвидации допущенных детьми ошибок.

Проанализировав методическую литературу и обобщив опыт, мы разработали систему упражнений по проблеме исследования, в которых за основу взяли приемы и упражнения, предлагаемые в учебниках и методических пособиях развивающих систем Д.Б. Эльконина, Л.В. Занкова, по которой занимаются дети, а также упражнения из методического пособия Максимук Н.Н., журналов “Начальная школа”, собственные методические находки с целью формирования фонетических умений.

Во 2 “А” классе (экспериментальном) мы продолжили целенаправленную работу над формированием фонетических умений.

Работу организовали более глубоко и разнообразно, задания постепенно усложнялись, проводились дидактические игры.

В конце октября 2007 года была проведена повторная диагностика во 2 “А” и 2 “Б” классах. Учащимся предлагалось провести звуковой разбор слов по вариантам.

1 вариант: Рая, пеньки, пушистый.

2 вариант: Яша, письмо, душистый.

Слова состояли из двух, трех слогов.

Задание: послушай слово, запиши звуковую “рубашку” слова, раздели слово на слоги, определи ударный слог, подчеркни мягкие согласные двумя чертами, твердые согласные одной чертой.

Были получены следующие результаты: (см. таблицу 2)

Таблица 2.

Анализ элементов звукового разбора слова во 2 “А” и 2 “Б” классах

Класс

Гласные

Ударные гласные

Безударные гласные

Твердые согласные

Мягкие согласные

Слоги

ударение

2 “А”

95,4%

95,4%

86,3%

81,8%

86,3%

100%

95,4%

2 “Б”

56,2%

56,2%

56,2%

12,5%

12,5%

68,7%

62,5%

Выводы: во 2 “А” классе (экспериментальном) дети испытывали трудности в определении твердых и мягких согласных.

Во 2 “Б” классе (контрольном) также низкие показатели в определении твердых и мягких согласных.

Во 2 “Б” классе (контрольном) также низкие показатели в определении твердых и мягких согласных.

справились, не справились

Рис.3. Качество выполнения звукового разбора слов во 2 “А” и 2 “Б” классах

Во 2 “А” классе 81,8% учащихся выполнили задания без ошибок, а 18,2% учащихся допустили ошибки.

Во 2 “Б” классе (контрольном) только 12,5% учащихся выполнили задания без ошибок, 87,5% учащихся выполнили задания с ошибками.

Качество выполнения звукового разбора слов во вторых классах показало, что ученики 2 “А” класса (экспериментального) на 69,3% лучше справились с данной работой.

Из всего вышесказанного сделали вывод, что с помощью использованных нами методических приемов и упражнений, мы смогли ликвидировать ранее допущенные ошибки у большинства учащихся, дети показали хорошие результаты при проведении звукового разбора слов.

Основное условие для занятий по звуковому разбору – систематичность, она необходима на протяжении всего периода школьного обучения. Звуковая культура речи является составной частью речевой культуры, требует особого подхода, специальных приёмов.

Советы учителя — Звуко-буквенный (фонетический) разбор слова, учитель начальных классов в Москве

Фонетика — раздел науки о языке, изучающий звуковые средства. Фонетические знания и умения необходимы для формирования всех четырех видов речевой деятельности человека: слушания (аудирования) говорения, чтения и письма. 

Для того чтобы адекватно воспринимать слышимую речь, нужно иметь развитый фонематический слух, благодаря которому мы различаем слова по их звучанию, фонетические способности помогают нам по интонации улавливать смысл, который говорящий вкладывает в высказывание. Поскольку русское письмо звуко-буквенное, читающий оперирует в процессе чтения звуками. Отсюда требование: исходным пунктом в обучении чтению должна стать ориентировка в звуковой действительности языка. В настоящее время обучение грамоте по любому букварю начинается с до буквенного периода, когда учащиеся на практике осваивают фонетику.

Фонетические знания и умения важны для всего последующего обучения чтению и письму. Например, такое качество чтения, как выразительность, нельзя сформировать, не познакомив учащихся с интонацией, логическим ударением. Фонетические умения — необходимая база для становления осознанных навыков правописания, без них нельзя сформировать орфографическую зоркость учащихся.

На фонетику мы опираемся и при обучении лексики, грамматике, морфемике.

Выполняя фонетический разбор в школе, ученик должен уметь выделять гласные и согласные звуки, соотносить их с буквами.

  1. Буквы – это графические знаки, с помощью которых на письме обозначаются звуки. Полного соответствия между звуками и буквами нет.
  2. Гласные звуки
    В русском алфавите всего 33 буквы.
    Две из них — Ь и Ъ не относятся ни к гласным, ни к согласным буквам, звуков не обозначают.
    Гласные буквы: бывают ударными или безударными, образуют слоги. Сколько в слове гласных звуков, столько и слогов.
    Гласных букв 10: а, о, у, э, ы, я, ё, ю, е, и.
    Гласных звуков 6: [а], [о], [у], [э], [и], [ы].
    А, О, У, Э, Ы – обозначают твёрдость согласных звуков.
    Я, Ё, Ю, Е, И – обозначают мягкость согласных звуков.
  3. Йотированные гласные буквы (буквы, обозначающие два звука). Обозначают два звука, если стоят:
    Я — [jа] Ю- [jу] Е – [jэ] Ё – [jо]
    * в начале слова (ель, яблоко, юла)
    * после Ъ и Ь (съем, семья, подъём, вьюн)
    * после гласных букв (клюёт, воют, военный)
    Буквы е, я, ю, ё обозначают один звук [э], [а], [у], [о] после согласного только под ударением: век — [в’эк], мяч- [м’ач’], блюз — [бл’ус], мед — [м’от]
    В безударном положении эти буквы после согласного обозначают звук [иэ]
    ряды [р’ и д ы] лесок [л’ и с о к]
  4. Согласные звуки
    Согласных букв 21: н, м, л, р, й, б, в, г, д, ж з, п, ф, к, т, ш, с, х, ц, ч, щ.
    Согласных звуков в русском языке – 36.
  5. Согласные звуки образуют 6 пар звонких и глухих согласных:
  6. [б] — [п], [в] — [ф],[г] — [к], [д] — [т], [ж] — [ш], [з] — [с].
  7. Кроме того, согласные звуки образуют 15 пар твёрдых и мягких согласных:
  8. [б] -[б’], [в] — [в’], [г] — [г’], [д] -[д’], [з] — [з’], [к] — [к’],[л] — [л’],[м] — [м’],
  9. [н] — [н’],[п] — [п’], [р] — [р’], [с] — [c’], [т] — [т’],[ф] — [ф’], [х] — [х’].
  10. Сонорные звуки: [л], [м], [н], [р], [й].
  11. Пять непарных глухих звуков: [х], [х’] [ц], [ч’], [щ’].
    Всегда твёрдые согласные звуки: [ж], [ш], [ц].
    Всегда мягкие согласные звуки: [ч’], [щ’], [й’].

План фонетического разбора

1. Запишем слово.

2. Поставим ударение.

3. Запишем справа транскрипцию слова, разделим его на слоги.

4. Охарактеризуем все звуки, записывая их сверху вниз:

4.1. ударный-безударный для гласных;

4.2. звонкий-глухой (пара), твёрдый-мягкий (пара) для согласных;

5. Подсчитаем количество звуков и букв

Образец:

морковь мор-кóвь 2 слога

м – [м] — согл., сонорн. непарн., тв. парн.

о – [а] — гласн., безуд.

р – [р] — согл., сонорн. непарн., тв. парн.

к – [к] — согл., глух. парн., тв. парн.

о – [о] — гласн., ударн.

в – [ф’] — согл., глух. парн., мягк. парн.

ь – [ ]

___________________________

7 букв, 6 звуков

Орфограмма — это место в слове:

  1. где пишется не так, как слышится;
  2. где звук слышится неясно;
  3. где возможна ошибка;
  4. где при письме возникает трудность;
  5. где требуется применение правила;
  6. где для обозначения определенного звука нужно выбрать букву.

«Брюки» фонетический разбор | Грамота

Если вам стал нужен звуко-буквенный разбор слова «брюки», то обязательно вы будете составлять его транскрипцию и разбирать отдельно каждый звук и букву. В этом и будет заключен фонетический разбор данного слова. Ниже будет представлено, как его нужно проводить.

Фонетический разбор

Самый первый его этап будет посвящен тому, сколько звуков и букв в слове:

  • Для начала определим слоги: брю/ки. Их будет два.
  • Давайте посмотрим на существительное и сделаем подсчет. Получается, что в нем есть три согласных и, судя по количеству слогов, две гласных. Теперь произнесем слово для подсчета звуков. В будущей транскрипции их ровно столько же, сколько и букв. Гласных и согласных в нем одинаково.
  • Проговорим слово, чтоб отыскать, куда будет падать ударение: брЮки. На первый слог.
  • Если рассуждать про перенос, то важно знать, что грамотно его будет делать точно по слогам.

Транскрипция слова

Произнесем слово «брюки». Что же получается? [бр’ук’и]. Так будет выглядеть транскрипция для него.

Звуко-буквенный разбор

На этом этапе будет дан анализ каждой буквы и звука и определены их характеристики:

  • б  – [б] – он звонкий парный. Считается согласным. При произношении понятно, что твердый
  • р – [р’] – он звонкий непарный. Среди звуков будет согласным. При произношении понятно, что мягкий. Он является сонорным
  • ю – [у] –  гласный, находящийся в ударном слоге
  • к – [к’] –  он глухой парный. Из числа звуков будет согласным. При произношении понятно, что мягкий
  • и – [и] – гласный, находящийся в безударном слоге

Проверь себя: “Ноябрь” фонетический разбор слова

Анализ показал, что транскрипция существительного «брюки» имеет отличия от его написания. В конце разбора мы посмотрим, в каких именно местах:

У согласных в слове «брюки» хорошо слышны все буквы. Вторая и третья согласные считаются мягкими.

У гласных буква из первого слога в нашем примере «брюки» звучит как [у], потому что впереди нее расположен мягкий согласный.

Раздел: Фонетика

Сорокапятилетие или сорокапяти летие как правильно?
Правильно Сорокапятилетие – правильный вариант написания сложного существительного, пишется слитно. Слово образовано от сложного числительного в форме родительного падежа и основы существительного. Согласно орфографическому словарю такие существительные пишутся слитно. На сорокапятилетие Антон подарил Маше новую шубу. В этом году наш дом отмечает… Читать дальше »

english — Алгоритм определения произношения слова

Интересно, как мы произносим слова. Мне кажется, я научился этому, когда был ребенком, в школе со всеми языковыми правилами, но теперь я не могу вспомнить.

Я пытаюсь думать о том, как мы произносим слова. Как мы на самом деле мысленно разбираем буквы и «озвучиваем». Это кажется немного сложным, потому что это не просто движение слева направо, как вы можете себе представить. С первого взгляда кажется, что мы должны «смотреть вперед», чтобы определить звучание текущих букв, даже до такой степени, что нам приходится смотреть на слово целиком, чтобы понять звучание.

Например, слово фаза . Мы знаем, что ph всегда звук f . Но ase — это aze , например haze . Итак, мы знаем только этот , я думаю, , потому что это слово «фаза», и именно так произносится все слово. Или, может быть, это потому, что слово лицо уже принимает этот звук.

Слово chase имеет звук face . Таким образом, chase и phase имеют s vs. звук z .

Затем есть другие слова, такие как , привязка и поле . Есть много , то есть слов, которые произносятся как «страх» или «слеза», «пронзить», «свирепый», «поле», «осада» и т. Д. Но tie похоже на «я». Вы знаете это только потому, что слово короткое.

Так что я не вижу правил произношения слов. Я полагаю, что существует множество правил, но все же мне интересно, что они из себя представляют.

Итак, мой вопрос: есть ли ресурс, на который можно посмотреть, в котором излагаются правила озвучивания слов, или это чисто научная вещь, что существует слишком много правил, которые нужно записать.

Или, может быть, вместо всех конкретных правил (например, ph это f и т. Д.), Просто алгоритм перемещения по слову и применения правил.

Тогда есть такие слова, как tear , которые имеют два произношения! teer и tair .

Распознавание речи — Фонетика. Поиск основного принципа и фокуса… | Джонатан Хуэй

Телефоны — это акустическая реализация фонем. У нас может быть много аллофонов для одних и тех же фонем, например, фонема / p / in «яма» и «плевок» произносятся по-разному.При переключении между аллофонами возникает странный акцент, а не другое слово. Итак, фонемы — это абстрактное лингвистическое понятие, позволяющее различать слова, а телефоны — это то, как мы их произносим. На диаграмме ниже записано «у нее только что родился ребенок» с фонемами.

Источник

В области распознавания речи мы собрали корпуса, которые фонетически транскрибируются и выровнены по времени. (время начала и окончания каждого телефона отмечены.) TIMIT — это один популярный корпус, который содержит высказывания 630 североамериканских спикеров.

Источник

Аудиоклип будет разделен на кадры. Телефон займет несколько кадров. С таким корпусом мы можем узнать, как выполнять:

  • Классификация кадров: назначить метку телефона звуковому кадру.
  • Классификация телефонов: назначьте телефон сегменту аудио (несколько кадров).
  • Распознавание телефона: распознает последовательность телефонов, соответствующую записанному высказыванию.
Источник (слово «она»)

Первая половина диаграммы — это звук для согласного звукового падежа / sh /.Он явно отличается от гласной после него. Однако для машинного обучения (ML) нам нужно более плотное представление, чтобы мы могли их легче идентифицировать. Инженеры любят частотную область. Мы применяем преобразование Фурье для преобразования информации временной области в частотную область. Например, прямоугольную волну можно разложить на сумму множества синусоидальных волн. Короче говоря, мы спрашиваем, каков состав частот и соответствующие величины.

Источник: Berg & Stork

В третьей строке ниже синусоидальная волна может быть преобразована в частотную область с определенной частотой.

Источник (Примеры преобразования Фурье между временной и частотной областями)

Ниже представлена ​​звуковая волна для гласной [iy] во временной области.

Источник

Он состоит из множества частот, но мы можем видеть, что он повторяется 10 раз в пределах 0,03875 с = 258 Гц. Это самая низкая частота его колебаний, и каждый пик соответствует раскрытию голосовых связок. Эта частота называется основной частотой или F0.

В спектрограмме мы нарезаем звуковую волну на кадры, скажем, длительностью 25 мс каждый.Вот визуализация спектра частот (ось y), меняющегося со временем. Величина для каждой частоты указывается интенсивностью цвета.

Источник

Вот спектрограмма гласных. Как показано ниже, есть несколько доминирующих частот. Их называют формантами . Начиная снизу, он называется F1, F2 и F3 соответственно. Как показано, движение F1, F2 и F3 (вверх или вниз) может быть разным в разных гласных. С помощью этих формант нам удастся определить разные гласные.

Источник

А пока давайте сосредоточимся на гласных при разработке модели артикуляции звука. Начнем со звуков, производимых вибрациями голосовых связок. Левая диаграмма — это форма волны, а правая — соответствующая частотная область.

Source

Наши артикуляции создают разные формы речевого тракта, которые создают разные резонансы. Они действуют как фильтры при подавлении или усилении частот.

Левый источник, справа: Марк Либерман

С некоторой точки зрения это похоже на вдувание воздуха в бутылки.Наши сочленения изменяют глубину и форму бутылок, что создает различный резонанс, за исключением того, что бутылки соединяются вместе и образуют более сложный фильтр.

Источник

Давайте посмотрим на правую диаграмму ниже. Это звук в частотной области в результате объединения источника звука (левая диаграмма) с фильтром. Мы можем приблизительно выделить три пика. Они связаны с формантами F1, F2 и F3 соответственно. Эти пики можно использовать при распознавании речи для различения гласных.

Изменено из исходного кода

И диаграмма ниже резюмирует весь этот процесс.

Источник

Теперь мы должны вернуться к примеру Да Винчи. Совпадает ли наше обсуждение слогов, гласных и согласных с анатомией птицы в летательном аппарате? Хотя мы применяем лингвистику к распознаванию речи в первые дни, многие усилия дают мрачные результаты. Представления о слогах, гласных и согласных, вероятно, слишком высоки, с вариантами, которые трудно смоделировать эффективно. Более успешные распознаватели речи игнорируют большую часть того, что мы узнаем из фонетики или лингвистики.Особые приемы артикуляции нам тоже не очень помогают. Но это полезно знать, поскольку она закладывает необходимый фундамент.

Итак, на чем мы должны сосредоточиться? В последние несколько десятилетий основное внимание уделяется поиску наиболее вероятной последовательности слов с учетом звука. Другими словами, принцип упрощается до нахождения последовательности слов W с наибольшей вероятностью при наблюдаемых аудиосигналах. Математически мы можем записать это с помощью дискриминативной или генеративной модели, представленной ниже:

Генеративную модель намного проще смоделировать при распознавании речи до введения DL. Моделирование P ( W | X ) слишком сложно с ML. Наше обсуждение будет сосредоточено на генеративном подходе, прежде чем использовать DL для его решения с помощью дискриминативной модели. Оба подхода важны.

Генеративная модель зависит от построения акустической модели P ( X | W ) и языковой модели P ( W ). Акустическая модель — это то, что может звучать речь с учетом последовательности слов. В языковой модели речь идет о вероятности последовательности слов.Это придает последовательности грамматическое и семантическое звучание. Например, «Я смотрю фильм» будет более вероятным, чем «Я смотрю фильм» или «Я смотрю яблоко».

В последние несколько десятилетий распознавание речи — это машинного обучения с учителем плюс поиск . Мы узнаем, как сопоставлять звуковые сигналы со словами. Но из-за возможных вариантов мы исследуем многообещающие или все возможности, и это поисковая часть.

Функции и метки в контролируемом ML

В любом обучении с учителем есть два основных вопроса: каковы функции и метки? Что такое X и W в генеративной модели в акустической модели P ( X | W )? Англоговорящие люди знают от 20 до 50 тысяч слов.Если мы будем использовать такие слова, как W , пространство для W будет излишне большим. Кроме того, английский не является фонетическим языком. Буквы не всегда произносятся одинаково разными словами. Бонусом будет менее неоднозначная связь с произношением. Итак, какие есть альтернативы? Телефоны более фундаментальны, чем слова в речи. Кроме того, многие корпуса уже фонетически зашифрованы, или такая транскрипция может выполняться автоматически с помощью таблиц произношения.Поэтому наша акустическая модель будет основана на телефоне, а не на словах.

Итак, следующий вопрос будет: что такое X ? Звуковой сигнал содержит зашумленную информацию. Мы собираемся извлечь признаки из звуковой волны, и X будут векторами признаков. Эксперт может выполнять распознавание речи по спектрограмме. Так что извлечение признаков из частотной области будет разумным началом. Но нам нужно еще более плотное представление. Это заставит нас узнать основную информацию, но не шум.

Источник

Однако наше обсуждение пока не дает полной картины. Мы говорим то, что слышим.

При распознавании речи знание того, как мы слышим, важнее, чем знание того, как мы говорим при извлечении признаков.

Чувствительность слуха у человека нелинейна. Воспринимаемое разделение громкости и частоты варьируется на разных частотах.

Акустико-фонетические представления в распознавании слов

Познание. Авторская рукопись; доступно в PMC 2012 5 декабря.

Опубликован в окончательной редакции как:

PMCID: PMC3514860

NIHMSID: NIHMS418740

Университет Индианы

Запросы на переиздание следует направлять Дэвиду Б. Писони, Департамент психологии, Университет Индианы, 47405, Блумингтон, штат Индиана, США. USA

Окончательная отредактированная версия этой статьи издателем доступна на Cognition. См. Другие статьи в PMC, в которых цитируется опубликованная статья.

Abstract

В этой статье рассматривается то, что в настоящее время известно о сенсорных и перцептивных входных данных, которые предоставляются системе распознавания слов процессами, которые обычно считаются связанными с восприятием звука речи.В первом разделе мы обсуждаем несколько основных проблем, с которыми исследователи речи пытались справиться на протяжении последних тридцати лет. Во втором разделе мы рассматриваем одну попытку концептуализировать процесс восприятия речи в рамках теоретической основы, которая приравнивает этапы обработки к уровням лингвистического анализа. Эта структура предполагает, что речь обрабатывается через ряд аналитических этапов, начиная от периферической слуховой обработки, акустико-фонетического и фонологического анализа до распознавания слов и лексического доступа.

Наконец, в последнем разделе мы рассмотрим несколько недавних подходов к распознаванию устных слов и лексическому доступу. Мы исследуем ряд утверждений, касающихся природы восходящего ввода, предполагаемого этими моделями, постулируемых единиц восприятия и взаимодействия различных источников знаний в слуховом распознавании слов. Дополнительной целью этой статьи было установить необходимость использования сегментарных представлений в распознавании устных слов.

1. Введение

Хотя проблемы распознавания слов и природа лексических представлений давно интересовали когнитивных психологов, эти темы не изучались широко исследователями, работающими в основном направлении исследований восприятия речи.В течение многих лет эти два направления исследований оставались совершенно разными. Такое положение вещей объясняется несколькими причинами. Во-первых, основная часть исследований по распознаванию слов была посвящена изучению визуального распознавания слов при чтении, почти не уделяя внимания проблемам распознавания устных слов. Во-вторых, большая часть интереса и исследовательских усилий в области восприятия речи была связана с проблемами, связанными с восприятием функций и фонем в строго контролируемой среде с использованием бессмысленных слогов.Такой подход подходит для изучения «низкоуровневого» слухового и акустико-фонетического анализа речи, но он не так полезен при решении вопросов, касающихся того, как слова распознаются изолированно или в контексте или как различные источники информации используются слушатель, чтобы восстановить намеченное сообщение говорящего.

Теперь ясно, что многие интересные и потенциально весьма важные проблемы в области восприятия речи связаны с интерфейсом между акустико-фонетическими процессами и процессами распознавания слов и лексического доступа.Эти проблемы связаны с природой акустических сигналов, которые слушатели извлекают из речевого сигнала, процессами, используемыми для интеграции этих сигналов, и различными типами единиц восприятия, которые вычисляются системой обработки речи (Liberman, Cooper, Shankweiler & Studdert -Кеннеди, 1967; Стивенс и Хаус, 1972; Студдерт-Кеннеди, 1974). Например, значительный интерес представляет точное определение видов представлений, которые существуют в ментальном лексиконе, и промежуточных представлений, которые вычисляются слушателем при преобразовании речевого сигнала в символическое представление.Являются ли слова, морфемы, фонемы или последовательности спектральных шаблонов правильным способом характеристики репрезентаций лексических статей в понимании разговорного языка? Доступ к слову в лексиконе осуществляется на основе акустического, фонетического или фонологического кода? Почему часто встречающиеся слова распознаются так быстро? И как контекст используется для поддержки распознавания слов и облегчения доступа к значению слова? Это несколько вопросов, на которые необходимо ответить, прежде чем станет возможным полное понимание распознавания устных слов.

В этой статье мы рассматриваем природу сенсорных и перцептивных входных данных, которые предоставляются системе распознавания слов процессами, которые обычно считаются связанными с восприятием звука речи. В первом разделе мы суммируем несколько фундаментальных проблем, которые исследователи речи пытались решить за последние тридцать пять лет. Мы сосредотачиваем наше обсуждение на давних проблемах инвариантности, линейности и сегментации речевого сигнала, чтобы проиллюстрировать сложные отношения, существующие между речевой формой волны и единицами лингвистического описания.Мы также рассматриваем проблемы, связанные с идентификацией основных единиц перцептивного анализа и типов представлений, которые вычисляются системой восприятия речи. Во втором разделе мы рассматриваем одну попытку концептуализировать процесс восприятия речи в рамках теоретической основы, которая приравнивает уровни лингвистического анализа к этапам обработки. Наконец, в последнем разделе мы рассмотрим несколько недавних подходов к распознаванию устных слов и лексическому доступу. Здесь мы исследуем утверждения, касающиеся природы восходящего ввода, предполагаемого этими моделями, единиц восприятия и потенциального взаимодействия различных источников информации при распознавании слов.

2. Фундаментальные проблемы восприятия речи

Фундаментальные проблемы восприятия речи сегодня — это те же проблемы, которые ускользали от окончательного решения более тридцати пяти лет (Fant, 1973; Joos, 1948). Несмотря на то, что неразрешимость этих давних проблем привела к появлению огромного количества литературы по воспроизведению и восприятию речи, исследователям все еще трудно объяснить, как именно слушатель-человек преобразует непрерывно изменяющуюся форму речевого сигнала в дискретные языковые единицы и как эти единицы используются для извлечения языкового сообщения, предназначенного говорящим.В самом деле, мы не только все еще не уверены в точной природе языковых единиц, полученных при перцепционной обработке речи, но еще мало внимания уделялось проблеме того, как сенсорный и перцепционный анализ речевой волны соприкасается с представлениями слов. в лексиконе или как эти представления используются для поддержки понимания языка.

Многие, если не все, проблемы с восприятием речи связаны с тем, как она воспроизводится. Фонемы редко, если вообще когда-либо, реализуются в форме волны речи как линейно упорядоченная последовательность дискретных акустических событий.Это связано в первую очередь с тем, что говорящие объединяют соседние фонемы, так что на артикуляцию одной фонемы влияет артикуляция соседних фонем. Было чрезвычайно сложно идентифицировать акустические особенности в форме речевого сигнала, которые однозначно соответствуют воспринимаемым фонемам, независимо от окружающего контекста (см. Stevens & Blumstein, 1981). Акустические последствия коартикуляции и другие источники контекстуально обусловленной изменчивости приводят к тому, что акустический сигнал не удовлетворяет двум важным формальным условиям, инвариантности и линейности, что, в свою очередь, порождает проблему сегментации.

2.1. Линейность речевого сигнала

Условие линейности гласит, что для каждой фонемы в высказывании должен быть соответствующий отрезок звука (Chomsky & Miller, 1963). Более того, если за фонемой X следует фонема Y в фонематическом представлении, звуковой отрезок, соответствующий фонеме X, должен предшествовать звуковому отрезку, соответствующему фонеме Y в физическом сигнале. Условие линейности акустического сигнала явно не соблюдается. Из-за коартикуляции и других контекстных эффектов акустические характеристики соседних фонем часто «размазываются» по фонемам в речевой форме волны.Хотя сегментация возможна согласно строго акустическим критериям (см. Fant, 1962), количество акустических сегментов обычно больше, чем количество фонем в высказывании. Более того, не было обнаружено простого инвариантного отображения между этими чисто акустическими атрибутами или особенностями и воспринимаемыми фонемами. Это размытие или параллельная передача акустических характеристик приводит к участкам речевой волны, в которых присутствуют акустические особенности более чем одной фонемы (Liberman et al., 1967). Следовательно, не только редко встречается конкретный отрезок звука, который однозначно соответствует данной фонеме, но также редко бывает, чтобы акустические характеристики одной фонемы всегда предшествовали или следовали акустическим характеристикам соседних фонем в физическом сигнале. По этой причине Liberman et al. (1967) утверждали, что речь — это не простой шифр или алфавит, а, напротив, сложный код, в котором «звуки речи представляют собой очень значительную реструктуризацию фонематического« сообщения »» (стр.4). Поэтому одна из центральных проблем в области восприятия речи сосредоточена на преобразовании непрерывно меняющегося речевого сигнала в последовательность дискретных языковых единиц, таких как фонемы, телефоны или аллофоны.

2.2. Акустико-фонетическая инвариантность

Еще одно условие, которому речевой сигнал не удовлетворяет, — это принцип инвариантности (Chomsky & Miller, 1963). Это условие гласит, что для каждой фонемы X должен быть определенный набор критериальных акустических атрибутов или характеристик, связанных с ней во всех контекстах. Эти особенности должны присутствовать всякий раз, когда встречается X или какой-либо вариант X, и они должны отсутствовать всякий раз, когда в представлении встречается какая-либо другая фонема. Из-за эффектов коартикуляции акустические характеристики данного речевого звука часто меняются в зависимости от фонетической среды, в которой он воспроизводится. Например, переходы формант для согласных, начинающихся со слога, которые указывают место артикуляции (например, / b / vs. / d / vs. / g /), значительно различаются в зависимости от следующей гласной (Liberman, Delattre, Cooper, И Герстман, 1954).Формантные переходы для стоп-согласных в позициях начала слога не определяют однозначно место артикуляции для всех гласных. Если формантные переходы являются основными сигналами к месту артикуляции для стоп-согласных, они должны быть сильно зависимыми от контекста и не инвариантными в разных фонетических контекстах. Короче говоря, проблема инвариантности заключается в объяснении перцептивного постоянства звуков речи, несмотря на отсутствие надежных акустических коррелятов в форме речевого сигнала (Stevens & Blumstein, 1981; Studdert-Kennedy, 1974).

2.3. Сегментация на единицы более высокого порядка

Контекстно-обусловленная изменчивость в соответствии между речевым сигналом и фонемой также представляет огромные проблемы для сегментации формы речевого сигнала на единицы более высокого порядка лингвистического анализа, такие как слоги и слова. Из-за несоблюдения условий линейности и инвариантности, отмеченных выше, речевой сигнал не может быть сегментирован на акустически определенные единицы, которые независимы от соседних сегментов или свободны от обусловливающих эффектов контекстов уровня предложения.Например, с помощью простых физических критериев было трудно определить, где заканчивается одно слово и начинается другое, особенно в связной речи. Однако сегментация слов может быть возможна с учетом систематической внутренней структуры слов, и мы вернемся к этому вопросу ниже.

2.4. Единицы перцептивного анализа

Помимо проблем линейности, инвариантности и сегментации, есть еще одна неприятная проблема, которая возникает из-за слипания речи.Эта проблема включает отношения между единицами перцептивного анализа и единицами, принятыми из лингвистического анализа. Было высказано предположение, что ограничения пропускной способности каналов в слуховой системе требуют, чтобы необработанная сенсорная информация была перекодирована в некое абстрактное представление, которое можно использовать для последующего анализа (Liberman et al., 1967). Однако то, что составляет эти абстрактные единицы анализа, было темой давних дискуссий в области исследования речи. Многие исследователи утверждали, что фонетическая особенность, фонема и слово являются первостепенными при перцепционной обработке речи.Другие исследователи даже предлагали такие большие единицы, как предложение или предложение (Bever, Lackner, & Kirk, 1969; Miller, 1962). На наш взгляд, большая часть дебатов по поводу выбора базовой единицы восприятия в языковой обработке несколько ошибочна, поскольку по мере изменения уровня лингвистической обработки меняются и единицы перцептивного анализа. На наш взгляд, вопрос о том, является ли одним базовым или первичным блоком , в значительной степени неправильный, поскольку на самом деле существует множество единиц, используемых механизмом обработки речи.Во всяком случае, проблема для теоретика восприятия представляет собой взаимодействие между различными единицами, а не идентификация или определение одной базовой единицы перцептивного анализа. Для некоторых целей достаточно абстрактных единиц, таких как фонемы, чтобы зафиксировать важные различия и обобщения внутри и между областями ограничений (Allen, 1985). Для других целей могут быть более подходящими более параметрические представления формы волны речи.

Однако остается важный вопрос относительно того, какие единицы являются обязательными или необходимыми для перцепционной обработки речи и какова природа этих единиц. Хотя ни одна единица не может быть первичной, все же необходимо указать, какие единицы вообще используются при восприятии речи, распознавании слов и лексическом доступе. Эта проблема возникла прежде всего при попытках уточнить исходное акустико-фонетическое представление речи. Из-за сильно закодированной природы фонем в речевой форме волны, возникающей в результате коартикуляции (Fischer-Jorgensen, 1954; Liberman et al., 1967), ряд исследователей отказались от представления о том, что сегментное представление фактически воспринимается слушателем во время речи обработка.Альтернативные источники, чтобы назвать несколько, предлагали слоги (Cole & Scott, 1974a, b; Massaro & Oden, 1980; Studdert-Kennedy, 1974, 1980), контекстно-зависимые аллофоны (Wickelgrcn, 1969, 1976) и контекстно-зависимые. чувствительные спектры (Klatt, 1980) как минимальные единицы кодирования речевого сигнала. Эти подходы обычно пытались обойти проблему определения того, как фонематическое сегментальное представление конструируется из речевой волны, в которой не выполняются условия линейности и инвариантности (см., Однако, Studdert-Kennedy, 1974).Хотя один или несколько из этих подходов к проблеме единицы анализа могут быть правильными в той или иной форме, мы полагаем, что все еще существуют значительные доказательства, которые можно собрать в поддержку утверждения о том, что на начальных этапах обработки речи некоторый тип сегментарного представление является производным (см. ниже). Однако остается вопрос, что такое исходная единица кодирования речи и как она вычисляется системой обработки. Для целей настоящего обсуждения достаточно просто отметить здесь, что этот вопрос не был решен удовлетворительно даже среди исследователей в этой области.Тем не менее, исследования продолжаются, несмотря на неоднозначность и разногласия по поводу основных единиц обработки в восприятии речи. По нашему мнению, такие единицы, как фонемы, которые определены в лингвистической теории, вероятно, не являются хорошими кандидатами на роль единиц обработки при анализе речи в реальном времени. Однако такие устройства, как телефоны, аллофоны или контекстно-зависимые дифоны, могут быть более подходящими для получения важных обобщений о речи и служить в качестве единиц восприятия на самых ранних стадиях восприятия речи.

3. Перцепционная обработка речи

Восприятие речи обычно рассматривается как процесс, охватывающий различные стадии анализа при преобразовании речевого сигнала в намеченное сообщение (Studdert-Kennedy, 1974, 1976). Этот компонентный анализ восприятия речи оказался очень полезным для создания концептуальной основы, с которой можно приступить к изучению понимания устной речи. Хотя точная природа каждой из постулируемых стадий и взаимодействия между стадиями все еще являются предварительными, они, тем не менее, теоретически оправданы с лингвистической точки зрения.Студдерт-Кеннеди (1974) был первым, кто отстаивал этот подход. Он предложил четыре концептуальных этапа анализа: (1) слуховой, (2) фонетический, (3) фонологический и (4) лексический, синтаксический и семантический. При обсуждении этапов перцепционной обработки речи мы добавили пятый этап обработки — периферический слуховой анализ — чтобы выделить несколько недавних подходов к восприятию речи, которые сосредоточены на самых ранних преобразованиях речевого сигнала периферической слуховой системой. Концептуально этот этап обработки фактически представляет собой подкомпонент этапа слухового анализа, предложенного Студдерт-Кеннеди.

3.1. Периферический слуховой анализ

За последние три или четыре года в литературе было опубликовано множество новых исследований о том, как периферическая слуховая система кодирует речевые сигналы (см. Carlson & Granstrom, 1982). Исследования периферийной обработки речевых сигналов идут с двух разных направлений. Во-первых, был проведен ряд важных физиологических исследований с использованием животных для довольно точного описания того, как речевые сигналы кодируются в периферической слуховой системе (Delgutte, 1980, 1982).В этих исследованиях изучалась активность слухового нерва в ответ на простые речевые сигналы, такие как устойчивые гласные и стоп-согласные в слогах согласных и гласных. Целью этой работы было выявление надежных и заметных свойств в паттернах разряда волокон слухового нерва, которые некоторым прямым образом соответствуют важным акустическим свойствам или атрибутам звуков речи (Sachs & Young, 1979).

Следуя второму подходу к периферийной обработке речи, несколько исследователей начали разрабатывать психофизические модели обработки речи (Klatt, 1982).Эти модели явно включают хорошо известные психоакустические данные в свои описания фильтрации, осуществляемой периферической слуховой системой (Searle, Jacobson, & Rayment, 1979; Zwicker, Terhardt, & Paulus, 1979). Целью этого направления исследований является разработка представлений речевого сигнала, которые учитывают известные психофизические факты о слухе, такие как критические полосы, распространение маскировки вверх и рост громкости (Klatt, 1982).

Searle et al.(1979) рассмотрели вопросы, связанные с подходящей полосой пропускания фильтров, используемых слушателями-людьми для обработки речевых стимулов. Анализируя данные психофизических и физиологических исследований, Searle et al. предполагают, что периферическая слуховая система человека анализирует слуховые стимулы примерно с -Октавное разрешение по частоте. Выбор Ширина полосы ⅓-октавы мотивирована не только психофизическими и физиологическими данными, но и свойствами человеческой речи. Поскольку полоса пропускания пропорциональна частоте, Полоса пропускания-октавы обеспечивает спектральное разрешение на низких частотах, а также временное разрешение на высоких частотах.Спектральное разрешение низких частот позволяет разделить первую и вторую форманты, в то время как временное разрешение высоких частот обеспечивает точную временную информацию для быстрого появления всплесков. Исходя из известных фильтрующих свойств периферической слуховой системы человека, Searle et al. смогли сконструировать распознаватель фонем с довольно высокими уровнями точности для распознавания начальных стоп-согласных в слогах согласный-гласный, тем самым продемонстрировав степень, в которой распознавание речи может быть улучшено после того, как психологически разумные преобразования речевого сигнала включены в периферийные представления речи .

Недавний интерес и обширные исследовательские усилия по разработке новых и предположительно более подходящих и достоверных представлений речевых сигналов частично объясняются предположением, что более подробное изучение этих слуховых представлений должно, в принципе, предоставить исследователям много полезного. более актуальная информация об отличительных аспектах восприятия, лежащих в основе звуков речи (Stevens, 1980). Далее предполагалось, что информация, содержащаяся в этих так называемых нейроакустических и психоакустических репрезентациях, внесет важный вклад в окончательное решение проблемы акустико-фонетической инвариантности речи (Goldhor, 1983).Хотя новые и важные результаты, несомненно, будут получены в результате продолжающихся исследований того, как речевые сигналы обрабатываются на слуховой периферии, не следует вводить в заблуждение, полагая, что эти новые исследовательские усилия по обработке речи слуховым нервом предоставят все необходимые решения. в области обработки речи. Напротив, все еще необходимо гораздо больше исследований по вопросам, касающимся центральных слуховых механизмов, используемых при распознавании образов, и источников информации более высокого уровня при восприятии речи (Klatt, 1982).

3.2. Центральный слуховой анализ

После первоначального преобразования речевого сигнала периферической слуховой системой собирается акустическая информация о спектральной структуре, основной частоте, изменениях функции источника, общей интенсивности и продолжительности сигнала, а также о начале и смещении амплитуды. извлекается и кодируется слуховой системой (Stevens, 1980). Предполагается, что эти спектральные и временные паттерны речевого сигнала сохраняются в сенсорной памяти в течение короткого периода времени, в течение которого проводится анализ акустических характеристик (см. Pisoni & Sawusch, 1975).Результаты слухового анализа дают «речевые подсказки»; то есть слуховые представления речевого сигнала, которые впоследствии используются для фонетической классификации.

Большое количество исследований за последние тридцать пять лет было посвящено описанию акустических сигналов для фонетических сегментов. (Обзоры можно найти в Darwin, 1976; Pisoni, 1978; Studdert-Kennedy, 1974, 1980.) Как правило, многие акустические сигналы отображаются на одном фонетическом элементе. Например, Лискер (1978) перечислил шестнадцать возможных сигналов для озвучивания интервокальных стоп-согласных.В целом, однако, можно перечислить несколько основных сигналов, которые служат для обозначения места, манеры и звучания согласных, а также переднего-заднего хода и высоты гласных. Например, для стоп-согласных (/ b /, / d /, / g /, / p /, / t /, / k /) место артикуляции может обозначаться направлением и степенью формантных переходов, грубо спектральная форма всплеска выброса в начале, частота спектрального максимума во всплеске и ширина полосы всплеска (см. Cole & Scott, 1974a, b; Delattre, Liberman, & Cooper, 1955; Dorman, Studdert- Kennedy, & Raphael, 1977; Liberman, Delattre, & Cooper, 1952; Liberman, Delattre, Cooper, & Gerstman, 1954; Stevens & Blumstein, 1978).

Озвучивание начальных остановок может сигнализироваться временем начала голоса, частотой первого формантного перехода и амплитудой всплеска (см. Abramson & Lisker, 1965; Lisker & Abramson, 1964; Stevens & Klatt, 1974; Summerfield & Haggard , 1974). Среди множества сигналов, сигнализирующих о послевокалических остановках, являются продолжительность закрытия (в пост-ударном слог-медиальном положении), длительность предшествующего гласного, степень формантных переходов и озвучивание в завершение (Denes, 1955; Fitch, 1981; House , 1961; Лискер, 1957, 1978; Порт, 1977, 1979; Рафаэль, 1972; Рафаэль и Дорман, 1980).Таким образом, для любого заданного фонетического контраста ясно, что в сигнале контраста участвуют множественные акустические события, и именно на стадии слухового анализа такие сигналы извлекаются.

3.3. Акустико-фонетический анализ

Предполагается, что акустико-фонетический уровень, первый уровень, на котором выполняется лингвистическая обработка, является следующим этапом перцептивного анализа. Здесь речевые реплики из предыдущего уровня анализа отображаются на отличительные фонетические признаки.Фонетические особенности можно рассматривать как абстрактные коды восприятия и памяти, которые обозначают комбинации как конкретных акустических атрибутов, с одной стороны, так и их артикуляционных предшественников, с другой стороны. В фонетической и фонологической литературе было удобно описывать эти особенности в терминах артикуляционных описаний и ярлыков, прежде всего потому, что эти обозначения фиксируют лингвистически релевантные различия на фонетическом и фонологическом уровнях. Одно описание речи на этом уровне состоит из фонетической матрицы, в которой столбцы представляют дискретные фонетические сегменты, а строки указывают состав фонетических признаков каждого сегмента (Chomsky & Halle, 1968).

Акустико-фонетический уровень анализа привлек большое внимание в связи с гипотезой о том, что на этом этапе обработки речи могут работать специализированные детекторы фонетических признаков (Abbs & Sussman, 1971; Eimas & Corbit, 1973; см. Diehl , 1981, для обзора). Идея детекторов признаков в восприятии речи была первоначально предложена Эймасом и Корбитом (1973) на основе двух источников доказательств. Первая линия доказательств была получена в результате исследования восприятия речи младенцев, которое продемонстрировало, что 1- и 4-месячные младенцы различают определенные речевые и неречевые стимулы почти так же, как и взрослые (Eimas, Siqueland, Jusczyk, & Vigorito, 1971).Младенцы различали речевые контрасты категориальным образом, так что межкатегорийные стимулы (например, / bae / и / dae /) различались лучше, чем внутрикатегорийные стимулы (например, два разных токена / bae /). Однако различение у младенцев сопоставимых неречевых стимулов не было явным преимуществом для стимулов между категориями, чем для стимулов внутри категорий (Eimas, 1974). Из-за поразительного сходства действий младенцев и взрослых как в отношении речевых, так и неречевых стимулов, Эймас (1974) предположил, что младенцы при рождении оснащаются детекторами признаков, специализированными для обработки речевых стимулов. (См. Aslin, Pisoni, & Jusczyk, 1983, для дальнейшего обсуждения этих и связанных с ними вопросов восприятия речи младенцев.)

Вторая линия доказательств гипотезы детектора признаков прибывает из исследований избирательной адаптации речи, первых из них. который был проведен Эймасом и Корбитом (1973). Обзоры см. В Cooper (1975) и Eimas and Miller (1978). Эймас и Корбит (1973) интерпретировали свою демонстрацию избирательной адаптации речи как свидетельство работы специализированных детекторов фонетических признаков.Они пришли к выводу, что повторное предъявление конечного стимула утомляет детекторы, настроенные на фонетические особенности стимула. Усталость детектора, чувствительного к функции озвучивания, вызывает сдвиг функции идентификации в сторону озвученной или глухой части континуума, в зависимости от используемого адаптера. Эймас и Корбит пришли к выводу, что результаты на младенческих данных, а также демонстрация избирательной адаптации к речи подтверждают идею специализированных детекторов признаков на уровне фонетического анализа.

The Eimas et al. (1971) и исследования Эймаса и Корбита (1973) вдохновили большое количество исследований как по восприятию младенцев, так и по избирательной адаптации, обзор которых выходит далеко за рамки настоящего обсуждения (см. Ссылки, приведенные выше, для обзоров). Здесь достаточно отметить, что понятие специализированных детекторов фонетических признаков было оставлено. Исследования восприятия младенцев и избирательной адаптации с тех пор показали, что ранее продемонстрированные эффекты лежат не на уровне фонетического анализа, а, скорее, на более ранней стадии или стадиях анализа слуховых характеристик (Eimas & Miller, 1978; Ganong, 1978; Sawusch, 1977а, б; см. Также Ремез, 1979).В элегантном исследовании Sawusch and Jusczyk (1981) четко идентифицирован локус эффектов избирательной адаптации на слуховом уровне. Савуш и Ючик обнаружили, что адаптация следует спектральным характеристикам адаптера, а не воспринимаемой фонетической идентичности, таким образом, четко поместив эффекты избирательной адаптации на уровень слухового анализа.

3.4. Фонологический анализ

На уровне фонологического анализа фонетические признаки и сегменты предыдущего уровня преобразуются в фонологические сегменты.Фонологический компонент предоставляет информацию о звуковой структуре данного языка, которая накладывается на фонетическую матрицу для получения фонологической матрицы (Chomsky & Halle, 1968). Таким образом, фонологические правила, которые применяются к фонетическому входу на этом уровне, определяют степень, в которой фонетические сегменты функционируют как отличительные элементы в языке, и степень, в которой эти атрибуты могут быть предсказаны либо из правил, специфичных для языка, либо из универсальных принципов языка. .Таким образом, на этом уровне можно систематически учитывать предсказуемые и повторяющиеся фонетические детали. Аллофонические вариации, присутствующие на фонетическом уровне, также устраняются, и только фонологически отличительная информация кодируется для последующей обработки.

Исторически лингвисты полагали, что выходной сигнал фонологического компонента представляет собой линейно упорядоченную последовательность фонем, в которой слоги не играют никакой роли в фонологической организации (Chomsky & Halle, 1968). Однако недавно некоторые фонологи (Clements & Keyser, 1983; Halle & Vergnaud, 1980; Kahn, 1976; Selkirk, 1980) постулировали иерархическое представление внутренней структуры слога, в котором основными составляющими являются начало — необязательный начальный согласный или кластер согласных — и rime — остальная часть слога, исключая словоизменительные окончания.Некоторые предварительные поведенческие данные (Treiman, 1983) показывают, что такие составляющие могут быть психологически реальными. Тогда может быть, что на этой стадии анализа вычисляются как фонематический, так и слоговой уровни организации (см. Аналогичное предложение в Halle, 1985).

Здесь стоит упомянуть два аспекта фонологического уровня в этой схеме обработки. Первый касается уже упомянутого выше предположения о том, что сегментное представление вычисляется слушателями при обработке речи в режиме онлайн. Как мы упоминали ранее, несколько исследователей отказались от понятия четкого фонематического уровня репрезентации в восприятии речи, в первую очередь из-за трудностей, возникающих при идентификации линейно упорядоченных, инвариантных акустических сегментов в форме волны, которые соответствуют фонемам (например, Klatt, 1979 , 1980; Массаро и Оден, 1980; Виклегрен, 1969, 1976). Если невозможно собрать достаточные доказательства фонетического уровня репрезентации, было бы излишним постулировать фонологический уровень анализа в любой концептуальной структуре восприятия речи.Однако мы считаем, что можно привести ряд убедительных аргументов, чтобы продемонстрировать необходимость абстрактного сегментарного представления на некотором уровне процесса восприятия речи (см. Также Studdert-Kennedy, 1976, 1980). Поскольку предположение о сегментарных представлениях сыграло такую ​​важную роль в лингвистике и особенно в восприятии речи и распознавании слов за последние тридцать пять лет, ниже мы представляем краткую защиту существования сегментных представлений в обработке речи.

3.5. Анализ речи высшего порядка

Помимо уровня фонологического анализа, для перекодированного речевого сигнала выполняется несколько дополнительных уровней анализа «высшего порядка». Во-первых, мы предполагаем, что распознавание слов и лексический доступ принимают в качестве входных данных некоторое сегментное представление речевого сигнала. Это представление может состоять из телефонов, аллофонов или контекстно-зависимых фонемоподобных единиц. При распознавании слов образцы из более низких уровней анализа затем сопоставляются с представлениями слов, находящихся в долговременной памяти.Лексический доступ происходит, когда значения слов соприкасаются в долговременной семантической памяти (см. Другие статьи в этом выпуске).

Во-вторых, функциональные, семантические и синтаксические роли слова также выводятся из некоторого сегментарного представления речевого сигнала для анализа и интерпретации высказывания. Просодическая информация также интерпретируется для организации высказывания в кратковременной памяти, для определения синтаксических границ, для прогнозирования предстоящих моделей стресса и для оценки определенных прагматических аспектов разговорной ситуации.Короче говоря, необходим большой анализ после фонологического уровня, чтобы восстановить намеченное сообщение говорящего.

Точные роли этих более высоких уровней анализа в управлении более ранними уровнями обработки — тема значительный интерес для исследователей. Некоторые из вопросов, которые в настоящее время изучаются, касаются степени, в которой более высокие уровни обработки взаимодействуют с первоначальным акустико-фонетическим и фонологическим анализами, роли источников информации более высокого уровня в прогнозировании предстоящего речевого ввода и степени, в которой другие источники информации может компенсировать неправильное восприятие и плохую акустико-фонетическую информацию в сигнале.Хотя ранее считалось, что многие из этих вопросов выходят за рамки непосредственного интереса исследователей восприятия речи, все большее число теоретиков осознают необходимость уточнения вкладов более высоких уровней анализа, чтобы более полно понять процесс восприятия речи. Возможно, более важно то, что существует реальная необходимость установить точку соприкосновения в понимании языка между ранним сенсорным акустико-фонетическим вводом и самой системой языковой обработки.Первичный локус этого интерфейса, по-видимому, лежит на уровне обработки, соответствующем распознаванию слов и лексическому доступу (см. Marslen-Wilson & Tyler, 1980; Marslen-Wilson & Welsh, 1978).

4. Сегментарные репрезентации в восприятии речи

В течение ряда лет продолжались дискуссии о роли сегментарных репрезентаций в восприятии речи и распознавании устных слов. Некоторые теоретики полностью отказались от промежуточного сегментарного уровня представления в пользу моделей прямого доступа.В этих моделях слова распознаются без промежуточного анализа их «внутренней структуры» на такие единицы, как аллофоны, фонемы, дифоны или полусложные слова. Сторонники этой точки зрения утверждали, что их модели распознавания не требуют постулирования или использования этих промежуточных представлений и что слушатели-люди фактически не используют эти единицы при анализе разговорной речи в реальном времени. В этом разделе мы выступаем против этой позиции и суммируем данные из нескольких различных областей, подтверждающие существование этих процессоров в восприятии речи и распознавании устных слов.Хотя некоторые теоретики пытались игнорировать или даже отрицать существование этих единиц, мы предполагаем, что они фактически являются , неявно предполагаемыми всеми современными моделями распознавания слов. Без этого предположения было бы невозможно восстановить внутреннюю структуру слов и получить доступ к их значениям. Основываясь на нескольких источниках доказательств, мы утверждаем, что выходной сигнал системы восприятия речи состоит из некоторой формы сегментарного представления. Более того, именно это представление формирует входные данные для процессов, участвующих в распознавании слов и лексическом доступе.

Первая общая линия доказательств, которые мы предлагаем в поддержку сегментарных представлений в восприятии речи, исходит из лингвистики. Одно из фундаментальных предположений лингвистического анализа состоит в том, что непрерывно меняющаяся форма речевого сигнала может быть представлена ​​как последовательность дискретных единиц, таких как функции, телефоны, аллофоны, фонемы и морфемы. Это предположение является центральным для наших нынешних представлений о языке как о системе правил, которые управляют звуковыми паттернами и последовательностями, используемыми для кодирования значений (Chomsky & Halle, 1968).Само существование фонологических явлений, таких как чередование, систематическая регулярность, диахронические и синхронные звуковые изменения, требует ipso facto постулирования некоего сегментарного уровня для улавливания значимых лингвистических обобщений. Таким образом, при описании звуковой структуры данного языка требуется уровень сегментарного представления, чтобы учесть идиосинкразические и предсказуемые закономерности в звуковом паттерне этого языка (см. Kenstowicz & Kisseberth, 1979).Однако другой вопрос, действительно ли эти сегментные единицы используются слушателями-людьми при анализе разговорной речи в реальном времени.

Вторая общая линия доказательств в поддержку сегментарных представлений в восприятии речи носит более психологический характер. Психологические доказательства гипотезы о сегментарном уровне репрезентации в восприятии речи поступают из ряда различных источников. Одним из источников доказательств являются наблюдения за носителями языков без орфографии, которые пытаются разработать системы письма.В своей известной статье «Психологическая реальность фонем» Сепир (1963) приводит несколько примеров случаев, когда выбор орфографии неграмотным говорящим выявил сознательное понимание фонологической структуры его языка. Совсем недавно Рид (1971) описал ряд примеров детей, которые спонтанно изобрели собственную орфографию. Первоначальные встречи детей с печатным текстом демонстрируют систематическое понимание сегментарной структуры языка, тем самым демонстрируя способность анализировать устную речь в представлениях дискретных сегментов, таких как телефоны, аллофоны или фонемы.Действительно, недавно было высказано предположение (Liberman, Shankweiler, Fischer, & Carter, 1974; Rozin & Gleitman, 1977; Treiman, 1980), что способность маленьких детей научиться читать алфавитную систему письма, такую ​​как английская орфография, в значительной степени зависит от их развития. навыков фонематического анализа, то есть навыков, которые позволяют ребенку сознательно анализировать речь на сегментарные единицы.

Существование языковых игр, основанных на вставке звуковой последовательности в определенных точках слова, перемещении звука или звуковой последовательности из одной точки в другую в слове или удалении звука или звуковой последовательности — все это обеспечивает дополнительные поддержка существования сегментарных представлений внутренней структуры слов (см. Treiman, 1983, 1985).Существование рифм и метрической структуры поэзии также влечет за собой осознание, так или иначе, того, что слова имеют внутреннюю структуру и организацию, и что эта структура может быть представлена ​​как линейная последовательность дискретных единиц, распределенных во времени.

Исследование ошибок в речевом воспроизведении дает дополнительное свидетельство того, что слова представлены в лексиконе в виде некоторого сегментарного представления. Высокая частота односегментных речевых ошибок, таких как замены и обмены, свидетельствует о фонологической структуре языка (Fromkin, 1973, 1980; Garrett, 1976, 1980; Shattuck-Hufnagel & Klatt, 1979; Stemberger, 1982).Было трудно, если не невозможно, объяснить эти виды ошибок, не предполагая некоторого сегментарного представления в организации лексики, используемой для производства речи.

За прошедшие годы было получено множество перцептивных открытий, которые можно интерпретировать как поддержку анализа речи на сегментные представления. Возможно, наиболее убедительные данные были получены в результате многочисленных экспериментов, включающих анализ ошибок и недоразумений в краткосрочной памяти, а также ошибок, возникающих при прослушивании слов и бессмысленных слогов, представленных в шуме (Conrad, 1964; Klatt, 1968; Miller & Nicely, 1955; Ван и Билгер, 1973; Викельгрен, 1965, 1966).Хотя некоторые из этих результатов изначально интерпретировались как поддержка различных типов систем функций, они также предоставляют убедительные доказательства того, что слушатель выполняет анализ внутренней структуры входного стимула в измерениях, используемых для кодирования и хранения в памяти. Хотя эти результаты можно интерпретировать как поддержку сегментарного анализа речевого ввода, они также были предметом альтернативных интерпретаций из-за конкретных задач. Как мы отмечали ранее, размер единицы восприятия изменяется по мере изменения уровня анализа в соответствии с экспериментальной задачей и инструкциями испытуемым.Если бы данные восприятия и кратковременной памяти были единственными находками, которые можно было бы процитировать в поддержку сегментарных представлений, можно было бы менее склонно принимать сегментарный уровень представления в восприятии речи и распознавании устных слов. Однако есть и другие сходные источники доказательств из исследований восприятия, которые обеспечивают дополнительную поддержку этой точки зрения.

Например, было множество отчетов, описывающих эффект восстановления фонемы (Samuel, 1981a, b; Warren, 1970), феномен, демонстрирующий онлайн-синтез сегментных свойств беглой речи слушателем.Также были проведены многочисленные исследования с использованием задачи мониторинга фонем, в которой от субъектов требуется обнаруживать присутствие определенной целевой фонемы при прослушивании предложений или коротких высказываний (см. Foss, Harwood, & Blank, 1980). Хотя некоторые более ранние результаты (Foss & Swinney, 1973; Morton & Long, 1976) предполагали, что слушатели сначала распознают слово, а затем проводят анализ сегментов в этом слове, другие более свежие результаты (Foss & Blank, 1980) показывают, что Субъекты могут обнаруживать фонемы в несловах, которых нет в лексиконе (см. также Foss & Gernsbacher, 1983).Таким образом, испытуемые могут обнаруживать фонемы на основе двух источников знаний: информации, полученной от сенсорных входов, и информации, полученной на основе их знания фонологической структуры языка (Dell & Newman, 1980).

Также был собран большой объем данных об обнаружении неправильного произношения при беглой речи (см., Например, Cole, 1973; Cole & Jakimik, 1978, 1980). Хотя эти результаты были интерпретированы как поддержка первенства распознавания слов в восприятии речи (Cole, 1973), эти результаты можно так же легко использовать для подтверждения утверждения о том, что слушатели могут получить доступ к внутренней структуре слов с точки зрения их восприятия. сегментные представления, и что они могут делать это, слушая непрерывную речь.

Наконец, с точки зрения данных о восприятии, существует небольшой массив данных о неправильном восприятии беглой речи (Bond & Games, 1980; Bond & Robey, 1983). Ошибки, собранные в этих исследованиях, предполагают, что очень большая часть неправильных представлений связана с сегментами, а не целыми словами.

Рассмотрев несколько источников доказательств для постулирования фонологического уровня анализа, мы теперь кратко рассмотрим, какие типы анализа выполняются на этом уровне. Мы утверждали, что на уровне фонологического анализа сегментарное представление выводится на основе акустико-фонетических характеристик, вычисленных на предыдущем уровне анализа.То есть фонетический сегмент преобразуется в абстрактное систематическое сегментарное представление (Chomsky & Halle, 1968). Процесс преобразования информации на фонетическом уровне в систематические сегментные представления сложен, поскольку эти представления представляют собой абстрактные сущности, которые могут быть реализованы любым количеством способов на фонетическом уровне. Например, в беглой речи слово «и» может производиться как [ænd], [æen] или [ən] (Oshika, Zue, Weeks, Neu, & Aurbach, 1975).

На фонологическом уровне анализа слушатель применяет свои знания фонологических правил языка при отображении фонетических репрезентаций на более абстрактные сегментарные репрезентации.Большая часть изменчивости на фонетическом уровне по своей сути регулируется правилами, так что слушатель может значительно упростить задачу получения абстрактных представлений из акустико-фонетической формы волны, используя свои знания фонологии и морфологии. Oshika et al. (1975) предложили общий класс фонологических правил, которые пытаются описать эту систематическую вариацию произношения, чтобы проиллюстрировать роль, которую знание фонологических правил может играть в обработке речи. Среди правил, предложенных Oshika et al.это (1) редукция гласных, (2) взмахи альвеол, (3) палатализация, (4) гоморганическая стоп-делеция и (5) редукция гемината. Каждое из этих правил описывает общие явления, встречающиеся в непрерывной речи. Например, правило сокращения гласных описывает тенденцию безударных гласных реализовываться как [ə]. Таким образом, хотя «и» часто может быть реализовано как [ən] на фонетическом уровне анализа, слушатель может «восстановить» лежащее в основе представление, используя свои знания фонологического правила, регулирующего редукцию гласных.Точно так же знание слушателем обстоятельств, при которых препятствующие альвеолии палатализируются, может позволить ему восстановить репрезентацию «сделал ли ты» из его фонетической реализации как [dyu]. Таким образом, большая часть задачи перевода акустико-фонетической информации в некоторый тип сегментарного представления упрощается благодаря знанию нескольких общих правил, которые объясняют большую часть изменчивости на фонетическом уровне (см. Church, 1987, этот выпуск).

5. Распознавание разговорных слов и лексический доступ

Среди наиболее важных тенденций в области восприятия речи в последнее время был повышенный интерес к теориям слухового распознавания слов и лексического доступа.Хотя основная работа по фундаментальным проблемам акустической фонетики все еще ведется, многие исследователи начали расширять область своих исследований, включив в нее процессы распознавания произнесенных слов и извлечения значений из долговременной памяти. На наш взгляд, восприятие речи не является синонимом восприятия фонемы, хотя большая часть ранних работ подчеркивала эту ориентацию. Ни у кого не может быть сомнений в том, что восприятие речи — чрезвычайно сложный процесс, включающий множество уровней обработки, от фонетического восприятия до семантической интерпретации.Выделение одного уровня обработки для исследования при игнорировании возможного вклада и взаимодействия с другими уровнями, на наш взгляд, в некоторой степени близоруко и может привести к совершенно неверным теориям. То, что мы узнаем, например, о распознавании слов, может повлиять на наши теории фонетического восприятия, и наоборот. Конечно, анализ процесса восприятия речи значительно упрощается за счет разделения нашей области исследования на отдельные подкомпоненты. Однако, исследуя один подкомпонент (например,g., фонетическое восприятие) в ущерб другим (например, распознавание слов), по-видимому, ограничивает наше понимание процесса в целом, а также приводит нас к постулированию теорий на одном уровне, которые явно несостоятельны или несостоятельны с учетом того, что мы знать об обработке на других уровнях анализа.

Значительная часть работы, проделанной за последние тридцать пять лет в области восприятия речи, была связана с «первичной проблемой распознавания»; то есть, как форма речевого высказывания распознается или идентифицируется на основе анализа акустической формы волны (Fry, 1956). Сознательная идентификация и понимание всех сегментов в слове, вероятно, не являются необходимыми или даже обязательными для распознавания слова, хотя это, безусловно, возможно при особых обстоятельствах, когда внимание слушателя направлено именно на звуковую структуру высказывания. В нормальных условиях прослушивания слушателю-человеку может не потребоваться идентифицировать весь фонетический ввод, чтобы распознать слова в высказывании. Контекст и другие ограничения могут служить для сужения доступных вариантов, так что для успешного распознавания слов необходимо идентифицировать только небольшую часть акустической волны.

Хотя теории распознавания слов и лексического доступа, которые мы обсуждаем ниже, слишком расплывчаты, чтобы дать какое-либо существенное представление о природе звукового восприятия речи в настоящее время, они указывают на растущую тенденцию рассматривать восприятие речи в более широких рамках обработка разговорной речи. Кроме того, эти теории представляют то, что можно было бы назвать «новым» интересом среди некоторых исследователей речи, а именно способ использования акустико-фонетической информации для связи с лексическими элементами долговременной памяти.В этом заключительном разделе мы кратко рассмотрим пять современных подходов к распознаванию слов и лексическому доступу. Каждый из этих счетов был предложен для решения несколько различных эмпирических проблем в распознавании слов и лексическом доступе, но каждый обращается к актуальной теме, представляющей определенный интерес в распознавании слов, а именно, в какой степени источники знаний более высокого уровня влияют на восприятие. произнесенных слов. Другой вопрос, решаемый, по крайней мере частично, каждой из этих теорий, — это способы, с помощью которых лексические элементы активируются в памяти.Здесь мы заинтересованы в определении характера восходящего ввода и единиц обработки, предполагаемых каждой теорией. В частности, нас интересует степень, в которой эти модели предполагают существование сегментных представлений, явным или неявным образом, для решения основной проблемы распознавания.

На протяжении следующего обсуждения мы проводим различие между распознаванием слов и лексическим доступом. Говоря о распознавании слов , мы явно ссылаемся на те процессы, которые отвечают за генерирование паттерна из акустико-фонетической информации в форме речевого сигнала и сопоставление этого паттерна с паттернами, ранее сохраненными в памяти (т.е., для слов) или шаблонов, сгенерированных правилом (т. е. для псевдослов). Распознавание слов, на наш взгляд, синонимично термину : восприятие формы , как обсуждали Брэдли и Форстер (1987, этот выпуск), и фонетическое восприятие , как обсуждали Либерман и др. (1967) и Студдерт-Кеннеди (1974, 1980). Говоря о лексическом доступе , мы явно ссылаемся на те процессы, которые отвечают за обращение к соответствующей лексической информации в памяти после того, как сопоставление с образцом было выполнено.Таким образом, лексический доступ — это процесс извлечения информации о словах, хранящихся в ментальном лексиконе. Более подробное обсуждение некоторых из этих моделей можно найти в других статьях этого выпуска.

Из проведенного нами различия между процессами распознавания слов и лексическим доступом должно быть ясно, что большинство современных моделей распознавания слов, которые утверждают, что связаны с лексическим доступом, на самом деле являются моделями распознавания слов. Небольшая работа, если вообще была посвящена описанию структуры и организации ментального лексикона (см., Однако, Johnson-Laird, 1975; Miller & Johnson-Laird, 1976).Более того, также должно быть очевидно, что предположения о распознавании слов и входных данных в лексикон, вероятно, не являются независимыми от предположений, сделанных о структуре и организации самого лексикона (см. Bradley & Forster, 1987, этот выпуск; Luce, 1986). Действительно, может быть трудно или невозможно отделить процессы распознавания слов и лексического доступа от их продуктов. Возьмем один пример: сегментация речевого сигнала на дискретные языковые единицы, такие как фонемы или слова, всегда была сложной проблемой из-за непрерывного характера речевого сигнала. Однако сегментация вполне может быть естественным побочным продуктом самого процесса распознавания (Reddy, 1976). По мере того, как мы узнаем больше об источниках вариабельности речи, становится ясно, что вариабельность речевых сигналов чрезвычайно систематична и потенциально весьма полезна для процесса распознавания (Church, 1983; Elman & McClelland, 1984). Действительно, недавние открытия Черча продемонстрировали, как знание аллофонических вариаций может помочь в фонологическом синтаксическом анализе и лексическом поиске и, следовательно, сократить процесс поиска при поиске правильной лексической статьи (см. Church, 1987, этот выпуск).

6. Модели распознавания слов

6.1. Теория логогена

В теории логогена Мортона (1969, 1979, 1982) пассивные сенсорные устройства, называемые «логогенами», представляют каждое слово в ментальном лексиконе. Каждый логоген содержит всю информацию о данном слове, такую ​​как его значение, его возможные синтаксические функции, а также его фонетическую и орфографическую структуру. Логоген отслеживает соответствующую сенсорную и / или контекстную информацию, и, как только такая информация встречается, уровень активации логогена повышается.После достаточной активации логоген пересекает порог, и в это время информация о слове, который представляет логоген, становится доступной системе ответа.

Одной из важных особенностей теории логогенов является то, что логогены отслеживают все возможные источники информации, включая семантическую и синтаксическую информацию более высокого уровня, а также сенсорную информацию более низкого уровня. Таким образом, информация с любого уровня может объединяться, чтобы подтолкнуть логоген к пороговому значению. Таким образом, теория логогена представляет собой очень интерактивную модель распознавания слов.Например, слово с высокой частотой, у которого начальный порог ниже, чем у слов с более низкой частотой, может потребовать очень небольшого сенсорного ввода, если синтаксические и семантические источники информации сильно отдают предпочтение слову. Точно так же слово низкой частоты с несколькими связанными с ним ожиданиями более высокого уровня может потребовать значительного сенсорного ввода для того, чтобы уровень активации достиг порога. Таким образом, на самом деле может не иметь значения, какая информация активирует логоген, если пороговое значение превышено.

Согласно теории логогена, распознавание слов выполняется, когда достигается порог активации логогена.Как мы видели, теория логогена изображает процесс распознавания слов как высоко интерактивный. Лексический доступ, согласно нашей терминологии, достигается, когда информация, содержащаяся в логогене, становится доступной для системы ответов. Таким образом, лексический доступ — это довольно автоматический процесс после распознавания слова. Интересно отметить, что на уровне распознавания слов задействованы не только интерактивные источники знаний, но и частота слов на этом этапе. Слова с более высокой частотой имеют более низкий порог активации, чем слова с более низкой частотой (см., Однако, Luce, 1986).

Конкретные детали теории логогена несколько изменились с годами, хотя основные механизмы остались неизменными. Например, Мортон (1982) недавно разбил систему логогена на отдельные зрительную и слуховую подсистемы. Тем не менее, фундаментальное понятие пассивного порогового устройства, отслеживающего информацию из множества источников, осталось. В нынешнем виде теория логогена, как и многие теории, которые мы обсудим, чрезвычайно расплывчата. В лучшем случае теория помогает понять, как может работать интерактивная система и как можно учесть частоту слов и контекстные эффекты при распознавании слов.Однако теория очень мало говорит, если вообще что-то говорит, о том, как именно интегрированы акустико-фонетические и высокоуровневые источники информации, о времени распознавания слов, природе единиц восприятия или роли словаря в слове. признание.

6.2. Когортная теория

Когортная теория Марслена-Уилсона (Marslen-Wilson & Tyler, 1980; Marslen-Wilson & Welsh, 1978) предполагает две стадии процесса распознавания слов: одну автономную, а другую — интерактивную. На первом, автономном этапе распознавания слов, акустико-фонетическая информация в начале входного слова активирует все слова в памяти, которые разделяют эту исходную информацию слова.Например, если системе представлено слово «раб», активируются все слова, начинающиеся с / s /, такие как «прицел», «сохранить», «привязать» и т. Д. Слова, активируемые на основе исходной информации слова, составляют «когорту». Активация когорты — это автономный процесс в том смысле, что только акустико-фонетическая информация может служить для определения членов когорты. Таким образом, на данном этапе модели распознавание слов является полностью управляемым данными или восходящим процессом.

Ключом к этому подходу является понятие набора «исходных когорт слов» или кандидатов распознавания, которые определяются акустико-фонетической общностью исходных звуковых последовательностей слов.Определенное слово «распознается» в этой точке — «критической точке распознавания» — где слово уникально отличается от любого другого слова на языке , начинающегося с той же начальной звуковой последовательности . Теория объясняет стимулирующие эффекты контекста при распознавании слов, предполагая, как в модели логогена Мортона, что контекст влияет на распознавание конкретного слова. Однако, в отличие от модели логогена, контекст используется для деактивации слов-кандидатов и, следовательно, для уменьшения размера начального набора когорт слов, который активен в любое время.Предполагается, что взаимодействие контекста с сенсорным входом происходит на уровне распознавания слов (см. Marslen-Wilson & Welsh, 1978). Предполагается, что обработка на ранних сенсорных уровнях происходит автоматически и не зависит от других источников информации более высокого порядка. В теории когорт набор исходных когорт слов, который активируется, в принципе определяется внутренней сегментарной структурой линейного расположения звуков речи. Сказать, как это сделал Марслен-Вильсон, что его теория не претендует на структуру входных данных в систему распознавания слов в терминах сегментарных представлений, значит просто отрицать существование предположения prima facie, которое является центральным для организации его слово начальный набор когорты.Теория в ее нынешней формулировке никогда не сработала бы, если бы внутреннюю структуру слов нельзя было формально описать как последовательность сегментных единиц.

Как только структура когорты активирована, все возможные источники информации могут повлиять на выбор подходящего слова из когорты. Таким образом, дополнительная акустико-фонетическая информация может исключить «зрение» и «спасти» из когорты, оставив только слова, начинающиеся с / sl /, такие как «праща» и «раб». Обратите внимание, что распознавание слов на основе акустико-фонетической информации предполагается работать строго слева направо.Однако на этом этапе распознавания слов могут быть задействованы источники информации более высокого уровня, чтобы исключить кандидатов из набора гипотетических когорт слов. Таким образом, если «привязка» несовместима с доступной в настоящее время семантической или синтаксической информацией, она будет исключена из когорты. На этом втором этапе распознавания слов теория очень интерактивна. После выделения одного слова в когорте распознавание слов выполняется.

Когортная теория Марслена-Вильсона привлекла значительное внимание в последние несколько лет, по-видимому, из-за относительно точного описания процесса распознавания слов, ее нового утверждения о том, что все слова в ментальном лексиконе разделяют исходную акустико-фонетическую информацию с входные слова активируются на начальном этапе процесса распознавания слов, и из-за приоритета, который он отдает началу слов, популярному понятию в литературе (см. также Cole & Jakimik, 1980).

Однако теория не лишена недостатков. Например, исходная версия когортной теории не содержит механизма, с помощью которого можно было бы учесть частоту слов (см., Однако, Marslen-Wilson, 1987, этот выпуск). У высокочастотных слов более высокий уровень активации в структуре когорты, или же высокочастотные слова просто с большей вероятностью будут выбраны в качестве кандидатов в когорту, чем низкочастотные слова? Эта последняя возможность кажется маловероятной, поскольку тогда системе было бы трудно учесть распознавание низкочастотных слов, которые могут быть априори исключены из структуры когорты.Возможно, было бы более подходящим связать различные уровни активации со словами-кандидатами, но в нынешней теории нет средств для учета различных уровней активации.

Другая проблема когортной теории — исправление ошибок. Например, если «фундамент» воспринимается как «основание» из-за неправильного произношения или неправильного восприятия, когорта, начинающаяся со слова, не будет содержать слово-кандидат «основание». Марслен-Уилсон допускает около остаточных активаций акустически похожих слов-кандидатов в структуре когорты, поэтому второй проход через структуру когорты может быть возможным для попытки наилучшего совпадения, но в настоящее время теория не определяет, как такое отключение Исправление ошибок линии может быть выполнено.

6.3. Модель автономного поиска Форстера

В отличие от теории логогена Мортона и теории когорт Марслена-Вильсона, теория распознавания слов и лексического доступа Форстера (1976, 1979) автономна в самом строгом смысле. В то время как Мортон и Марслен-Уилсон допускают параллельную обработку информации на каком-то этапе, в теории Форстера лингвистическая обработка является полностью последовательной. Теория Форстера постулирует три отдельных лингвистических процессора: лексический процессор, синтаксический процессор и процессор сообщений.Кроме того, последняя версия теории Форстера включает третий, неязыковой процессор, Систему общей обработки (GPS).

На первом этапе модели Форстера информация от периферийных систем восприятия передается в лексический процессор. Затем лексический процессор пытается найти запись в трех файлах периферийного доступа: орфографическом файле (для визуального ввода), фонетическом файле (для слухового ввода) и синтаксико-семантическом файле (как для визуального, так и для слухового ввода).Предполагается, что поиск файлов периферийного доступа осуществляется по частоте, при этом поиск слов с более высокой частотой выполняется до слов с более низкой частотой. Как только запись находится в файлах периферийного доступа, извлекается указатель, по которому эта запись находится в главном лексиконе. Таким образом, распознавание слов осуществляется на уровне файлов периферийного доступа. Как только запись находится в периферийных файлах, лексический доступ осуществляется путем нахождения записи в главном лексиконе.

При нахождении элемента в главном лексиконе информация, касающаяся местоположения этого элемента в главном списке, передается синтаксическому процессору, который пытается построить синтаксическую структуру.Информация от синтаксического процессора передается процессору сообщений, который пытается построить концептуальную структуру для предполагаемого сообщения. Каждый из трех процессоров — лексический процессор, синтаксический процессор и процессор сообщений — может передавать информацию в GPS. Однако GPS не может влиять на обработку ни в одном из трех выделенных лингвистических процессоров. GPS служит для объединения общих концептуальных знаний с выводом информации от лингвистических процессоров при принятии решения (или ответа).

Теория Форстера автономна в двух смыслах. Во-первых, лексический процессор не зависит от синтаксического процессора и процессора сообщений, а синтаксический процессор не зависит от процессора сообщений. Во-вторых, вся языковая система не зависит от общей когнитивной системы. Эта строго последовательная и автономная характеристика языковой обработки означает, что распознавание слов и лексический доступ никоим образом не зависят от источников знаний более высокого уровня и являются исключительно восходящими или управляемыми данными процессами.Модель Форстера привлекательна своей относительной специфичностью и очевидными проверяемыми утверждениями, которые она делает относительно автономности своих процессоров. Модель Форстера также пытается описать распознавание слов и лексический доступ в контексте обработки предложений. Кроме того, модель включает в себя конкретное объяснение эффекта частоты слов, а именно то, что записи в файлах периферийного доступа организованы в соответствии с частотой и что поиск осуществляется от высокочастотных записей к низкочастотным.

6.4. Теория интерактивной активации Элмана и Макклелланда

Модель Элмана и Макклелланда (1984, 1986) основана на системе простых процессоров, называемых «узлами». Узлы могут означать функции, фонемы или слова. Однако узлы на каждом уровне схожи в том, что у каждого есть уровень активации, представляющий степень, в которой ввод согласуется с единицей, которую обозначает узел. Кроме того, каждый узел имеет уровень покоя и порог. При наличии подтверждающих свидетельств уровень активации узла повышается до его порогового значения; в отсутствие таких доказательств активация затухает к уровню покоя узла (см. также McClelland & Rumelhart, 1981).

Узлы в этой системе сильно взаимосвязаны, и когда данный узел достигает порогового значения, он может влиять на другие узлы, к которым он подключен. Связи между узлами бывают двух типов: возбуждающие и тормозящие. Таким образом, узел, который достиг порогового значения, может повысить активацию некоторых узлов, к которым он подключен, одновременно снизив активацию других узлов. Связи между уровнями исключительно возбуждающие и двунаправленные. Таким образом, узлы фонем могут возбуждать узлы слов, а узлы слов могут, в свою очередь, возбуждать узлы фонем.Например, узлы фонем, соответствующие / l / и / e /, могут возбуждать узел слова «озеро», а узел слова «озеро» может затем возбуждать узлы фонем / l /, / e / и / k /. Соединения на уровнях являются запрещающими и двунаправленными. Таким образом, активация узла фонемы / l / может препятствовать активации узла фонемы / b / , , снижая вероятность того, что слово узел «запекать» повысит уровень своей активации.

Модель Элмана и Макклелланда показывает, как можно концептуализировать высоко интерактивную систему (см. Также McClelland & Elman, 1986).Кроме того, он включает понятия возбуждения и подавления . Таким образом, он напрямую включает механизм, который снижает вероятность того, что узлы, несовместимые со свидетельством, будут активированы, и в то же время позволяет положительным свидетельствам на одном уровне влиять на активацию узлов на другом. Хотя модель Элмана и Макклелланда очень интерактивна, она не лишена ограничений. А именно, связи между уровнями являются только возбуждающими, а внутри уровней — только тормозящими.

Модель Элмана и Макклелланда явно предполагает сегментное представление речи. Вся организация сети основана на существовании различных блоков обработки на каждом уровне, соответствующих акустико-фонетическим характеристикам или репликам, сегментарным фонемам и, наконец, словам. Из-за архитектуры системы слова имеют гораздо более сложную структуру, чем другие элементы. Таким образом, словарные узлы отражают не только активацию слова в целом, но также активацию каждой из составляющих фонем слова и их компонентов.

Здесь стоит отметить две интересные особенности данной модели. Во-первых, хотя эффекты коартикуляции и контекстная изменчивость рассматривались теоретиками как «шум», который накладывается на идеальную дискретную фонетическую транскрипцию речи аппаратом речевого воспроизведения, модель Элмана и Макклелланда рассматривает эту изменчивость, то, что они называют «законной изменчивостью», как источник полезной информации и обеспечивает «изящный» способ учесть влияние контекста на восприятие речи (Elman & McClelland, 1984).Во-вторых, нет явной сегментации входной речевой волны в любой момент во время обработки в их модели. Сегментация на телефоны или аллофоны просто выпадает естественным образом в результате самого процесса маркировки. Таким образом, проблема непосредственной работы с сегментацией устраняется, разрешая активацию всех узлов признаков и фонем и просто наблюдая последствия на уровне слов.

6.5. Модель Клатта LAFS

В то время как модель Элмана и МакКлелланда допускает взаимодействие между уровнями узлов и внутри них, модель Клатта L exical A ccess F rom S pectra (LAFS) предполагает прямой, неинтерактивный доступ к лексическим статьям на основе на контекстно-зависимых спектральных разрезах (Klatt, 1980).Модель Клатта предполагает, что взрослые слушатели имеют словарь всех законных дифонных последовательностей в долговременной памяти. С каждой дифонной последовательностью связано прототипное спектральное представление. Клатт предлагает спектральные представления дифонных последовательностей, чтобы преодолеть контекстную изменчивость отдельных сегментов. Таким образом, в определенной степени Клатт пытается преодолеть проблему отсутствия акустико-фонетической инвариантности речи путем предварительной компиляции коартикуляционных эффектов непосредственно в репрезентации, хранящиеся в памяти.

В модели Клатта LAFS слушатель вычисляет спектральные представления входного слова и сравнивает эти представления с прототипами в памяти. Распознавание слов выполняется, когда обнаруживается наилучшее совпадение между входными спектрами и изображениями дифонов. В этой части модели распознавание слов осуществляется непосредственно на основе спектральных представлений сенсорного ввода. Существует средство, с помощью которого фонетическая транскрипция может быть получена от промежуточного до лексического доступа (т.например, через модуль SCRIBER), но в большинстве случаев доступ является прямым, без промежуточных уровней вычислений, соответствующих сегментам или фонемам.

Одним из важных аспектов модели LAFS Клатта является то, что она явно избегает необходимости вычислять отдельный уровень представления, соответствующий дискретным фонематическим сегментам. Вместо этого LAFS использует предварительно скомпилированную, основанную на акустике лексику всех возможных слов в сети спектров мощности дифонов. Предполагается, что эти спектральные шаблоны являются контекстно-зависимыми единицами, очень похожими на «виклфоны», поскольку предполагается, что они представляют акустические корреляты телефонов в различных фонетических средах (Wickelgren, 1969).Дифоны в системе LAFS достигают этого путем кодирования спектральных характеристик самих сегментов и переходов от середины одного сегмента к середине следующего сегмента.

Клатт утверждает, что конкатенации дифонов достаточно, чтобы уловить большую часть контекстно-зависимой изменчивости, наблюдаемой для фонетических сегментов в произносимых словах. Распознавание слов в этой модели выполняется путем вычисления спектра мощности входного речевого сигнала каждые 10 мс и последующего сравнения этого входного спектра со спектральными шаблонами, хранящимися в предварительно скомпилированной сети.Основная идея LAFS, адаптированная из системы Harpy, состоит в том, чтобы найти путь через сеть, который лучше всего представляет наблюдаемые входные спектры (Klatt, 1977). Затем предполагается, что этот единственный путь представляет оптимальную фонетическую транскрипцию входного сигнала.

Модели Элмана, Макклелланда и Клатта находятся на обоих концах континуума теорий распознавания слов и лексического доступа. Теория Элмана и МакКлелланда представляет собой класс теорий, в которых особое внимание уделяется интерактивным системам, в которых много разных уровней информации играют роль в распознавании слов и лексическом доступе.В этом смысле их модель наиболее близка к моделям Мортона и Марслена-Вильсона, хотя когортная теория Марслена-Вильсона действительно включает начальную автономную стадию обработки. Модель Клатта, с другой стороны, представляет собой класс моделей, в которых лексический доступ осуществляется почти полностью на основе восходящей акустико-фонетической информации. В этом смысле модель Клатта напоминает подход Форстера. Однако модель Форстера действительно постулирует промежуточные уровни анализа в процессе распознавания слов, в отличие от LAFS Клатта, которая предполагает прямое отображение спектров мощности на слова в предварительно скомпилированной сети.Один из центральных вопросов, который необходимо решить в отношении современных теорий распознавания слов, касается степени, в которой распознавание слов включает интерактивные источники знаний, и способ, которым эти процессы взаимодействуют с процессами, участвующими в восприятии звуков речи (см. Другие материалы по этому вопросу). .

7. Резюме и выводы

В этой статье мы попытались кратко рассмотреть то, что в настоящее время известно о природе входных данных в систему распознавания слов, обеспечиваемых механизмами, используемыми в восприятии звуков речи.После рассмотрения нескольких основных вопросов восприятия речи, таких как линейность, инвариантность и сегментация, мы описали несколько этапов перцептивного анализа в рамках концептуальной основы. Эта структура предполагала, что речь обрабатывается через ряд аналитических этапов, начиная от периферической слуховой обработки, акустико-фонетического и фонологического анализа до распознавания слов и лексического доступа. Наконец, мы рассмотрели несколько современных подходов к распознаванию слов, чтобы сделать явными некоторые из основных предположений относительно природы входных данных в процесс распознавания слов.Дополнительная цель статьи заключалась в установлении потребности в сегментарных фонематических репрезентациях при распознавании устных слов. Это точка обработки разговорной речи, которая служит для сопряжения исходной сенсорной информации в форме речевого сигнала с представлением слов в лексиконе. Изучение текущих моделей показало, в какой степени сегментарные представления предполагаются явным или неявным образом при опосредовании распознавания слов и лексического доступа.

Сноски

* Подготовка этого документа была частично поддержана исследовательским грантом NIH NS-12179, контрактом с Управлением научных исследований ВВС, Командованием систем ВВС и стипендией Фонда Джеймса МакКина Кеттелла первому автору.Мы благодарим Говарда Нусбаума, Бет Грин и Роберта Ремеза за их комментарии и предложения. Мы также благодарим рецензентов за множество полезных предложений по более раннему варианту этой статьи.

Ссылки

  • Abbs JH, Sussman HM. Детекторы нейрофизиологических особенностей и восприятие речи: обсуждение теоретических последствий. Журнал исследований речи и слуха. 1971; 14: 23–36. [PubMed] [Google Scholar]
  • Абрамсон А.С., Лискер Л. Время начала голоса в стоп-согласных: акустический анализ и синтез.Материалы 5-го Международного акустического конгресса; Вассал. 1965. [Google Scholar]
  • Аллен Дж. Взгляд на общение человека с машиной посредством речи. Труды IEEE. 1985. 74 (11): 1541–1550. [Google Scholar]
  • Аслин Р. Н., Пизони Д. Б., Ючик П. В.. Слуховое развитие и восприятие речи в младенчестве. В: Массен П., редактор. Руководство Кармайкла по детской психологии. 4. 2 1983. [Google Scholar]
    Haith MM, Campos JJ, editors. Младенчество и биология развития.Vol. 2. Нью-Йорк: Уайли; [Google Scholar]
  • Бевер Т.Г., Лакнер Дж., Кирк Р. Базовые структуры предложений являются основными единицами непосредственной обработки речи. Восприятие и психофизика. 1969; 5: 225–231. [Google Scholar]
  • Бонд З.С., Гарнес С. Неправильное восприятие беглой речи. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Bond ZS, Robey RR. Фонетическая структура ошибок восприятия беглой речи.В: Lass NJ, редактор. Речь и язык: достижения в области фундаментальных исследований и практики. Vol. 9. Нью-Йорк: Academic Press; 1983. [Google Scholar]
  • Bradley DC, Forster KI. Взгляд читателя на слушание. Познание. 1987; 25 в этом выпуске. [PubMed] [Google Scholar]
  • Карлсон Р., Гранстрем Б., редакторы. Представление речи в периферической слуховой системе. Нью-Йорк: Elsevier Biomedical Press; 1982. [Google Scholar]
  • Хомский Н., Халле М. Звуковой паттерн английского языка. Нью-Йорк: Харпер и Роу; 1968 г.[Google Scholar]
  • Хомский Н., Миллер Г.А. Введение в формальный анализ естественных языков. В: Люс Р.Д., Буш Р., Галантер Э., редакторы. Справочник по математической психологии. Vol. 2. Нью-Йорк: Уайли; 1963. [Google Scholar]
  • Church KW. Анализ структуры фраз: метод использования аллофонических ограничений. Блумингтон, Индиана: Клуб лингвистики Университета Индианы; 1983. [Google Scholar]
  • Church KW. Фонологический разбор и лексический поиск. Познание.1987; 25 в этом выпуске. [PubMed] [Google Scholar]
  • Clements GN, Keyser SJ. Фонология резюме: генеративная теория слога. Кембридж, Массачусетс: MIT Press; 1983. [Google Scholar]
  • Cole RA. Прослушивание неправильного произношения: мера того, что мы слышим во время речи. Восприятие и психофизика. 1973; 13: 153–156. [Google Scholar]
  • Коул Р.А., Джакимик Дж. Понимание речи: как слышны слова. В: Андервуд Дж., Редактор. Стратегии обработки информации. Нью-Йорк: Academic Press; 1978 г.[Google Scholar]
  • Коул Р.А., Якимик Дж. Модель восприятия речи. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Коул Р.А., Скотт Б. Фантом в фонеме: инвариантные сигналы для стоп-согласных. Восприятие и психофизика. 1974а; 15: 101–107. [Google Scholar]
  • Коул Р.А., Скотт Б. К теории восприятия речи. Психологический обзор. 1974b; 81: 348–374. [PubMed] [Google Scholar]
  • Конрад Р.Акустические спутанности в непосредственной памяти. Британский журнал психологии. 1964; 55: 75–84. [Google Scholar]
  • Cooper WE. Избирательная адаптация к речи. В: Restle F, Shiffrin RM, Castellan NJ, Lindman HR, Pisoni DB, редакторы. Когнитивная теория. Vol. 1. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1975. [Google Scholar]
  • Darwin DJ. Восприятие речи. В: Carterette EC, Friedman MP, редакторы. Справочник восприятия. Нью-Йорк: Academic Press; 1976. [Google Scholar]
  • Delattre PC, Liberman AM, Cooper FS.Акустические локусы и переходные подсказки для согласных. Журнал Акустического общества Америки. 1955; 27: 769–773. [Google Scholar]
  • Delgutte B. Представление звуков, похожих на речь, в паттернах разряда волокон слухового нерва. Журнал Акустического общества Америки. 1980; 68: 843–857. [PubMed] [Google Scholar]
  • Delgutte B. Некоторые корреляты фонетических различий на уровне слухового нерва. В: Карлсон Р., Гранстрем Б., редакторы. Представление речи в периферической слуховой системе.Нью-Йорк: Elsevier Biomedical Press; 1982. [Google Scholar]
  • Dell GS, Newman JE. Обнаружение фонем в беглой речи. Журнал вербального обучения и вербального поведения. 1980; 19: 608–623. [Google Scholar]
  • Денес П. Влияние длительности на восприятие голоса. Журнал Акустического общества Америки. 1955; 27: 761–764. [Google Scholar]
  • Diehl RL. Детекторы функций для речи: критическая переоценка. Психологический бюллетень. 1981; 89: 1–18. [PubMed] [Google Scholar]
  • Дорман М., Стаддерт-Кеннеди М., Рафаэль Л.Прекращение распознавания согласных: выпуск пакетов и переходов формант как функционально эквивалентных контекстно-зависимых сигналов. Восприятие и психофизика. 1977; 22: 109–122. [Google Scholar]
  • Eimas PD. Слуховая и лингвистическая обработка сигналов о месте артикуляции у младенцев. Восприятие и психофизика. 1974; 16: 513–521. [Google Scholar]
  • Eimas PD, Corbit JD. Выборочная адаптация детекторов лингвистических признаков. Когнитивная психология. 1973; 4: 99–109. [Google Scholar]
  • Eimas PD, Miller JL.Влияние избирательной адаптации на восприятие речи и зрительных образов: данные для детекторов функций. В: Pick HL, Walk RD, редакторы. Восприятие и опыт. Нью-Йорк: Пленум; 1978. [Google Scholar]
  • Eimas PD, Siqueland ER, Jusczyk P, Vigorito J. Восприятие речи у младенцев. Наука. 1971; 171: 303–306. [PubMed] [Google Scholar]
  • Элман Дж. Л., Макклелланд Дж. Л.. Использование законной изменчивости формы сигнала речи. В: Perkell JS, Klatt DH, редакторы. Инвариантность и вариативность речевых процессов.Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1986. [Google Scholar]
  • Elman JL, McClelland JL. Восприятие речи как познавательный процесс: модель интерактивной активации. В: Lass NJ, редактор. Речь и язык: достижения в области фундаментальных исследований и практики. Vol. 10. Нью-Йорк: Academic Press; 1984. С. 337–374. [Google Scholar]
  • Фант Г. Описательный анализ акустических аспектов речи. Логотипы. 1962; 5: 3–17. [PubMed] [Google Scholar]
  • Фант Г. Звуки и особенности речи. Кембридж, Массачусетс: MIT Press; 1973 г.[Google Scholar]
  • Фишер-Йоргенсен Э. Акустический анализ стоп-согласных. Miscellanea Phonetica. 1954; 2: 42–59. [Google Scholar]
  • Fitch HL. Отчет о статусе исследований речи лабораторий Хаскинс. СР-65. Нью-Хейвен: лаборатории Хаскинса; 1981. Отличие временной информации для скорости речи от временной информации для интервокальной остановки согласного голоса; С. 1–32. [Google Scholar]
  • Forster KI. Доступ к ментальному лексикону. В: Wales RJ, Walker E, editors.Новые подходы к языковым механизмам. Амстердам: Северная Голландия; 1976. [Google Scholar]
  • Forster KI. Уровни обработки и структура языкового процессора. В: Cooper WE, Walker ECT, редакторы. Обработка предложений: психолингвистические исследования представлены Мерриллу Гарретту. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1979. [Google Scholar]
  • Foss DJ, Blank MA. Определение речевых кодов. Когнитивная психология. 1980; 12: 1–31. [PubMed] [Google Scholar]
  • Фосс Д. Д., Гернсбахер Массачусетс.Взлом двойного кода: к единой модели идентификации фонем. Журнал вербального обучения и вербального поведения. 1983; 22: 609–632. [Бесплатная статья PMC] [PubMed] [Google Scholar]
  • Foss DJ, Harwood DA, Blank MA. Расшифровка решений декодирования: Данные и устройства. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Foss DJ, Swinney DA. О психологической реальности фонемы: восприятие, идентификация и сознание.Журнал вербального обучения и вербального поведения. 1973; 12: 246–257. [Google Scholar]
  • Фромкин В. Речевые ошибки как лингвистические доказательства. Гаага: Мутон; 1973. [Google Scholar]
  • Фромкин В. Ошибки в языковой деятельности. Нью-Йорк: Academic Press; 1980. [Google Scholar]
  • Fry DW. Восприятие и узнавание. В: Halle M, Lunt HG, McClean H, van Schoonefeld CH, редакторы. Для Романа Якобсона. Гаага: Мутон; 1956. [Google Scholar]
  • Ganong WF. Избирательные эффекты прерывистых остановок.Восприятие и психофизика. 1978; 24: 71–83. [PubMed] [Google Scholar]
  • Гарретт М.Ф. Синтаксические процессы в производстве предложений. В: Wales RJ, Walker E, editors. Новые подходы к языковым механизмам. Амстердам: Северная Голландия; 1976. [Google Scholar]
  • Garrett MF. Уровни обработки в производстве предложений. В: Баттерворт Б., редактор. Языковая продукция. Vol. 1. Нью-Йорк: Academic Press; 1980. [Google Scholar]
  • Goldhor R. Система обработки речевых сигналов, основанная на модели периферического слуха.Труды IEEE. 1983; 1CASSP-83: 1368–1371. [Google Scholar]
  • Halle M. Рассуждения о представлении слов в памяти. В: Фромкин В., редактор. Лингвистическая фонетика: доклады, представленные Питеру Ладефогеду. Нью-Йорк: Academic Press; 1985. [Google Scholar]
  • Halle M, Vergnaud JR. Трехмерная фонология. Журнал лингвистических исследований. 1980; 1: 83–105. [Google Scholar]
  • House AS. По длительности гласного. Журнал Акустического общества Америки. 1961; 33: 1174–1178.[Google Scholar]
  • Johnson-Laird PN. Значение и ментальная лексика. В: Кеннеди А., Уилкс А., редакторы. Исследования долговременной памяти. Лондон: Wiley; 1975. С. 123–142. [Google Scholar]
  • Joos MA. Акустическая фонетика. Язык. 1948; 24 (Дополнение): 1–136. [Google Scholar]
  • Кан Д. Слоговые обобщения в английской фонологии. Блумингтон, Индиана: Клуб лингвистики Университета Индианы; 1976. [Google Scholar]
  • Кенстович М., Киссеберт К. Генеративная фонология.Нью-Йорк: Academic Press; 1979. [Google Scholar]
  • Klatt DH. Структура путаницы в кратковременной памяти между английскими согласными. Журнал Акустического общества Америки. 1968; 44: 401–407. [PubMed] [Google Scholar]
  • Клатт DH. Обзор проекта по пониманию речи ARPA. Журнал Акустического общества Америки. 1977; 62: 1345–1366. [Google Scholar]
  • Klatt DH. Восприятие речи: модель акустико-фонетического анализа и лексического доступа. Журнал фонетики.1979; 7: 279–312. [Google Scholar]
  • Klatt DH. Восприятие речи: модель акустико-фонетического анализа и лексического доступа. В: Коул Р.А., редактор. Восприятие и воспроизведение беглой речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1980. [Google Scholar]
  • Klatt DH. Стратегии обработки речи на основе слуховых моделей. В: Карлсон Р., Гранстрем Б., редакторы. Представление речи в периферической слуховой системе. Нью-Йорк: Elsevier Biomedical Press; 1982. [Google Scholar]
  • Liberman AM, Cooper FS, Shankweiler DP, Studdert-Kennedy M.Восприятие речевого кода. Психологический обзор. 1967; 74: 431–461. [PubMed] [Google Scholar]
  • Либерман AM, Delattre PC, Cooper FS. Роль выбранных переменных стимула в восприятии глухих согласных звуков. Американский журнал психологии. 1952; 52: 127–137. [PubMed] [Google Scholar]
  • Либерман AM, Delattre PC, Cooper FS, Gerstman LH. Роль переходов согласный-гласный в восприятии стоповых и носовых согласных. Психологические монографии. 1954; 68: 1–13.[Google Scholar]
  • Либерман И.Ю., Шанквейлер Д., Фишер Ф.В., Картер Б. Явная сегментация слогов и фонем у детей младшего возраста. Журнал экспериментальной детской психологии. 1974; 18: 201–212. [Google Scholar]
  • Лискер Л. Продолжительность закрытия и различие между голосом и голосом в английском языке. Язык. 1957; 33: 42–49. [Google Scholar]
  • Отчет лаборатории Лискера Л. Хаскинса о статусе исследования речи. СР-65. Нью-Хейвен: лаборатории Хаскинса; 1978. Rapid vs rabid: каталог акустических характеристик, которые могут указывать на различие; стр.127–132. [Google Scholar]
  • Лискер Л., Абрамсон А.С. Межъязыковое исследование озвучивания в начальных остановках: акустические измерения. Слово. 1964; 20: 384–422. [Google Scholar]
  • Luce PA. Исследование восприятия речи, технический отчет № 6. Блумингтон, штат Индиана: Департамент психологии, Лаборатория исследования речи; 1986. Окрестности слов в ментальном лексиконе. [Google Scholar]
  • Marslen-Wilson WD. Параллельная обработка речи при распознавании слов. Познание. 1987; 25 в этом выпуске.[PubMed] [Google Scholar]
  • Марслен-Уилсон В.Д., Тайлер Л.К. Временная структура понимания разговорной речи. Познание. 1980; 8: 1–71. [PubMed] [Google Scholar]
  • Марслен-Уилсон В.Д., Уэлш А. Обработка взаимодействий и лексический доступ во время распознавания слов в непрерывной речи. Когнитивная психология. 1978; 10: 29–63. [Google Scholar]
  • Massaro DW, Oden GC. Восприятие речи: рамки для исследований и теории. В: Lass NJ, редактор. Речь и язык: достижения в области фундаментальных исследований и практики.Vol. 3. Нью-Йорк: Academic Press; 1980. С. 129–165. [Google Scholar]
  • McClelland JL, Elman JL. Модель восприятия речи TRACE. Когнитивная психология. 1986; 18: 1–86. [PubMed] [Google Scholar]
  • McClelland JL, Rumelhart DE. Модель интерактивной активации контекстных эффектов в восприятии букв, Часть I: Изложение основных результатов. Психологический обзор. 1981; 88: 375–407. [Google Scholar]
  • Miller GA. Единицы принятия решений в восприятии речи. Сделки IRE по теории информации.1962; ИТ-8: 81–83. [Google Scholar]
  • Miller GA, Johnson-Laird PN. Язык и восприятие. Кембридж, Массачусетс: издательство Гарвардского университета; 1976. [Google Scholar]
  • Миллер Г.А., Nicely PE. Анализ путаницы восприятия некоторых английских согласных. Журнал Акустического общества Америки. 1955; 27: 338–352. [Google Scholar]
  • Миллер М.И., Сакс МБ. Представление стоп-согласных в образцах разряда волокон слухового нерва. Журнал Акустического общества Америки.1983; 74: 502–517. [PubMed] [Google Scholar]
  • Мортон Дж. Взаимодействие информации при распознавании слов. Психологический обзор. 1969; 76: 165–178. [Google Scholar]
  • Мортон Дж. Распознавание слов. В: Мортон Дж., Маршалл Дж. Д., редакторы. Психолингвистика 2: Структуры и процессы. Кембридж, Массачусетс: MIT Press; 1979. С. 107–156. [Google Scholar]
  • Мортон Дж. Распад словарного запаса: подход к обработке информации. В: Mehler J, Walker E, Garrett M, редакторы. О мысленном представлении.Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1982. [Google Scholar]
  • Мортон Дж., Лонг Дж. Влияние вероятности перехода слова на идентификацию фонем. Журнал вербального обучения и вербального поведения. 1976; 15: 43–52. [Google Scholar]
  • Oshika BT, Zue VW, Weeks RV, Neu H, Aurbach J. Роль фонологических правил в исследованиях понимания речи. Транзакции IEEE по акустической речи и обработке сигналов, ASSP-1975; 23: 104–112. [Google Scholar]
  • Pisoni DB. Восприятие речи. В: Эстес В.К., редактор.Справочник по обучению и познавательным процессам. Vol. 6. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1978. [Google Scholar]
  • Pisoni DB. В защиту сегментарных представлений при обработке речи. Журнал Акустического общества Америки. 1983; 69: S32. [Google Scholar]
  • Pisoni DB. Восприятие речи: некоторые новые направления в исследованиях и теории. Журнал Акустического общества Америки. 1985; 78: 381–388. [Бесплатная статья PMC] [PubMed] [Google Scholar]
  • Pisoni DB, Nusbaum HC, Luce PA, Slowiaczek LM.Восприятие речи, распознавание слов и структура лексики. Речевое общение. 1985. 4: 75–95. [Бесплатная статья PMC] [PubMed] [Google Scholar]
  • Pisoni DB, Sawusch JR. Некоторые этапы обработки в восприятии речи. В: Коэн А., Ноутебум С., редакторы. Структура и процесс восприятия речи. Гейдельберг: Springer-Verlag; 1975. С. 16–34. [Google Scholar]
  • Порт РФ. Влияние темпа речи на длительность ударной гласной и медиальной остановки в английских хорейных словах.Блумингтон, Индиана: Клуб лингвистики Университета Индианы; 1977 г. [Google Scholar]
  • Порт РФ. Влияние темпа на длительность закрытия стопа как сигнал для озвучивания и места. Журнал фонетики. 1979; 7: 45–56. [Google Scholar]
  • Raphael LJ. Длительность предшествующих гласных как сигнал к восприятию характеристик голоса согласных в конце слова в американском английском. Журнал Акустического общества Америки. 1972; 51: 1296–1303. [PubMed] [Google Scholar]
  • Рафаэль Л.Дж., Дорман М.Ф.Молчание как сигнал к восприятию согласных, состоящих из начала и конца слога. Журнал фонетики. 1980; 8: 269–275. [Google Scholar]
  • Прочтите C. Знание фонологии английского языка детьми дошкольного возраста. Harvard Educational Review. 1971; 41: 1–34. [Google Scholar]
  • Reddy DR. Распознавание речи машиной: обзор. Труды IEEE. 1976; 64: 501–523. [Google Scholar]
  • Remez RE. Адаптация границы категорий между речью и неречием: аргументы против детекторов признаков.Когнитивная психология. 1979; 11: 38–57. [PubMed] [Google Scholar]
  • Розин П., Глейтман Л.Р. Структура и овладение чтением II: процесс чтения и освоение алфавитного принципа. В: Ребер А.С., Скарборо Д.Л., редакторы. К психологии чтения. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1977 г. [Google Scholar]
  • Sachs MB, Young ED. Кодирование устойчивых гласных в слуховом нерве: представление с точки зрения скорости разряда. Журнал Акустического общества Америки.1979; 66: 470–479. [PubMed] [Google Scholar]
  • Samuel AG. Восстановление фонематики: выводы из новой методологии. Журнал экспериментальной психологии: Общие. 1981a; 110: 474–494. [PubMed] [Google Scholar]
  • Samuel AG. Роль восходящего подтверждения в иллюзии восстановления фонемы. Журнал экспериментальной психологии: человеческое восприятие и производительность. 1981b; 7: 1124–1131. [PubMed] [Google Scholar]
  • Сапир Э. Психологическая реальность фонем. В: Мандельбаум Д., редактор.Избранные произведения Эдварда Сепира. Беркли: Калифорнийский университет Press; 1963. [Google Scholar]
  • Sawusch JR. Периферические и центральные процессы в избирательной адаптации места артикуляции стоп-согласных. Журнал Акустического общества Америки. 1977a; 62: 738–750. [PubMed] [Google Scholar]
  • Sawusch JR. Обработка размещает информацию в стоп-согласных. Восприятие и психофизика. 1977b; 22: 417–426. [Google Scholar]
  • Sawusch JR, Jusczyk PW. Адаптация и контраст в восприятии озвучивания.Журнал экспериментальной психологии: человеческое восприятие и производительность. 1981; 7: 408–421. [PubMed] [Google Scholar]
  • Сирл К.Л., Джейкобсон Дж. Ф., Реймент С. Г.. Прекратить различение согласных на основе человеческого прослушивания. Журнал Акустического общества Америки. 1979; 65: 799–809. [PubMed] [Google Scholar]
  • Селкирк Э. Роль просодических категорий в словесном ударении в английском языке. Лингвистический запрос. 1980; 11: 563–603. [Google Scholar]
  • Shattuck-Hufnagel S, Klatt DH. Ограниченное использование отличительных черт и маркировки в производстве речи: доказательства из данных ошибок речи.Журнал вербального обучения и вербального поведения. 1979; 18: 41–45. [Google Scholar]
  • Stemberger JP. Неопубликованная докторская диссертация. Калифорнийский университет; Сан-Диего: 1982. Лексика в модели языкового производства. [Google Scholar]
  • Стивенс К.Н. Акустические корреляты некоторых фонетических категорий. Журнал Акустического общества Америки. 1980; 68: 836–842. [PubMed] [Google Scholar]
  • Стивенс К.Н., Блюмштейн С.Е. Неизменные признаки места артикуляции в стоп-согласных.Журнал Акустического общества Америки. 1978; 64: 1358–1368. [PubMed] [Google Scholar]
  • Стивенс К.Н., Блюмштейн С.Е. Поиск инвариантных акустических коррелятов фонетических признаков. В: Эймас П.Д., Миллер Дж.Л., редакторы. Перспективы изучения речи. Хиллсдейл, штат Нью-Джерси: Эрлбаум; 1981. [Google Scholar]
  • Стивенс К.Н., Клатт Д.Х. Роль формантных переходов в различении голоса и голоса для остановок. Журнал Акустического общества Америки. 1974; 55: 653–659. [PubMed] [Google Scholar]
  • Стивенс К.Н., House AS.Восприятие речи. В: Тобиас Дж., Редактор. Основы современной слуховой теории. II. Нью-Йорк: Academic Press; 1972. [Google Scholar]
  • Студдерт-Кеннеди М. Восприятие речи. В: Себеок Т.А., редактор. Современные тенденции в лингвистике. Гаага: Мутон; 1974. [Google Scholar]
  • Studdert-Kennedy M. Восприятие речи. В: Lass NJ, редактор. Современные проблемы экспериментальной фонетики. Нью-Йорк: Academic Press; 1976. [Google Scholar]
  • Стаддерт-Кеннеди М. Восприятие речи.Язык и речь. 1980; 23: 45–66. [PubMed] [Google Scholar]
  • Саммерфилд К., Хаггард, член парламента. Перцепционная обработка нескольких сигналов и контекстов: эффекты следующей гласной после прекращения произнесения согласных. Журнал фонетики. 1974; 2: 279–295. [Google Scholar]
  • Трейман Р. Неопубликованная докторская диссертация. Пенсильванский университет; 1980. Способность дошкольников к фонематическому анализу. [Google Scholar]
  • Трейман Р. Структура разговорных слогов: данные из новых словесных игр.Познание. 1983; 15: 49–74. [PubMed] [Google Scholar]
  • Трейман Р. Начало и время как единицы произносимых слогов: свидетельства детей. Журнал экспериментальной детской психологии. 1985; 39: 161–181. [PubMed] [Google Scholar]
  • Ван, доктор медицины, Билгер Р. Путаница согласных в шуме: исследование особенностей восприятия. Журнал Акустического общества Америки. 1973; 54: 1248–1266. [PubMed] [Google Scholar]
  • Уоррен Р.М. Восприятие утраченных звуков речи. Наука.1970; 176: 392–393. [PubMed] [Google Scholar]
  • Викельгрен, Вашингтон. Акустическое сходство и ретроактивная интерференция в кратковременной памяти. Журнал вербального обучения и вербального поведения. 1965; 4: 53–61. [Google Scholar]
  • Викельгрен, Вашингтон. Фонематическое сходство и интерференция в кратковременной памяти для отдельных букв. Журнал экспериментальной психологии. 1966; 71: 396–404. [PubMed] [Google Scholar]
  • Викельгрен, Вашингтон. Контекстно-зависимое кодирование, ассоциативная память и последовательный порядок в (речевом) поведении.Психологический обзор. 1969; 76: 1–15. [Google Scholar]
  • Викельгрен, Вашингтон. Фонетическая кодировка и порядковый номер. В: Carterette EC, Friedman MP, редакторы. Справочник восприятия. Vol. 7. Нью-Йорк: Academic Press; 1976. [Google Scholar]
  • Young ED, Sachs MB. Представление устойчивых гласных во временных аспектах паттернов разряда популяций слуховых нервных волокон. Журнал Акустического общества Америки. 1979; 66: 1381–1403. [PubMed] [Google Scholar]
  • Цвикер Э., Терхардт Э., Паулюс Э.Автоматическое распознавание речи с использованием психоакустических моделей. Журнал Акустического общества Америки. 1979; 65: 487–498. [PubMed] [Google Scholar]

%! PS-Adobe-3.0 %% Заголовок: stdin %%Для: %% Создатель: a2ps версии 4.13 %% CreationDate: 19 сен, пт, 13:38:48 2003 %% BoundingBox: 24 24 571 818 %% DocumentData: Clean7Bit %% Ориентация: книжная %% Страниц: 10 %% PageOrder: Ascend %% DocumentMedia: A4 595 842 0 () () %% DocumentNeededResources: шрифт Courier %% + шрифт Courier-Bold %% + шрифт Courier-BoldOblique %% + шрифт Courier-Oblique %% + шрифт Helvetica %% + шрифт Helvetica-Bold %% + символ шрифта %% + шрифт Times-Bold %% + шрифт Times-Roman %% DocumentProcessColors: Черный %% DocumentSuppliedResources: procset a2ps-a2ps-hdr %% + procset a2ps-black + white-Prolog %% + кодировка ISO-8859-1Encoding %% EndComments / a2psdict 200 dict def a2psdict начать %% BeginProlog %% Авторские права: (c) 1988, 89, 90, 91, 92, 93 Мигель Сантана %% Авторские права: (c) 1995, 96, 97, 98 Аким Демайль, Мигель Сантана % Проверить уровень языка PostScript./ languagelevel where { pop / gs_languagelevel languagelevel def } { / gs_languagelevel 1 def } если еще % Импорта EPSF как в Красной книге / BeginInclude { / b4_Inc_state save def% Сохранить состояние для очистки / dict_count countdictstack def% Подсчет объектов в стеке dict / op_count count 1 sub def% Подсчет объектов в стеке операндов userdict начать 0 setgray 0 setlinecap 1 setlinewidth 0 setlinejoin 10 setmiterlimit [] 0 setdash newpath gs_languagelevel 1 ne { false setstrokeadjust false setoverprint } если } привязать def / EndInclude { count op_count sub {pos} repeat% Очистить стеки countdictstack dict_count sub {end} повторять b4_Inc_state восстановить } привязать def / BeginEPSF { BeginInclude / showpage {} def } привязать def / EndEPSF { EndInclude } привязать def % Предварительная загрузка страницы / page_prefeed {% bool -> — statusdict / prefeed known { statusdict exch / prefeed exch put } { поп } если еще } привязать def / deffont { findfont exch scalefont def } привязать def / reencode_font { findfont reencode 2 скопировать definefont pop def } привязать def % Функция c-show (str => -) % центрирует текст только по оси x./ c-show { dup stringwidth pop 2 div neg 0 rmoveto шоу } привязать def % Функция l-show (str => -) % печатает текст так, что он заканчивается в текущей точке / l-show { dup stringwidth pop neg 0 rmoveto показать } привязать def % выставление по центру (str w => -) % отображаются по центру, а текущий шрифт масштабируется так, чтобы ширина была меньше w / cfshow { exch dup stringwidth pop % Если заголовок слишком большой, попробуйте уменьшить его 3 2 рулона 2 копии gt {% if, т.е. слишком большой exch div текущий шрифт exch scalefont setfont } { % если еще поп-поп } если еще c-show% center title } привязать def % Вернуть размер y текущего шрифта % — => размер шрифта / currentfontsize { currentfont / FontType получить 0 eq { currentfont / FontMatrix получить 3 получить } { currentfont / FontMatrix получить 3 получить 1000 муль } если еще } привязать def % перекодировать шрифт % -> / перекодировать {% def длина дублирования 5 добавить дикт начало { %для всех 1 индекс / FID ne {def} {pop pop} ifelse } для всех / Кодирование exch def % Используйте ограничивающую рамку шрифта, чтобы определить подъем, спуск, % и общая высота; не забывайте, что эти ценности должны быть % преобразован с использованием матрицы шрифта.% Мы используем `load ‘, потому что иногда BBox является исполняемым, а иногда — нет. % Поскольку нам нужно 4 числа, а не массив, избегайте выполнения BBox / FontBBox загрузить всплывающее окно загрузки Преобразование FontMatrix / Ascent exch def pop Преобразование FontMatrix / Descent exch def pop / FontHeight Ascent Descent sub def % Определите их на случай, если их нет в FontInfo (также здесь % до них легче добраться. / UnderlinePosition 1 def / UnderlineThickness 1 def % Получите положение и толщину подчеркивания, если они определены.currentdict / FontInfo known { FontInfo dup / UnderlinePosition known { dup / UnderlinePosition получить 0 exch FontMatrix transform exch pop / UnderlinePosition exch def } если dup / UnderlineThickness known { / UnderlineThickness получить 0 exch FontMatrix transform exch pop / UnderlineThickness exch def } если } если текущий конец } привязать def % составных шрифтов для смешанной строки ASCII-EUC % Версия 1.2 31.01.1990 % Orignal Ken’ichi HANDA (handa @ etl.go.jp) % Модифицированный Норио Катаяма ([email protected]), 1998 г. % Extend & Fix Кодзи Накамару ([email protected]), 1999 г. % Кто угодно может свободно копировать, изменять, распространять эту программу. / copyfont {% font-dic количество дополнительных записей copyfont font-dic 1 максимальная длина индекса добавить начало словаря {1 index / FID ne 2 index / UniqueID ne и {def} {pop pop} ifelse } для всех текущий конец } привязать def / Compositefont {% ASCIIFontName EUCFontName RomanScale RomanOffset Rot (T / F) составной шрифт шрифта / RomanRotation exch def / RomanOffset exch def / RomanScale exch def userdict / fixeucfont_dict известно не { userdict начать / fixeucfont_dict 2 начало диктовки / UpperByteEncoding [ 16 # 00 1 16 # 20 {pop 0} для 16 # 21 1 16 # 28 {16 # 20 sub} для 16 # 29 1 16 # 2F {pop 0} для 16 # 30 1 16 # 74 {16 # 27 sub} для 16 # 75 1 16 # FF {pop 0} для ] def / LowerByteEncoding [ 16 # 00 1 16 # A0 {pop /.notdef} для 16 # A1 1 16 # FE {16 # 80 sub 16 2-струнные записи (cXX) dup 1 4 -1 рулон putinterval cvn} для /.notdef ] def текущий конец определения конец } если findfont dup / FontType get 0 eq { 14 дикт начало % % 7 + 8-битный шрифт EUC % 12 дикт начать / EUCFont exch def / FontInfo (7 + 8-битный шрифт EUC) только для чтения def / PaintType 0 def / FontType 0 def / FontMatrix matrix def % / FontName / Кодирование fixeucfont_dict / UpperByteEncoding получить def / FMapType 2 def EUCFont / WMode известен {EUCFont / WMode get / WMode exch def} {/ WMode 0 def} ifelse / FDepVector [ EUCFont / FDepVector получить 0 получить [16 # 21 1 16 # 28 {} для 16 # 30 1 16 # 74 {} для] { 13 дикт начать / EUCFont EUCFont def / UpperByte exch 16 # 80 добавить определение % / FontName / FontInfo (младший байтовый шрифт EUC) только для чтения def / PaintType 0 def / FontType 3 def / FontMatrix matrix def / FontBBox {0 0 0 0} def / Кодирование fixeucfont_dict / LowerByteEncoding получить определение % /Уникальный идентификатор % / WMode / BuildChar { gsave exch dup / EUCFont получить setfont / UpperByte получить 2 струны dup 0 4 -1 рулон положить dup 1 4 -1 рулон положить dup stringwidth setcharwidth 0 0 двигатьсяпоказать Grestore } привязать def текущий конец / lowerbytefont exch definefont } для всех ] def текущий конец / eucfont exch definefont обменять findfont 1 copyfont dup начало RomanRotation { / FontMatrix FontMatrix [0 RomanScale neg RomanScale 0 RomanOffset neg 0] матрица concatrix def } { / FontMatrix FontMatrix [RomanScale 0 0 RomanScale 0 RomanOffset] матрица concatmatrix def / CDevProc {pop pop pop pop 0 exch -1000 exch 2 div 880} def } если еще конец / asciifont exch definefont обменять / FDepVector [4 2 ролика] def / FontType 0 def / WMode 0 def / FMapType 4 def / FontMatrix matrix def / Кодировка [0 1] по умолчанию / FontBBox {0 0 0 0} def % / FontHeight 1.0 по умолчанию% XXXX / FontHeight RomanScale 1.0 ge {RomanScale} {1.0} ifelse def / Спуск -0,3 по умолчанию% XXXX текущий конец / tmpfont exch definefont поп / tmpfont findfont } { pop findfont 0 copyfont } если еще } def / slantfont {% FontName наклонный шрифт slantfont ‘ exch findfont 1 copyfont начало [1 0 4 -1 roll 1 0 0] FontMatrix exch matrix concatmatrix / FontMatrix exch def текущий конец } def % Номер строки печати функции (# -) / # { gsave sx cw mul neg 2 div 0 rmoveto f # setfont c-шоу Grestore } привязать def % ——— Некоторые процедуры для подсветки простых ч / б распечаток ——— % Подчеркивание % ширина — / dounderline { текущая точка gsave двигаться 0 currentfont / Descent получить текущий размер шрифта mul rmoveto 0 рлинето Инсульт Grestore } привязать def % Подчеркнуть строку % нить — / dounderlinestring { ширина строки поп нижняя линия } привязать def / UL { / ul exch store } привязать def % Нарисуйте рамку ШИРИНЫ относительно текущего шрифта % ширина — / dobox { текущая точка gsave новый путь двигаться 0 currentfont / Descent получить текущий размер шрифта mul rmoveto dup 0 rlineto 0 currentfont / FontHeight получить множитель текущего размера шрифта neg 0 rlineto близкий путь Инсульт Grestore } привязать def / BX { / bx exch store } привязать def % Вставить строку % нить — / doboxstring { ширина строки поп dobox } привязать def % % ————- Цветовые процедуры ————— % / FG / setrgbcolor load def % Нарисуйте фон % ширина — / dobackground { текущая точка gsave новый путь двигаться 0 currentfont / Descent получить текущий размер шрифта mul rmoveto dup 0 rlineto 0 currentfont / FontHeight получить множитель текущего размера шрифта neg 0 rlineto близкий путь bgcolor загрузить pop setrgbcolor наполнять Grestore } привязать def % Draw bg для строки % нить — / dobackgroundstring { ширина строки поп dobackground } привязать def / BG { магазин dup / bg exch {mark 4 1 roll] / bgcolor exch store}, если } привязать def /Шоу { bg {dup dobackgroundstring} если ul {dup dounderlinestring} если bx {dup doboxstring}, если шоу } привязать def % Функция T (ab), переход к n-ой таблице в текущей строке / T { cw mul x0 добавить bg {dup currentpoint pop sub dobackground} если ul {dup currentpoint pop sub dounderline}, если bx {дублировать текущую точку pop sub dobox}, если y0 moveto } привязать def % Функция n: перейти к следующей строке / n { / y0 y0 дополнительный магазин BFS x0 y0 перейти } привязать def % Функция N: показать и перейти к следующей строке / N { Шоу / y0 y0 дополнительный магазин BFS x0 y0 перейти } привязать def / S { Шоу } привязать def %% BeginResource: procset a2ps-a2ps-hdr 2.0 2 %% Авторские права: (c) 1988, 89, 90, 91, 92, 93 Мигель Сантана %% Авторские права: (c) 1995, 96, 97, 98 Аким Демайль, Мигель Сантана % Название функции: печатает заголовок страницы. % передаются как аргумент /заглавие { % 1. Нарисуйте фон x v получить y v получить moveto gsave 0 th 2 div neg rmoveto ширина набора 0,95 сетгрей pw 0 rlinto инсульт Grestore % 2. Граница gsave 0,7 setlinewidth pw 0 rlineto 0-й негр. pw neg 0 rlineto ход на близком расстоянии Grestore % stk: ct rt lt x v получить y v получить th sub 1 добавить moveto %% IncludeResource: шрифт Helvetica fHelvetica fnfs 0.8 набор шрифтов mul scalefont % 3. Левый заголовок gsave dup stringwidth pop fnfs 0.8 mul add exch% оставить место в стеке fnfs 0.8 муль hm rmoveto показать% левый заголовок Grestore обменять % stk: ct ltw rt % 4. правильный заголовок gsave dup stringwidth pop fnfs 0.8 mul add exch% оставить место в стеке обман pw exch stringwidth pop fnfs 0.8 mul add sub хм Rmoveto показать% правый заголовок Grestore % stk: ct ltw rtw % 5. центральный заголовок gsave pw 3 1 рулон % stk: ct pw ltw rtw 3 копии % Перейти в центр левой комнаты sub добавить 2 div hm rmoveto % Какое здесь свободное место? добавить sub fnfs 0.8 муль sub fnfs 0.8 муль sub % stk: ct space_left %% IncludeResource: шрифт Helvetica-Bold fHelvetica-Bold fnfs scalefont setfont cfshow Grestore } привязать def % Function border: печатает границу виртуальной страницы / border {% def gsave% печать с четырех сторон 0 сетгрей x v получить y v получить moveto 0,7 сетлин Ширина% квадрата pw 0 rlineto 0 ph neg rlineto pw neg 0 rlineto ход на близком расстоянии Grestore } привязать def % Функция воды: печать водяного знака в фоновом режиме / water {% def gsave scx scy moveto повернуть %% IncludeResource: шрифт Times-Bold fTimes-Bold 100 scalefont setfont .97 сет серый dup stringwidth pop 2 div neg -50 rmoveto шоу Grestore } привязать def % Функция rhead: печатает правый заголовок / rhead {% def lx ly moveto fHelvetica fnfs 0.8 mul scalefont setfont л-шоу } привязать def % Нижний колонтитул функции (cf rf lf -> -) / footer { fHelvetica fnfs 0.8 mul scalefont setfont dx dy moveto шоу snx sny moveto л-шоу fnx fny moveto c-шоу } привязать def %% EndResource %% BeginResource: procset a2ps-black + white-Prolog 2.0 1 % Функция T (ab), переход к n-ой таблице в текущей строке / T { cw mul x0 добавить y0 moveto } привязать def % Функция n: перейти к следующей строке / n {% def / y0 y0 дополнительный магазин BFS x0 y0 перейти } привязать def % Функция N: показать и перейти к следующей строке / N { Шоу / y0 y0 дополнительный магазин BFS x0 y0 перейти } привязать def / S { Шоу } привязать def /п { ложный UL ложный BX fCourier bfs scalefont setfont Шоу } привязать def / sy { ложный UL ложный BX fSymbol bfs scalefont setfont Шоу } привязать def / k { ложный UL ложный BX fCourier-Oblique bfs scalefont setfont Шоу } привязать def / K { ложный UL ложный BX fCourier-Bold bfs scalefont setfont Шоу } привязать def / c { ложный UL ложный BX fCourier-Oblique bfs scalefont setfont Шоу } привязать def / C { ложный UL ложный BX fCourier-BoldOblique bfs scalefont setfont Шоу } привязать def / l { ложный UL ложный BX fHelvetica bfs scalefont setfont Шоу } привязать def / L { ложный UL ложный BX fHelvetica-Bold bfs scalefont setfont Шоу } привязать def / str { ложный UL ложный BX fTimes-Roman bfs scalefont setfont Шоу } привязать def / e { ложный UL истинный BX fHelvetica-Bold bfs scalefont setfont Шоу } привязать def %% EndResource %% EndProlog %% BeginSetup %% IncludeResource: шрифт Courier %% IncludeResource: шрифт Courier-Oblique %% IncludeResource: шрифт Courier-Bold %% IncludeResource: шрифт Times-Roman %% IncludeResource: символ шрифта %% IncludeResource: шрифт Courier-BoldOblique %% BeginResource: кодирование ISO-8859-1Encoding / ISO-8859-1 Кодирование [ /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef / пробел / восклицательный / quotedbl / numbersign / доллар / процент / амперсанд / quoteright / parenleft / parenright / звездочка / плюс / запятая / минус / точка / косая черта / ноль / один / два / три / четыре / пять / шесть / семь / восемь / девять / двоеточие / точка с запятой / меньше / равно / больше / вопрос / в / A / B / C / D / E / F / G / H / I / J / K / L / M / N / O / P / Q / R / S / T / U / V / W / X / Y / Z / скобка слева / обратная косая черта / скобка справа / asciicircum / подчеркивание / quoteleft / a / b / c / d / e / f / g / ч / я / дж / к / л / м / н / о / п / д / р / с / т / н / в / ш / x / y / z / braceleft / bar / braceright / asciitilde /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef /.notdef / пробел / восклицательный знак / цент / фунт / валюта / иена / сломанная полоса / раздел / dieresis / copyright / ordfeminine / guillemotleft / logicnot / дефис / зарегистрированный / макрон / степень / плюс минус / два верхних / три верхних / острый / мю / абзац / пуля / cedilla / onesuperior / ordmasculine / guillemotright / одна четверть / одна половина / три четверти / questiondown / Agrave / Aacute / Acircumflex / Atilde / Adieresis / Aring / AE / Ccedilla / Egrave / Eacute / Ecircumflex / Edieresis / Igrave / Iacute / Icircumflex / Idieresis / Eth / Ntilde / Ograve / Oacute / Ocircumflex / Otilde / Odieresis / умножение / Oslash / Ugrave / Uacute / Ucircumflex / Udieresis / Yacute / Thorn / germandbls / agrave / aacute / acircumflex / atilde / adieresis / aring / ae / ccedilla / egrave / eacute / ecircumflex / edieresis / igrave / iacute / icircumflex / idieresis / eth / ntilde / ograve / oacute / ocircumflex / otilde / odieresis / div / oslash / ugrave / uacute / ucircumflex / udieresis / yacute / thorn / ydieresis ] def %% EndResource % Инициализировать переменные описания страницы./ sh 842 def / sw 595 def / llx 24 def / urx 571 def / ury 818 def / lly 24 def / # копирует 1 def / th 0,000000 по умолчанию / fnfs 11 def / bfs 11.199836 деф / cw 6.719901 def % Словарь для поддержки ISO-8859-1 / iso1dict 8 dict начало / fCourier ISO-8859-1Encoding / Courier reencode_font / fCourier-Bold ISO-8859-1Encoding / Courier-Bold reencode_font / fCourier-BoldOblique ISO-8859-1Encoding / Courier-BoldOblique reencode_font / fCourier-Oblique ISO-8859-1Encoding / Courier-Oblique reencode_font / fHelvetica ISO-8859-1Encoding / Helvetica reencode_font / fHelvetica-Bold ISO-8859-1Encoding / Helvetica-Bold reencode_font / fTimes-Bold ISO-8859-1Encoding / Times-Bold reencode_font / fTimes-Roman ISO-8859-1Encoding / Times-Roman reencode_font currentdict конец def / bgcolor [0 0 0] по умолчанию / bg false def / ul ложное определение / bx false def % Шрифт для нумерации строк / f # / Helvetica findfont bfs.6 масштабных шрифтов def / fSymbol / Символ findfont def / hm fnfs 0,25 муль по деф. / pw cw 81.400000 муль def / ph 791.828389-е доп. def / pmw 0 def / pmh 0 по умолчанию / v 0 по умолчанию /Икс [ 0 ] def / г [ pmh ph добавить 0 mul ph добавить ] def / scx sw 2 div def / scy sh 2 div def / snx urx def / sny lly 2 добавить защиту / dx llx def / dy sny def / fnx scx def / fny dy def / lx snx def / лы уры фнфс 0.8 муль sub def / sx 0 по умолчанию / tab 8 def / x0 0 по умолчанию / y0 0 def %% EndSetup %% Стр .: (1) 1 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти () p n (Синтез связанной речи) N () N (Джон Коулман) N (Фонетическая лаборатория Оксфордского университета) N () N () N (1. Введение) N () N (В этой статье я сообщу о последних расширениях) N (архитектура неконкатенативного синтеза речи, используемая в) N (Системы YorkTalk и IPOX \ (Coleman 1992a, 1994, Local 1992, Dirksen) N (и Coleman 1994 \). Эти системы до настоящего времени не были отмечены для) N (многословие: наши основные цели заключались в том, чтобы достичь максимума) N (естественно звучащая речь что умеем, а так же решаем техническую) N (проблемы, возникающие при использовании несегментарной фонологической информации) N (представления в синтезе речи.) N () N (Однако некоторые работы, направленные на достижение непрерывной речи, имеют) N (уже сообщалось. Local \ (1992 \) представил фонологический анализ) N (ассимиляции вместо артикуляции на границах слов, которые,) N (при использовании в YorkTalk было получено несколько убедительных примеров) N (ассимилированные формы в сочетании. Coleman \ (1994 \) дал синопсис) N (наш подход к синтезу произвольно длинных многосложных слов,) N (задание, которое включает 1 \) слоговое, просодическое \ (метрическое \) и) N (морфологический разбор; 2 \) фонетическая интерпретация частей слога,) N (слоги и метрические ноги; 3 \) плавное соединение метрических) N (ноги.Здесь я продвигаю это направление исследований на два небольших шага) N (далее, и сообщаем о 1 \) синтез редукции гласных \ (schwa) N (формирование \) и слоговые соноры, и 2 \) синтез метрических стоп) N (через границы слов. Я начну с краткого обзора) N (стандартная архитектура для синтеза по правилам.) N () N () N (2. Стандартная модель связного синтеза речи) N () N (Стандартная архитектура синтеза по правилам \ (например, MITalk; Аллен и др.) N (al. 1987 \) является сегментарным и словообразовательным.То есть используемые единицы) N (в фонологическом, фонетическом и даже параметрическом представлениях есть) N (короткие сегменты речи размером с согласный и гласный. Сегменты в) N (разные уровни \ (фонологический, фонетический и параметрический, возможно также) N (орфографические \) связаны друг с другом применением упорядоченного) N (последовательность правил перезаписи. В вычислительном отношении системы такого типа) N (состоят из каскада конечных преобразователей, каждый из которых) N (преобразователь вычисляет действие одного правила.В качестве идеализации мы) N (рассматривать стандартную архитектуру преобразования текста в речь как прозрачную) N (реализация фонологии в стиле SPE.) N () N (Например, рассмотрим синтез слов «фотография»,) N («фотограф» и «фотографический». Морфологический анализ \ (например, MITalk) N (DECOMP, в первую очередь программа удаления аффиксов \) в орфографическом) N (уровень сегментирует эти орфографические строки в «фотографию»,) N («фотография + ер» и «фотография + ic» соответственно. Графемы) N (орфографическая основа «фотография» может быть отображена на систематические фонемы) N (набором правил преобразования графемы в фонемы в стиле SPE, чтобы получить e.г. 🙂 N () N () S 8 T (Графемы 🙂 S 24 T (фотографии) S 56 T (er) S 64 T (i c) N () S 8 T (Фонемы 🙂 S 24 T (f O t O g r a f @ i k) N () N (Фонематическая основа / fOtOgraf /, с тремя полными гласными, первые две из) N (которые являются временными, это единственное лежащее в основе абстрактное лексическое) N (представление, инвариантное для всех трех форм «фотография»,) N («фотограф» и «фотографический». Таким образом, он имеет достоинства) N (общность, но это не поверхностно, поскольку ни одна из этих трех форм) N (имеет две напряженные гласные, за которыми следует третья полная гласная.Всего три) N (поверхностные формы, хотя бы одна из гласных приведена. Следовательно, а) N (набор правил построения конструкции \ (например, определение напряжений \) и) N (правила изменения структуры \ (например, сдвиг гласных, дифтонгизация, гласные) N (правила редукции и движения напряжения \) применяются для отображения инварианта) N (фонематическая основа в трех различных фонетических формах: [‘f @ ut @, graf],) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (2) 2 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти ([f @ ‘togr @ f @] и [, f @ ut @’ grafik]. Наконец, связная речь) p n (можно смоделировать такие процессы, как взмахи, элизия гласных и другие) N (при применении дальнейших, постлексических правил, уступая поверхности) N (фонетические представления, такие как [‘f @ uR @ graf] или [f:’ togr @ f @]. Примечание) N (что сочетание отображений орфографии в поверхностную фонетику) N (сохраняет масштаб и порядок \ (примерно \) единиц на всем протяжении) N (вывод: другими словами, отображение является гомоморфизмом.Это) N (сохранение масштаба и порядка проявляется даже при параметрическом) N (уровень, где каждая фонетическая единица поверхности отображается в вектор) N (целевые параметры синтеза. Численная интерполяция между ними) N (сегментные мишени используются для моделирования непрерывных переходов) N (наблюдается в реальной речи 🙂 N () N () N () S 8 T (Телефоны) S 16 T (f @ u R @ g r a f) N () N () S 8 T () S 16 T (| | | | | | | | |) N () N () S 8 T (Параметры P1 — \\ _ / — \\ _ _ / — \\ — -) N () S 8 T (\ (схема \) P2 _ / — — \\ _ / — \\ _ _ / -) N () S 8 T () S 16 T (…) N () N () N (3. Несегментарный синтез) N () N (В несегментарном подходе к синтезу на примере YorkTalk) N (IPOX и другие подобные системы, отображение фонем в) N (параметры синтезатора вычисляются не каскадом преобразователей, а) N (с помощью вычислительного подхода, называемого синтаксически-управляемым переводом \ (см.) N (например, Голуб 1990: 183-192 \). Этот метод состоит из двух отдельных частей: 1 \)) N (РАЗБОР синтаксической структуры \ (в данном случае морфологического,) N (метрическая и слоговая структура \), и 2 \) ТОЛКОВАНИЕ этого) N (структурный анализ.Обычно это означает прохождение анализа) N (график и отображение частей графа анализа на части выходных данных) N (описание. В наиболее типичном использовании этой техники компиляция) N (для компьютерных языков высокого уровня этап синтаксического анализа анализирует) N (структура высокоуровневого ввода программиста и интерпретация) N (этап переводит небольшие фрагменты анализируемого высокоуровневого кода в) N (небольшие фрагменты машинного кода компьютера. Несегментарный) N (системы синтеза, правила интерпретации связывают маленькие кусочки) N (фонологическая структура \ (e.грамм. просодическая составляющая структура и) N (отличительные особенности \) на параметры синтезатора напрямую, без) N (любые промежуточные уровни представления. Структуры, вычисленные в) N (этап синтаксического анализа явно не гомоморфен входу.) N (фрагменты, образующиеся при интерпретации, соответствуют \ (частям \)) N (фонологические составляющие всех размеров, а не только согласные и) N (гласные. Эти параметрические фрагменты не сочетаются друг с другом) N (просто или, в частности, с использованием конкатенации и интерполяции \ (как в) N (стандартная архитектура \) — хотя эти операции иногда используются) N (- но особенно они объединены, перекрывая их) N (Различные пути.) N () N () N (4. Перекрытие речевых составляющих) N () N (Перекрывающийся характер речевых составляющих отмечали многие) N (фонетики, в том числе О’Хман \ (1966 \), Фаулер \ (1980 \), Либерман \ (1970 \)) N (и Browman and Goldstein \ (1986 \). В синтезе речи, наложение) N (комбинация подробно описана Бровманом и Гольдштейном) N (\ (1986 \) и Coleman \ (1992b \). Как совпадающая фонетическая интерпретация в) N (несегментарный синтез подробно описан в другом месте) N (\ (Coleman 1992b, 1994 \), я приведу лишь некоторые ключевые примеры) N (здесь.Основное значение фонетического перекрытия в этой статье состоит в том, что оно) N (является одним из основных средств, с помощью которых можно сделать синтетическую речь) N (звучат более связно или плавно и менее бессвязно. Кроме того,) N (конкретный образец перекрытия, используемый в YorkTalk и IPOX, есть) N (критично для наших моделей ряда связанных речевых процессов, которые) N (в стандартном генеративном подходе — независимые правила без) N (связь друг с другом.) N () N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (3) 3 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти (Во-первых, следуя Оману \ (1966 \), Перкеллу \ (1969 \), Фаулеру \ (1980 \) и) p n (Griffen \ (1985 \), мы рассматриваем слоговые начальные и конечные согласные как) N (накладываются на ядра слогов, а не конкатенируются с ними,) N (как в сегментном синтезе. Эта организация помогает численно) N (моделирование коартикуляции, потому что согласные наложены на) N (гласные, с которыми они сливаются. Кроме того, я покажу) N (ниже сжатие слога влияет на продолжительность гласного) N (в первую очередь, и не затрагивает согласные.Этот эффект есть) N (используется в нашей обработке сокращения гласных в более быстрых слогах.) N () N (Во-вторых, в группе согласных накладываются друг на друга) N (соноранты. В качестве примера последствий этого паттерна в) N (кластер / tr /, / t / принимает лабиальность того / r /, на котором он находится) N (накладывается. В модели с перекрытием это просто означает, что) N (Лабиальность / r / не переписывается и не скрывается / t / 🙂 N () N () S 8 T (+ ————————— +) N () S 8 T (| лабиальность / r / |) N (+ ———- + —————- +) N () S 8 Т (| / т / |) Н () S 8 Т (+ ———- +) Н () N (В-третьих, у дифтонгов цели внеглайдеров чувствительны к) N (качество пика, например, фонетическая высота [i]) N (в [ai] несколько ниже, чем в [ei].) N () N (В-четвертых, в синтезе связанных последовательностей слогов, составляющих) N (на полях слоги перекрываются в разной степени в зависимости от их) N (фонологическая идентичность.) N () N () N (5. Синтез метрических футов) N () N (5.1 соединение слогов) N () N (Хотя мы широко используем перекрытие как способ соединения) N (фонологические единицы вместе, нам еще нужно уметь соединить некоторые) N (единицы сквозные, конкатенативным образом. Объединение высказываний) N (вместе это один такой случай.Однако, если мы просто объединим два) N (слоги в IPOX, например / sit / и / ti: /, у нас ничего не получится) N (образует беглое двусложное слово / ситти: / «город». Финал) N (согласный / сидеть / изолированно слегка придыхает и следует) N (молчанием. Начальный согласный у / ti: / довольно сильный) N (с придыханием. Объединение приведет к произнесению [сидеть:],) N (с двумя стоп-очередями, двумя периодами аспирации и коротким) N (пауза. Хотя такое произношение не подходит для connected) N (речь, мы хотим разрешить это как возможность, которая будет использована в) N (случай, когда / sit / находится в конце одного высказывания, а / ti: / начинается) N (новое высказывание, с намеренной паузой говорящего между) N (два высказывания.Это первый тип соединения слогов, который мы) N (может называться конкатенативным соединением или соединением паузы.) N () N (Чтобы два слога были соединены в беглый двусложный слог, мы) N (начать стоп-закрытие начального / t / of / ti: / перед закрытием) N (из финального / t / of / sit / был выпущен. Таким образом, взрыв,) N (стремление и заключительная пауза / sit / перезаписываются началом) N (второго слога. В зависимости от степени перекрытия между) N (два закрытия, мы можем сгенерировать диапазон закрытия интервокального стопа) N (продолжительность за счет изменения степени перекрытия между двумя закрытием) N (порции.Диапазон практически от любого закрытия, когда) N (выпуск / t / of / ti: / начинается почти сразу после закрытия) N (фаза заключительного / t / of / sit /, типичная продолжительность закрытия) N (одиночные интервокальные согласные, с приближением длительности закрытия) N (в два раза длиннее изолированных слогов-первых согласных. Степень) N (перекрытие можно контролировать, варьируя время между временем отпускания) N (время первой остановки и время отпускания второй остановки, обозначенное X) N (и Y соответственно на диаграмме ниже.Три региона в) N (континуум перекрытия, который я только что перечислил, соответствует трем) N (четко определенные типы продолжительности согласных: 1 \) очень короткие, 2 \) нормальные,) N (и 3 \) в длину. Очень короткое замыкание — наша модель интервокального) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (4) 4 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получить 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти («хлопанье».Длинное закрытие — наша модель родства, например the) p n (различие в английском языке между интервокальными согласными частями) N («полностью» \ ([houlli] в большинстве разновидностей английского языка \) vs. «Holy» \ ([houli] \),) N («рыбный магазин» [fiSSop] vs. «епископ» [biS @ p], «та жесть» [Даттин]) N (по сравнению с «сатином» [сатином] и т. д. Кроме того, можно смоделировать стык паузы) (путем перекрытия, а не конкатенации, просто по времени выпуска Y) N (достаточно долго после времени отпускания X, образуя четвертую область на) N (слоги перекрывают континуум.Хронометраж различных событий в этих четырех) N (случаи можно проиллюстрировать следующим образом.) N () N () N (Тип 1. Y перед X: очень короткое закрытие \ («хлопанье» \)) N () N (Конец первого слога) N () N (Гласный, закрывающий, закрывающий, взрыв и пауза) N (——- | ——- | ——————- | ———- | — —-) N (X) N () N (Д) Нет (———- | ———- | ————————— —) N (Завершающий взрыв и гласная буква Asp) N () N (Второй слог) N () N () N (Тип 2.Y примерно равно X: интервокальное замыкание нормальной длины) N () N (Конец первого слога) N () N (Гласный, закрывающий, закрывающий, взрыв и пауза) N (——- | ——- | ——————- | ———- | — —-) N (X) N () N (Д) Нет (———- | ———- | ————————— —) N (Завершающий взрыв и гласная буква Asp) N () N (Второй слог) N () N () N (Тип 3.Y после X: длинное закрытие \ («геминация» \)) N () N (Конец первого слога) N () N (Гласный, закрывающий, закрывающий, взрыв и пауза) N (——- | ——- | ——————- | ———- | — —-) N (X) N () N (Д) Нет (————— | ———- | ———————) Нет (Завершающий взрыв и гласная буква Asp) N () N (Второй слог) N () N () N (Тип 4.Y намного позже, чем X: пауза) N () N (Конец первого слога) N () N (Гласный, закрывающий, закрывающий, взрыв и пауза) N (——- | ——- | ——————- | ———- | — —-) N (X) N () N (Д) Нет (———- | ———- | ——) N (Завершающий взрыв и гласная буква Asp) N () N () N (Второй слог) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (5) 5 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти () p n () N (Различная степень перекрытия в каждом из этих четырех случаев частично) N (определяется фонологической идентичностью предметов на слоге) N (поля. Например, время остановки явно отличается от) N (синхронизация фрикативов или аппроксимантов. Также, типы стыков 1 и 2) N (применимы только тогда, когда слог-финал и слог-начальный) N (согласные фонологически идентичны, тогда как типы соединения 3 и) N (4 может использоваться независимо от того, является ли окончание слога или начало слога) N (согласные одинаковые или разные.Но в первую очередь выбор) N (тип соединения определяется лингвистическим контекстом этих двух) N (рассматриваемые слоги. Как часто замечено, тип 1) N (\ («flapping» \) в основном происходит внутри слова между ударением и) N (безударный гласный \ (см., например, Kenyon 1924 [1961]: 126-7 \). Встречается тип 2) N (внутри слова, а также на границах слова, где слово оканчивается на a) N (гласная встречается со словом, начинающимся с единственной согласной, или где а) N (согласный в конце слова присоединяется к гласному в начале слова.Мы моделируем их) N (как содержащие одинаковые окончание слога и начало слога) N (согласная, с закрытием единственной согласной, так что) N (возможны переходы из гласного в согласный и из согласного в гласный) N (локально для каждого из двух слогов. Встречается тип 3 \ («геминация» \)) N (особенно в соединениях \ (например, «ореховое дерево» \), фразах \ (например, «тот) N (падеж «\), и некоторые морфологические среды внутри слова,) N (особенно с германскими суффиксами \ (например, «целиком», «ровность» \).) N () N () N (5.2 Соединение слогов у их корней) N () N (Соединение слогов — это не просто вопрос временного) N (согласование событий в конце одного слога и в начале) N (следующее. Кроме того, мы должны моделировать целостные свойства просодики) N (единицы больше, чем слоги, а также некоторые свойства, которые есть) N (характерно для сочетания слогов. Например, мы) N (кратко обсудим создание контуров F0 для метрических) N (футы. В качестве примера последнего мы обсудим относительное) N (продолжительность \ (сжатие \) слогов в сочетании и изоляции.Гостиница (в следующем разделе мы обсудим качество гласных и согласных) N (различия между слогами в отдельности и в сочетании, возникающие) N (естественно с разной степенью сжатия.) N () N (Общий контур F0 метрической стопы в английском синтезе) N (YorkTalk и IPOX — это простое линейное падение от максимума к минимуму \ (иногда) N (транскрибируется H * L \). Высокий пик — это фонетическая интерпретация) N (сильный первый слог ступни. Низкую впадину можно рассматривать как) N (возможно, фонетическая интерпретация конца стопы) N (в отличие от следующего слога с высоким тоном в начале фута, если) N (один присутствует.Образец H * L находится независимо от номера) N (из слогов в стопе, в повествовательных высказываниях. \ (In) N (вопросительные высказывания, а в других диалектах шаблон s w => L) N (Вместо этого можно найти H. Мы не будем рассматривать здесь такой случай. \) См.) N (Pierrehumbert \ (1980 \) рис. 1.1A, 1.16, 1.22, 2.5, 2.34, 2.40C и др.) N (и др. примеры интонационного контура H * L на словах из двух) N (слоги и т. д. В дополнение к общему падению высоты звука, вычисляемому при) N (на уровне стопы, на нижних уровнях просодической структуры, индивидуум) N (согласные и гласные добавляют мелкие детали к полному F0) N (спецификация \ (e.грамм. так называемые согласные возмущения \), аналогичные) N (алгоритм F0 кратко обсуждается у Пьерумбера и Бекмана) N (\ (1988: 176-7, рис. 7.1d \). В нашей архитектуре эти модификации) N (накладывается на простой линейный падающий контур на уровне ступней, потому что) N (фонетическая интерпретация вычисляется сверху вниз, так что крупномасштабный) N (целостные детали могут быть дополнены мелкомасштабными уточнениями на более низком уровне) N (уровни просодической структуры.) N () N () N (5.3 Снижение качества гласных и соноры слоговых кодов) N () N (Одно из фонетических свойств, вычисляемых для каждого слогового узла: a) N (переменная, называемая «сжатием», в которой произвольные единицы представляют) N (отношение длительности слога в определенном контексте к его) N (продолжительность изоляции.\ (Переменная сжатия используется с другими) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (6) 6 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получить 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти (типы составляющих тоже, но мы ограничим это обсуждение) p n (слоги. \) Из-за перекрывающегося характера согласных, гласных) N (и поля слога, понятие «длительность слога» может быть только) N (определено оперативно.Однако интуитивно компрессия 0,5) Н (дает знак слога, который примерно вдвое короче его длины) N (произношение; 2.0 удваивает продолжительность слога и т. д.) N (Степень сжатия слога должна тщательно контролироваться, так как) N (экспериментально установлено, что большой диапазон штрафа) N (в основном встречаются вариации от одной среды к другой) N (обусловлено количеством и характером других слогов в) N (фут. Могут быть и другие факторы, но я включил только факторы) N (которые являются локальными для каждой ступни модели.) N () N (Значения сжатия около 0,75-0,85 приводят к уменьшению гласных, что) N (то есть, более короткие гласные с более высокими качествами центральных гласных. Временные) N (сокращение гласного возникает из-за того, что а \) длительность) N (гласная устанавливается на длительность всего слога, а б \)) N (согласные накладываются на гласные. Наложение фиксированной длительности) N (согласные на сжатой гласной обуславливают меньшее количество меж согласных) N (часть гласного звука должна быть слышна. Например, сравните) N (длительные минимальные пары / t @: n / \ (e.грамм. «поворот» \) и / t @ n / \ (например, второй) N (слог «кнопка» \) 🙂 N () N (Степень сжатия: 1,0) S 24 T () S 32 T () S 40 T (0,8) N (V Продолжительность 🙂 S 16 T (длиннее) S 24 T () S 32 T () S 40 T (короче) N () N () S 8 T (+ —————- +) S 32 T (+ ———— +) N (| @ |) S 32 т (| @ |) N (+ —- + ——- + — +) S 32 T (+ — + —- + — +) N () S 8 T (| t | | n | | t | | n |) N () S 8 T (+ —- + + — +) S 32 T (+ — + + — +) N () N (Качество гласных в сжатых слогах отличается от изолированности) N (образуется из-за того, что согласный-гласный и) N (переходы между гласной и согласной формантой частоты и ширины полосы частот, бытие) N (часть согласных, относительно фиксированы по продолжительности.Сжатие a) N (слог, таким образом, приближает начало и кодовую согласную) N (вместе. Акустические параметры гласных только независимо) N (слышно между концом начальных переходов и началом) N (кодовые переходы. Если согласные очень близко друг к другу, то) N (качество видимых гласных может отражать влияние согласных) N (переходы. Акустические цели гласных могут быть недостигнуты или) N (перезаписывается согласными переходами 🙂 N () N () S 8 Т (+ ———— +) Н (| @ |) N (+ —— ++ —— +) N () S 8 T (| t / \\ n |) N () S 8 T (+ — + + — +) N () N (Этот эффект можно рассматривать как акустический аналог артикуляционного) N (недорез в более коротких гласных.Только умеренная степень сжатия) N (необходимо для получения таких быстрых речевых форм, как [s: p> t] \ («support» \) и) N ([th: mAt @ u] \ («помидор» \), в котором гласная первого слога имеет) N (полностью затмевается фазами трения и всасывания) N (соответственно начального согласного.) N () N (Поскольку сонорные согласные имеют тенденцию иметь очень большую продолжительность в коде) N (положение, сжатие слогов, содержащих краткую гласную и коду) N (сонорант дает начало явным слоговым сонорам.цин /) Н (мы определили гласную второго слога как слабый высокий фронт) N (гласный / i /, что приводит к гипер-правильному написанию) N (произношение в медленных токенах. Мы варьировали значения сжатия) N (два слога каждого слова следующим образом 🙂 N () N () S 8 T (Слово) S 16 T () S 24 T (Сжатие 1) S 40 T () S 48 T (Сжатие 2) N () N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (7) 7 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти () p 8 T (двоюродный брат) S 16 T (1) S 24 T (0,75) S 32 T () S 40 T () S 48 T (0,8) N () S 8 T () S 16 T (2) S 24 T (0,75) S 32 T () S 40 T () S 48 T (0,75) N () S 8 T () S 16 T (3) S 24 T (0,75) S 32 T () S 40 T () S 48 T (0,7) N () S 8 T () S 16 T (4) S 24 T (0,75) S 32 T () S 40 T () S 48 T (0,65) N () S 8 T () S 16 T (5) S 24 T (0,75) S 32 T () S 40 T () S 48 T (0,6) N () N () S 8 T (бутылка) S 16 T (1) S 24 T (0,88) S 32 T () S 40 T () S 48 T (0.95) N () S 8 T () S 16 T (2) S 24 T (0,88) S 32 T () S 40 T () S 48 T (0,9) N () S 8 T () S 16 T (3) S 24 T (0,88) S 32 T () S 40 T () S 48 T (0,825) N () S 8 T () S 16 T (4) S 24 T (0,85) S 32 T () S 40 T () S 48 T (0,8) N () S 8 T () S 16 T (5) S 24 T (0,8) S 32 T () S 40 T () S 48 T (0,8) N () N (Обратите внимание, что в токенах 4 и 5 «бутылки» мы уменьшили значение сжатия) N (\ (т.е. уменьшила продолжительность \) первого слога, а не только второго) N (слог, чтобы улучшить ритм.) N () N (Континуум продолжительности, представленный в таблице выше, привел к изменениям) N (слышимое количество и качество гласной второго слога, как) N (а также к изменению общего ритма слов.Кроме того,) N (появилась вторичная артикуляция [l] в жетонах «бутылки») N (также варьироваться. Это обсуждается ниже. Сначала я сведу в таблицу) N (субъективные изменения качества ядра 🙂 N () N () N () S 8 T (Слово) S 16 T () S 24 T (Ядерное качество) S 40 T () S 48 T (Комментарии) N () N () S 8 T (двоюродный брат) S 16 T (1) S 24 T ([i]) S 32 T () S 40 T () S 48 T (Гиперкоррект) N () S 8 T () S 16 T (2) S 24 T ([i «]) S 32 T () S 40 T () S 48 T (Слегка централизованный) N () S 8 T () S 16 T (3) S 24 T ([@ +]) S 32 T () S 40 T () S 48 T (Очень короткий, более центральный) N () S 8 T () S 16 T (4) S 24 T ([\ (@ \) n]?) S 32 T () S 40 T () S 48 T (Мимолетное [@] или слоговое [n] ) S 80 T () N () S 8 T () S 16 T (5) S 24 T ([n]) S 32 T () S 40 T () S 48 T (слоговое [n]) N () N () S 8 T (бутылка) S 16 T (1) S 24 T ([@ +]) S 32 T () S 40 T () S 48 T (прозрачный [l]) N () S 8 T () S 16 T (2) S 24 T ([@]) S 32 T () S 40 T () S 48 T (Не так ясно [l]) N () S 8 T () S 16 T (3) S 24 T ([@ -]) S 32 T () S 40 T () S 48 T (Темный [l]) N () S 8 T () S 16 T (4) S 24 T ([\ (@ \) l]) S 32 T () S 40 T () S 48 T (Мимолетное [@] или слоговое [l]) N () S 8 T () S 16 T (5) S 24 T ([l]) S 32 T () S 40 T () S 48 T (слоговое [l]) N () N (Подчеркну, что изменение качества гласной и кода) N (Соноранты, описанные здесь, не являются просто иллюзиями восприятия.Потом (файлы параметров синтезатора показывают незначительные отклонения, возникающие из-за) N (взаимодействие инвариантных согласных и гласных целевых параметров при) N (разные временные условия. Я уже упоминал, что тем более) N (центральные качества более сжатых слогов возникают из) N (акустический аналог артикуляционного недолета. Дело в том, что код) N (боковые стороны кажутся темнее, в более сжатых слогах было немного) N (удивительно, хотя может быть уместно отметить Sproat и Fujimura) N (\ (1993: 300 \) обнаружив, что интервал времени между максимальным закрытием) N (кончик языка и максимальное опускание или втягивание тела языка) N (значительно длиннее в темных [l], чем в прозрачных [l].Если это) N (случай в естественной речи, кажется разумным ожидать, что в) N (синтетические [l] токены, различающиеся только или преимущественно во времени,) N (очевидно, что длинные [l] могут казаться темнее, чем кажется) N (короче [l], даже если они на самом деле продолжительны и спектрально) N (аналогично. В настоящем эксперименте [l] в «бутылочных» жетонах 4 и) N (5 явно длиннее, чем в токенах 1, 2 и 3, потому что) N (предшествующие гласные короче, то есть [l] в 4 и 5 заменяют a) N (большая доля длительности второго слога, чем в токенах с 1 по) N (3.) N () N () N (6. Анализ и синтез метрических футов, выходящих за границы слов) N () N (А также «связи» между слогами и подслоговыми единицами,) N (фраза «связная речь» обычно относится к связанным последовательностям) N (слова. Наша работа в этой области все еще очень предварительная. Тем не менее) N (Хочу сообщить о важной части межсловного соединения) N (а именно анализ и синтез метрических футов, которые перекрещивают слово) N (границы. Это не сильно отличается от метрической внутрисловной) N (футов, так много средств для генерации последовательностей слов) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (8) 8 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти (уже на месте. Я возьму в качестве рабочего примера предложение «это») p n (это адаптируемая система «.) N () N (6.1 Анализ) N () N (Основная проблема, связанная с этим предложением, — серьезное несоответствие между) N (морфосинтаксические и просодические структуры. Это показано на рисунке) N (два представления ниже. Первое получено путем синтаксического анализа) N (орфографический ввод с использованием простых грамматик IPOX для синтаксиса английского языка) N (и морфологическая структура, в которой действуют правила структуры фраз) N (с метрической структурой.Второй получен парсингом) N (ввод на основе фонем с использованием просодической грамматики английского языка. \ (Internal) N (структура слогов не показана. Амбисложные согласные есть) N (выписывается дважды, хотя система Oxford / YorkTalk вычисляет, какие) N (согласные или кластеры — амбисложные. \)) N () N (Морфосинтаксическая структура 🙂 S 32 T ([это [[[[подходящая]] система]]]] «N () N (Просодическая структура 🙂 S 24 T ([[Dis siz z @ n n @ d] [dapt t @ b b @ l] [sist st @ m]]) N () N (Хотя эти две структуры радикально отличаются, они есть) N (систематически связаны, и общее решение потребует обоих) N (в учетную запись.В генеративной фонологии это отношение обычно) N (описывается в процедурных терминах: безударные функциональные слова и случайные слова) N (начальные слоги изначально остаются «неразборчивыми» и «соединяются» в a) N (более поздний этап к предыдущей ступне. В декларативной теории такой) N (решение недоступно, поэтому две конструкции производятся в) N (параллельно) N () N (В текущем примере структура справа достигается по) N (требуются только тяжелые слоги, такие как / dapt / и / sist /) N (как голова ступни, тогда как светлые слоги являются слабыми узлами а) N (фут \ (кроме фразы-первоначально \).Однако такое ограничение есть) N (гарантируется только в латинской части лексикона \ (ср. Coleman 1994 \)) N (и не следует обобщать на просодические фразы) N (структура. Тем не менее, мы можем предложить следующее изложение) N (метрический разбор трансклова. Во-первых, метрическая структура трансклова) N (соблюдает внутрисловную метрическую структуру. Как односложные, «это»,) N («есть» и «ан» имеют просодическую структуру только до уровня) N (слог. Мы не можем определить, как они сгруппированы в ступни у) N (на уровне слов, поскольку у них нет сестринских слогов внутри слова.«Система») N (является двусложной ногой на лексическом уровне: эта информация есть) N (соблюдается на уровне приговора.) N () N («Адаптируемый» содержит начальный случайный слог / @ d / и полный) N (метрический фут / dapt t @ b b @ l /. В некоторых предыдущих отчетах) N (\ (например, Pierrehumbert and Beckman 1988: 148 \), начальные случайные слоги -) N (не на ногах, но прикреплены к слову узел. Я от этого отойду) N (обработка во избежание перестройки при соединении слов) N (вместе. Я буду рассматривать начальный светлый слог / @ d / как конечный) N (слог транс-слова foot / Dis siz z @ n n @ d /.Для того, чтобы) N (построить это транс-слово foot, достаточно заметить, что ни один из «is») N (ни «ан» не является исключительно ударным. Значит, они являются легкими слогами) N (слабо, как если бы они были в многосложном слове. Trans-word) N (ноги должны быть неограниченными, как германские ноги в пределах слова, если мы хотим) N (вывести четырехсложную стопу / Dis siz z @ n n @ d /.) N () N (Предложение состоит из трех транс-слов футов, тогда: / Dis siz z @ n) N (n @ d /, / dapt t @ b b @ l / и / sist st @ m /. У нас пока нет парсера) N (способен анализировать высказывания более чем одной фразы или группы тонов) N (поэтому мы завершаем анализ, сгруппировав три фута в одну) N (фраза, в которой последняя ступня — это голова.) N () N (6.2. Временная интерпретация) N () N (На следующем этапе каждому узлу просодического дерева присваивается а) N (продолжительность и для каждого узла ветвления степень перекрытия между ними) N (его братья и сестры определяются \ (обычно просто смотрят вверх) N (стол\). Подсложным составляющим назначается длительность на основании) N (структур признаков, связанных с ними в анализе, как) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (9) 9 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получаем 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти (а также их просодическое окружение. Продолжительность более высокого уровня) p n (составляющие определяются композиционно, перекрывая их между собой) N (учтены составляющие. Между слогами продолжительность а) N (составляющая принимается как сумма длительностей своих братьев и сестер) N (минус количество перекрытий между ними. Если перекрытия нет \ (или) N (отрицательная величина перекрытия \) указывается, слоги просто) N (объединены.Такой тип соединения уместен между высказываниями) N (и просодические фразы, но не фразово-внутренне. Например, просто) N (объединение слогов / sist / и / t @ m / приводит к a) N (произношение [sist ‘th @ m], содержит две стоп-очереди, две точки) N (стремления и короткой паузы. В этом случае необходимо сделать) N (/ st / ambisyllabic, начиная со второго слога несколько раньше) N (конец первого слога, такой, что выпуск без придыхания) N (начало / t / перезаписывает выпуск кода / t /, тип соединения) N (что типично для амбисложных согласных.) N () N (Ритмические свойства высказывания учитываются сжатием) N (продолжительность слогов, которые появляются в многосложных стопах. For) N (например, в то время как односложной стопе присвоен коэффициент сжатия) N (из 1.0 может быть назначен ударный слог двусложной стопы) N (компрессия 0,9, а его слабая сестра — 0,8. Ритм) N (ступни, состоящие из трех и более слогов, могут быть аппроксимированы а) N (степень сжатия, например, 0,85 … 0,65 … 0,75. Однако фактическая) N (значения для слоговых сжатий также зависят от внутренних) N (состав слогов.Для синтеза «это адаптируемая система») N (мы нашли последовательность сжатия слогов [0.92, 0.8, 0.8,) N (0,775, 0,816, 0,7802, 0,55, 1,1, 0,77] для получения адекватных результатов.) N (в центре внимания табуляция значений сжатия для разных типов слов) N (из наших текущих исследований.) N () N () N (7. Заключение) N () N (Я описал метод просодического анализа предложения и) N (вычисление фонетических параметров синтезатора Клатта из такого) N (анализ. ряда явлений, не связанных в более) N (обычная система, основанная на правилах перезаписи, таких как коартикуляция) N (безударное сокращение гласных, централизация безударных гласных,) N (слоговое звучание и устранение безударных гласных перед) N (слоговые сонорнанты смоделированы в YorkTalk и IPOX как естественные) N (сопутствующие всем просодическим взглядам на фонологическую структуру и) N (фонетическая интерпретация.В дальнейшем надеемся улучшить качество) N (наших фонетических параметров, а также обращения к просодии-синтаксису) N (интерфейс более тщательно.) N () N () N (Благодарность) N () N (Я хотел бы поблагодарить моего сотрудника Артура Дирксена \ (Институт) N (Perception Research, Эйндховен, Нидерланды \) за его) N (внедрение IPOX и помощь в подготовке этого документа и документа) N (аудиозаписи, проигранные на семинаре. Последние части статьи) N (не выходят за рамки Дирксена и Коулмана \ (1994 \), что короче) N (но есть картинки получше.) N () N () N (Ссылки) N () N (Аллен, Дж., М. С. Ханникатт и Д. Клатт \ (1987 \) От текста к речи:) N () S 8 T (система MITalk. Кембридж: Cambridge University Press.) N () N (Бровман, К. П. и Л. М. Гольдштейн \ (1986 \) К артикуляторной фонологии.) N () S 8 T (Фонология 3, 219-252.) N () N (Коулман, Дж. С. \ (1992a \) «Синтез по правилу» без сегментов или правил перезаписи.) N () S 8 T (В Г. Байи, К. Бенуа и Т. Р. Саваллис, ред. Talking Machines 🙂 N () S 8 T (Теории, модели и конструкции.Амстердам: Эльзевир. 43-60.) N () N (Коулман, Дж. С. \ (1992b \) Фонетическая интерпретация фонологического заголовка) N () S 8 T (структуры, содержащие перекрывающиеся составляющие. Фонология 9.1. 1-44.) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% Стр .: (10) 10 %% BeginPageSetup / pagesave сохранить def %% EndPageSetup iso1dict начало gsave llx lly 0 добавить перевод / v 0 магазин / x0 x v получить 4.703931 добавить sx cw mul добавить магазин / y0 y v получить дополнительный магазин BFS x0 y0 перейти () p n (Коулман, Дж. С. \ (1994 \) Многосложные слова в системе синтеза YorkTalk.) N () S 8 T (In P. A. Keating, ed. Phonological Structure and Phonetic Form 🙂 N () S 8 T (Статьи по лабораторной фонологии III. Кембридж: Кембриджский университет) N () S 8 T (Нажмите 293-324.) N () N (Дирксен А. и Дж. С. Коулман \ (1994 \) Архитектура всепрозодического синтеза.) N () S 8 T (Материалы второго семинара ESCA / IEEE по речи) N () S 8 T (Синтез, 12-15 сентября 1994 г.) N () N (Фаулер, К. А. \ (1980 \) Коартикуляция и теории внешнего тайминга. Журнал) N () S 8 T (Фонетики 8.113-133.) N () N (Гриффен, Т. Д. \ (1985 \) Аспекты динамической фонологии. Амстердам: Бенджаминс). () N (Голуб, А.И. \ (1990 \) Дизайн компилятора в C. Englewood Cliffs, NJ: Prentice) N () S 8 T (Международный зал.) N () N (Кеньон, Дж. С. \ (1924 \) [1961] Американское произношение. Анн-Арбор, Мичиган: Джордж Вар) N () S 8 T (Издательство Десятое издание) N () N (Либерман, А. М. \ (1970 \) Грамматики речи и языка. Когнитивный) N () S 8 T (Психология 1. 301-323.) N () N (Местное, Дж. К. \ (1992 \) Моделирование ассимиляции в несегментарном синтезе без правил.) N () S 8 T (In G. J. Docherty and D. R. Ladd, eds. Papers in Laboratory Phonology) N () S 8 T (II: Gesture, Segment, Prosody. Cambridge University Press. 190-223.) N () N (О’хман, С.Э. \ (1966 \) Коартикуляция в ВАХ высказываниях: спектрографическая) N () S 8 T (измерения. JASA 39. 151-168.) N () N (Perkell, J. \ (1969 \) Физиология речевого образования: результаты и последствия) N () S 8 T (количественного кинорадиографического исследования. Кембридж, Массачусетс: MIT Press.) N () N (Pierrehumbert, J. B. \ (1980 \) [1987] Фонология и фонетика английского языка) N () S 8 T (Интонация.Лингвистический клуб Университета Индианы.) N () N (Пьерумберт, Дж. Б. и М. Э. Бекман \ (1988 \) Структура тона японского языка.) N () S 8 T (Кембридж, Массачусетс: MIT Press.) N граница Grestore конец% iso1dict Pagesave восстановить showpage %% трейлер конец %% EOF

gen-text -shops / cmu_pronouncing_dictionary_notes.md at master · aparrish / gen-text -shops · GitHub

#CMU Pronouncing Dictionary

Невозможно узнать, как следует произносить английское слово, учитывая только его написание.Однако в процессе создания творческого языка мы часто нуждаются в информации о том, как будет произноситься определенное слово, если его прочитать вслух; мы могли бы использовать эту информацию для ряда творческих и поэтических целей, таких как автоматическая рифмовка и ассонанс, или создание текста, который соответствует определенному метру.

К счастью, власть имущие (то есть DARPA и «компании-члены Carnegie Mellon Sphinx Speech Consortium) подарили нам CMU Словарь произношения.Словарь произношения CMU представляет собой простой текст, компьютерно-читаемая база данных, которая сопоставляет английские слова с их произношением. Это невероятное благо как для поэтов, так и для исследователей.

Посетите домашнюю страницу словарь или загрузите толковый словарь сам.

## Модули и библиотеки

Я сделал модуль Python для разбора и использования словаря произношения CMU. Установить можно так:

  $ pip install произношение
  

Полная документация здесь.

Для тех, кто занимается Javascript, я сделал этот модуль, который вы можете установить. с npm или используйте в браузере: pronouncing-js. Создайте новый проект с npm init и установите его так:

  $ npm install aparrish / pronouncingjs --save
  

## Формат файла

Но прежде чем мы начнем работать с библиотеками, я хочу немного пояснить о том, как устроен сам словарь, чтобы вы могли разобрать его на своем владеть, если нужно!

Словарь представляет собой текстовый файл.В каждой строке файла есть слово и его произношение, разделенное двумя пробелами. Вот пример строки:

  CARNEGIE K AA1 R N EH0 G IY0
  

Это запись для слова CARNEGIE , которое имеет произношение K AA1 R N EH0 G IY0 (подробнее о том, какие символы в произношении означает, см. ниже).

Иногда с одним словом связано несколько вариантов произношения. В таких случаях в словаре есть запись для каждого возможного произношения, с числом в скобках, которое увеличивается для каждой последующей записи:

  ВЗРОСЛЫЙ AH0 D Ah2 L T
ВЗРОСЛЫЙ (1) AE1 D AH0 L T
  

Кроме того, есть несколько строк (в начале файла), которые начинаются с точкой с запятой (; ).Это комментарии, и их следует игнорировать.

Разобрать словарь очень просто:

  • Прочтите каждую строку, исключая, если строка является комментарием;
  • Разделить линию в точке двойного пробела;
  • Удалите часть в скобках и добавьте элемент в структуру данных карты / словаря, сопоставляя строку со списком произношений для этой строки.

Структура данных словаря / карты отлично подходит для хранения этой информации, но Мне также нравится использовать список кортежей, по одному кортежу для каждого слова / произношения пара.(Поиск выполняется медленнее с этой структурой данных, но у нее есть преимущество о сохранении порядка слов.)

## Фонетический алфавит

Так что же это за странные символы, которые используются в произношении? Они буквы — это то, что называется «ARPAbet», который представляет собой способ представления (в виде обычного текста ASCII) всех звуков, которые происходят на английском языке. На домашней странице словаря CMU есть таблица, описывающая, что каждый слог представляет.

Знатоки лингвистики могут сказать в этот момент: «Привет, вы, большие шишки, уже есть стандартный алфавит для фонетической транскрипции! Это называется IPA, и это рад! »Это все правда: IPA действительно существует, и это действительно рад.мне нужно провести небольшое исследование, чтобы быть уверенным, но я полагаю, что ARPAbet был разработан и выбран для этой задачи, потому что его легче набирать и разбирать, чем IPA (который, в дни до Unicode, из которых происходит словарь CMU, будет требуется настраиваемая кодировка символов в дополнение к настраиваемым сопоставлениям клавиатуры). Также полезно иметь специальный фонетический алфавит для английского языка, потому что он абстрагирует некоторые из более сложных аспектов английской фонологии (например, региональные вариации, пост-гласные, придыхательные согласные и т. д.)

Информация о произношении каждого слова также включает информацию, где ударение падает в каждом слове. Напряжение обозначается числом рядом с каждой гласной. 1 — первичный стресс; 2 — вторичное напряжение; и 0 — это безударный.

## Простой синтаксический анализ

## Подсчет слогов

Чтобы посчитать слогов количество слогов, вам нужно только посчитать, сколько гласные есть. Потому что все гласные в словаре имеют следующий номер им (для стресса), вы можете просто посчитать, сколько раз эти числа происходить.Простая реализация на Python:

  def syllable_count (телефоны):
возвратная сумма ([phones.count (i) для i в '012'])
  

В Javascript (с использованием подчеркивания):

  function syllableCount (телефоны) {
  вернуть _.reduce (
    _.map (телефоны, функция (i) {return (i.match (/ [012] / g) || []). length;}),
    function (a, b) {return a + b; })
}
  

## Рифмы

Пример кода на Python. Примечание: чтобы использовать этот пример кода, вам необходимо скачать как файл Python, так и сам словарь произнесения CMU.Пример аналогичного кода в Javascript.

Рифмы не так просты, как кажется! Многие, когда их спрашивают, думают, что два слова рифмуются, если оба имеют один и тот же последний слог. Это неправда: подумайте «уменьшить» и «усилить» — тот же последний слог, но почти не рифмуется. А лучший способ думать о рифмах: два слова рифмуются, если они совпадают «рифмующиеся части», где «рифмованная часть» определяется как «все, что от Ударный слог, ближайший к концу слова, до конца слова «.

Вот реализация на Python поиска «рифмующейся части» слова, на основе произношения в CMU:

  def rhyming_part (телефоны):
idx = 0
phone_list = телефоны.расколоть()
для i в обратном порядке (диапазон (0, len (phone_list))):
если список_фонов [i] [- 1] в ('1', '2'):
idx = я
перерыв
return '' .join (список_фонов [idx:])
  

## Недостатки

Словарь CMU великолепен, но он не идеален! Вот некоторые недостатки на что обратить внимание:

  • Произношение иногда неточное (я обнаружил, что это правда, особенно с назначением ударения)
  • Несмотря на то, что предоставлено несколько вариантов произношения, не дается никакой информации о контекстах, в которых происходят эти вариации: является ли одно из альтернативных произношений региональным вариантом, или же произношения отличаются в зависимости от того, как используется слово (например, e.g., существительное или глагол)
  • Ударение предоставляется, но границы слогов нет.
  • Несмотря на то, что словарь насчитывает более 100 000 словарных статей, он все еще ужасно неполный!

Лексическая обработка китайских под-иероглифов: семантическая активация фонетических радикалов, выявленная эффектом Струпа

В этом исследовании мы провели четыре эксперимента с использованием парадигмы Струпа, чтобы проверить, есть ли семантическая активация фонетических радикалов при просмотре китайского языка. составные символы.Результаты показали, что эффекты Струпа были надежно получены для китайских иероглифов, которые были названиями цветов (эксперимент 1), а также для символов, которые не были связаны с цветом, но содержали фонетические радикалы, которые были символами названия цвета в автономном режиме (эксперименты 1 и 2). Эффекты интерференции Stroop также были очевидны в состоянии, близком к чтению, когда цветной символ помещался в конец четырехсимвольной фразы (эксперимент 3), и когда фонетические радикалы не были названиями цветов, но каждый имел значение, связанное с цветом (Эксперимент 4).Взятые вместе, эти результаты предоставляют убедительные доказательства автоматической и независимой семантической активации фонетического радикала, даже когда функция фонетического радикала, по определению, состоит в том, чтобы указывать на произношение, а не на значение составного символа; и, что более примечательно, даже когда семантическая активация фонетического радикала в конечном итоге вызовет вмешательство в семантическую активацию всего символа.

Бидерман и Цао 29 впервые использовали китайские иероглифы в качестве стимулирующих материалов в парадигме Струпа и обнаружили эффект Струпа для китайских иероглифов, которые были названиями цветов, надежный результат, который с тех пор неоднократно воспроизводился 30,31,32,33, 34,35,36 .Спинкс и др. . 35 сделал еще один шаг и получил эффект Струпа для омофонов цветных символов. Наши результаты надежных эффектов Струпа для китайских иероглифов, которые были названиями цветов и омофонами названий цветов в Эксперименте 1, таким образом, добавляют еще одно свидетельство, которое согласуется с предыдущими исследованиями.

Новый вклад этого исследования, однако, заключается в том, чтобы выйти за рамки основных результатов эффекта Струпа для целых символов и перейти к встроенным фонетическим радикалам, которые были названиями цветов (Эксперимент 1–3) или несли значение объекта. связан с цветом (Эксперимент 4).Этот эффект нельзя отнести к праймингу из набора стимулов или задания (эксперименты 2–4), поскольку эффект Струпа все еще наблюдался даже без потенциального прайминга от воздействия испытаний, содержащих цветные символы или омофоны (т. Е. валидно-радикальных символов), из согласованных испытаний в Invalid-Radical символов и из лексического соответствия одних и тех же названий цветов без обязательной семантической активации. Более того, хотя количество неконгруэнтных испытаний удвоено по сравнению с конгруэнтными, эффект Струпа не должен изменяться 37 ; если эффект Струпа уменьшается, когда число в неконгруэнтных условиях больше или доля цветных слов выше 38 , наши результаты должны быть заниженными, что не повлияет на наш вывод.Таким образом, наши результаты предполагают, что эффект Струпа действительно возник в результате семантической активации фонетического радикала (пожалуйста, обратитесь к дополнительному материалу 3.1 для более глубокого обсуждения нашего использования парадигмы Струпа).

Если сфокусироваться на тонкостях экспериментов, есть несколько интересных моментов. Во-первых, в Эксперименте 1, в состоянии Invalid-Radical , в котором был представлен символ, содержащий два радикала, даже несмотря на то, что эффект Струпа продемонстрировал, что значение фонетического радикала может быть активировано, семантический радикал и семантическая информация всего символа (оба не связаны ни с какими названиями цветов) теоретически также должны обрабатываться автоматически, вызывая прерывание эффекта Струпа.Это согласуется с образцом результатов Эксперимента 1, где интерференция Струпа была значительно слабее в условии Invalid-Radical (39 мс), чем в условии Color-Character (79 мс). Второй момент заключается в том, что в том же эксперименте не было разницы в эффектах Струпа между условиями Valid-Radical и Invalid-Radical . Технически различие между условиями Valid- и Invalid-Radical заключается в том, насколько точно фонетический радикал передает произношение всему иероглифу.Поскольку все символы в условии Valid-Radical имеют те же фонологии, что и фактические названия цветов, мы ожидали умеренно более высокого интерференционного эффекта в условии Valid-Radical по сравнению с таковым в условии Invalid-Radical ; удивительно, но не было. Мы предполагаем, что это отсутствие различий является следствием того, что в используемой здесь парадигме Струпа практически нет звуковых сигналов произношения от фонетических радикалов, даже когда есть задача назвать цвет, который мог бы вызвать активацию произношения.В-третьих, в эксперименте 2 мы сосредоточились только на критическом ( Invalid-Radical ) условии, чтобы избежать потенциального смешения прайминга из испытаний в условиях Color-Character и Valid-Radical , большая разница между Эффекты Stroop условия Invalid-Radical в эксперименте 1 и 2 (73 мс против 44 мс при суммировании содействия и помехи вместе) показали, что действительно может быть некоторое праймирование из двух удаленных условий.Тем не менее, в отсутствие этих эффектов прайминга эффект Струпа все еще был значительным в эксперименте 2, хотя и меньше. Таким образом, это решительно поддерживает точку зрения, что фонетические радикалы подвергались семантической активации во время каждого испытания.

Те читатели, которые более знакомы с исследованиями эффекта Струпа, могут заподозрить, что наши меньшие результаты в Эксперименте 2 аналогичны эффекту разбавления Струпа 39 . В эффекте разбавления Струпа эффект Струпа уменьшается, когда цветное слово сопровождается одним или несколькими нейтральными словами, и конкуренция внимания между этими словами была объяснением этого.Если мы рассмотрим семантический радикал и весь символ из нашего условия Invalid-Radical как «нейтральные» символы (то есть обладающие значением, не связанным с цветом), тогда меньшие эффекты в условии Invalid-Radical по сравнению с Color-Character Состояние действительно может быть объяснено эффектом разбавления Струпа. Это относится к нашим экспериментам 1, 2 и 4, где целью был персонаж одного цвета, и соревнование должно было происходить внутри самого цветного персонажа, поскольку не было нейтрального слова, которое сопровождало цветного целевого персонажа.В эксперименте 3 у нас был другой случай, когда цветной целевой символ сопровождался тремя неокрашенными (черными) нейтральными символами. Однако эффект Струпа, который мы получили в эксперименте 3, не уменьшился по сравнению с эффектом в эксперименте 2, где был представлен только один символ (21 мс облегчения и 23 мс ингибирования в эксперименте 2, и 24 мс облегчения и 30 мс ингибирования в эксперименте 3). . Это согласуется с выводом о том, что нейтральные слова не ослабляли бы эффект Струпа, если бы они не были окрашены 40 .Однако читателям следует иметь в виду, что мы делаем вывод из двух независимых экспериментов в этом исследовании.

Другой потенциальный аргумент заключается в том, что эффекты Струпа, обнаруженные в настоящем исследовании, также могут быть объяснены эффектами соседства между целыми представлениями символов в орфографическом лексиконе, а не эффектами на радикальном уровне. Мы не думаем, что орфографическое соседство на уровне всего персонажа может объяснить то, что мы наблюдали, по следующим причинам: 1) В эксперименте 1, в котором манипулировали тремя условиями ( Color-Character , Valid-Radical , Invalid-Radical ), символы из условий Valid-Radical и Invalid-Radical имеют одинаковый размер окрестности (т.е.е., они имеют один и тот же фонетический радикал и, следовательно, принадлежат к одной группе). Однако наши результаты показали, что эффект Струпа значительно различается между условиями Color-Character и Valid-Radical . Если бы эффекты размера соседства внесли свой вклад в эффекты Струпа, мы бы наблюдали ту же картину результатов между условиями Color-Character и Valid-Radical и Color-Character vs. Invalid-Radical условий.2) Было показано, что эффекты Струпа взаимодействуют с соседней частотой 41 , и все же наши результаты, похоже, также не связаны с таким эффектом. Что касается стимулов в Эксперименте 1, символы в условиях Действительный-Радикальный и Недействительный-Радикальный имели высокие и низкие частоты, соответственно; но никакой разницы в эффектах Струпа обнаружено не было. Если бы частота соседства играла роль, мы бы наблюдали неравные эффекты Струпа в этих двух условиях. 3) В нашем эксперименте 4 размеры окрестностей условий ассоциативно-радикального и недопустимого радикала были разными, но их эффекты Струпа по-прежнему были схожими.4) Самое главное, что размер соседства не может объяснить эффект Струпа, полученный в нашем ассоциативно-радикальном условии , поскольку он должен зависеть от радикала как такового (например, радикала «гора» в иероглифе «бессмертный»), чтобы вызвать ассоциацию. с цветом, а их соседи (например,) не связаны с цветом на уровне персонажа.

Предыдущие исследования изучали, может ли процессинг радикала возникать с помощью задач типа Струпа 19,20 и Luo et al . 20 также изучил, можно ли активировать семантическую информацию фонетических радикалов с помощью задачи Spatial-Stroop. Хотя вопросы и парадигмы исследования имеют общие черты с нашими, текущее исследование отличалось от них следующими манипуляциями: 1) Они не указали свои радикалы как семантические или фонетические радикалы (в отличие от текущего исследования, где мы сделали упор на семантическую активацию фонетических радикалов. ), а также между действительными и недействительными фонетическими радикалами. 2) Они не использовали нейтральное условие для сравнения с конгруэнтными и неконгруэнтными условиями, и, таким образом, эффекты облегчения / вмешательства не могут быть оценены.Наш дизайн специально выбрал хорошо подобранные нейтральные стимулы (совпадающие по количеству ударов и частоте использования со стимулами в конгруэнтных и неконгруэнтных условиях) и предоставил больше информации относительно нейтральных испытаний, чем просто сравнение конгруэнтных и неконгруэнтных испытаний. 3) Они не использовали фольгу в наборах стимулов, и на протяжении всего эксперимента участники видели только двух персонажей; таким образом, участники могли принять различные стратегии. В этом исследовании мы постарались шаг за шагом избежать возможных мешающих факторов в серии из четырех экспериментов.Соответственно, поскольку наши проекты специально ориентированы на семантическую активацию фонетических радикалов и доказали, что даже фонетические радикалы также могут быть семантически активированы и приводить к эффекту Струпа, мы считаем, что это более убедительное доказательство того, что радикалы обрабатываются во многом так же, как и символы.

Что касается прошлых теорий китайского признания, наши результаты добавляют еще одно свидетельство, опровергающее точку зрения о том, что символ в целом является основным процессором, на котором основано чтение текста, и что обработка радикалов либо не нужна, либо запускается только запросами задачи 42,43,44,45,46,47,48,49 .Согласно этой точке зрения, эффект Струпа должен был быть обнаружен только в условии Color-Character (например, «голубой»), но не в условии Invalid-Radical (например, «предположить»), потому что значение символа в последнем условии не имеет ничего общего с цветом, как и соответствующий ему символ Neutral-Control (, «палатка»). Таким образом, этот целостный взгляд затрудняет объяснение эффектов Струпа, которые мы последовательно получали в критическом условии Invalid-Radical во всех четырех экспериментах, и тем более для условия Associative-Radical в Эксперименте 4, поскольку сам фонетический радикал был даже не название цвета.

Вместо этого наши выводы можно объяснить тем, что китайские иероглифы распознаются по первой активации их радикалов 6,50,51,52,53,54,55,56,57 . В этом лагере декомпозиции большинство исследователей в основном сосредоточились на том, как радикалы обрабатываются для выполнения своих семантических или фонетических функций. Например, Flores d ’Arcais и др. . 10 предположили, что фонетические радикалы могут работать так же, как субексические буквы в алфавитных словах из-за чрезмерно усвоенного соответствия орфографии и фонологии при чтении китайского языка, подобно правилам соответствия графемы и фонемы в английском языке.Эта точка зрения широко распространена и отражена в исследованиях, показывающих, что функция фонетических радикалов при чтении составного китайского языка заключается в определении фонологии иероглифов 9,11,12,58,59 . Точно так же предыдущие результаты также содержат намеки на облегчение семантическими радикалами семантической обработки символов 5,6,60,61 .

Однако возможность семантической активации фонетических радикалов кажется странной на первый взгляд. Теоретически утверждение, что семантический радикал указывает на значение иероглифа, а фонетический радикал — на произношение, является наиболее разумным способом представления двух видов радикалов при условии, что представлена ​​радикальная функция.Активация значения фонетического радикала должна только создавать помехи для анализа значения всего символа, так как основная функция фонетического радикала состоит в том, чтобы просто указывать на произношение символа. Однако на практике, если активация семантической информации фонетического радикала стала неизбежной, она может быть просто обязательной, несмотря на нежелательное вмешательство. Парадигма Струпа, которую мы использовали в этом исследовании, имеет преимущество перед другими парадигмами в решении этой проблемы: эффект Струпа указывает на автоматическую семантическую активацию 17,18,62 , поскольку текущая задача (т.д., укажите цвет шрифта) не имеет отношения к семантике символов / радикалов. Таким образом, эффект Струпа, вызванный недопустимым фонетическим радикалом, в том смысле, что ни его произношение, ни его значение не дает подсказок персонажу, раскрывает непременный характер его семантической активации. Обратите внимание, что эта автоматическая семантическая активация является более глубокой, чем простая лексическая активация от распознавания орфографии радикалов; в Lorentz и др. . 18 , они также обнаружили эффекты Струпа в цветовых ассоциативных словах, предполагая, что эффект Струпа — это не просто продукт лексической активации.Это также подтверждается в нашем эксперименте 4, где ассоциативно-радикальное условие также привело к эффекту Струпа.

Могут ли наши выводы быть результатом когнитивных стратегий, а не автоматической когнитивной обработки? Мы полностью осознаем эту потенциальную проблему и поэтому предприняли усилия, чтобы исключить такую ​​возможность из вопросов, связанных со стратегией. Четыре описанных эксперимента должны были продемонстрировать наши усилия в этом направлении. Установив основное явление эффекта Струпа из условия Invalid-Radical , мы исключили два других условия (условия Color-Character и Valid-Radical ) в Эксперименте 2, чтобы избежать эффектов прайминга, вызванных цветом. соответствующие стимулы из двух других условий и использование четырехсимвольных фраз в эксперименте 3 для уменьшения количества представленных связанных с цветом символов.В эксперименте 4 мы использовали символы, не содержащие радикалов, связанных с названием цвета (ассоциативные радикалы). Эффекты Струпа последовательно обнаруживались в четырех экспериментах, что указывает на то, что наши результаты не следует приписывать стратегиям, перенесенным в критическое состояние. Более того, с другой точки зрения, мы использовали четырехсимвольные фразы в Эксперименте 3, где критический символ был в конце фразы (то есть четвертый символ), а остальные три символа не были связанными с цветом символами.В этой ситуации стимулы, связанные с цветом, в этом эксперименте составляли всего 14%, но даже при такой небольшой доле цветных символов устойчивый эффект Струпа все же был обнаружен. Таким образом, мы довольны предположением, что когнитивные стратегии для нашей задачи были незначительным фактором.

То, что мы обнаружили, согласуется с предыдущим исследованием, которое вызвало некоторые дискуссии в литературе из-за небольших эффектов и их теоретического значения. Чжоу и Марслен-Уилсон 13 использовали задачу присвоения имен и обнаружили, что именование целей (например,g.,, [hei1], «черный»), когда им предшествовали семантически связанные фонетические радикалы, встроенные в составные простые числа (например,, [bo2], «парковка» с фонетическим радикалом «», [bai2], «белый »). Когда порядок простых чисел и целей был изменен, вместо этого была найдена стоимость RT. На основании этого был сделан вывод, что семантическая активация фонетических радикалов должна происходить автоматически; в противном случае не должно было быть тормозящего контроля над активацией фонетического радикала, чтобы избежать затруднения при назывании составных символов (например,грамм., ). Вместе с исследованиями, показывающими, что семантические радикалы не только приводят к семантической активации 5,6 , но также и фонологической активации 7 , и что фонетические радикалы приводят к фонологической активации 9,11,12,63 , наши результаты согласуются с точка зрения, что радикалы обрабатываются так же, как символы 13 . Обратите внимание, что это не обязательно исключает функциональные роли двух видов радикалов (т.е. семантических или фонетических), поскольку они могут передаваться через семантическую или фонологическую сеть, состоящую из символов, содержащих данный радикал, в дополнение к активации собственного представления символов (см. также 64 ).

Предыдущие исследования выявили определенные сходства между морфемной обработкой в ​​английском и радикальной обработкой в ​​китайском, например, разложение независимо от частоты слова и позиции 1,50,56,64,65 . Это исследование пошло еще дальше и спросило, похожа ли радикальная обработка на китайском языке на морфологическую декомпозицию на английском языке, при которой активируется только семантика прозрачных морфем, но не непрозрачных морфем. Для английского языка Rueckl и Aicher 66 обнаружили, что для большинства рассмотренных ими эффектов замаскированного прайминга эквивалентные эффекты прайминга были получены для семантически прозрачных ( учить в учитель ) и непрозрачных ( кукуруза в углу ) морфем. .Хотя в своих собственных экспериментах они обнаружили больший эффект прайминга для семантически прозрачных, чем непрозрачные простые числа, когда первичное число и цель были задействованы с помощью 7–13 испытаний (так называемый эффект долгосрочного прайминга), для непрозрачного первичного целевого объекта все еще не было эффекта прайминга. пары по сравнению с контрольной парой. Кроме того, не было эффекта семантического прайминга для семантически связанных пар (например, вода-океан). Вместо качественного описания результатов Feldman et al . 67 использовал метаанализ литературы, упомянутой в Ruckle and Aicher 66 , и обнаружил значительно большие эффекты прайминга для прозрачных простых чисел, такие же, как результаты их собственного исследования (но обратите внимание, что они добавили идентичные пары в качестве контекста к облегчают грунтовочный эффект).Тем не менее не было никаких эффектов прайминга для семантически непрозрачных пар первичный-целевой. Таким образом, хотя существуют модели, предлагающие морфемы в качестве единиц доступа к распознаванию слов 68 , в которых слова раскладываются на морфемы перед лексическим доступом, результаты исследований распознавания английских слов предполагают, что семантика морфем не обязательно активируется, по крайней мере, не для семантически непрозрачных слов (например, секретарь и угол ).

Когда мы проводим концептуальное сходство между семантически непрозрачными парами в английском языке и недопустимыми радикальными символами в китайском языке, интригует тот факт, что наши результаты вместо этого показывают, что радикалы в обработке китайских символов подвергаются лексической обработке, как и символ, и семантика подзаголовка. -символы-радикалы активируются, даже если это может только отвлечь семантическую обработку всего символа.Следовательно, неизбежная семантическая активация радикалов субсимволов может составлять уникальную особенность в обработке китайских иероглифов, которая может расширить наши перспективы, когда мы постигаем исследования, сравнивающие китайский язык с другими языками (см. Дополнительный материал 3.2 для краткого обсуждения значения нашего результата на доступные в настоящее время модели для чтения).

О, Ла Ла! 5 приложений, которые развивают безупречные навыки французского произношения

Французский — труднопроизносимый язык.

Слово типа haut (высокий / высокий) состоит из четырех букв, но произносится как одинарная гласная.

Слова avait , avaient и avais (спряжения глагола escapeir , что означает «иметь») произносятся одинаково, хотя и четко состоит из различных комбинаций букв.

Давайте будем честными, язык немного помешанный.

Но нам все равно нравится! (Эй, если бы не было, тебя бы здесь не было.)

Нет смысла беспокоиться об этом.Лучше сосредоточиться на продуктивности.

Итак, давайте поговорим о том, как преодолеть эти проблемы с произношением и начать улучшать свои навыки французского произношения.

Что может быть лучше для современного изучающего французский язык, чем приложение?

Быстрый поход в магазин приложений покажет, что нет недостатка в приложениях, утверждающих, что они демонстрируют и обучают безупречному французскому произношению. Хотя, как все мы знаем, одни приложения лучше других.

Я перечислил здесь пять моих любимых приложений для французского произношения.Итак, вы можете прочитать о них, протестировать их, выбрать свои любимые и приступить к работе!

Прежде чем мы начнем, давайте поговорим о том, почему правильное французское произношение должно быть главным приоритетом для всех изучающих французский язык для тех, кто не уверен в важности произношения.

Загрузить: Это сообщение в блоге доступно в виде удобного и портативного PDF-файла, который вы можете можно взять куда угодно. Щелкните здесь, чтобы получить копию. (Скачать)

Почему правильное французское произношение имеет значение?

Помогает избежать недоразумений.

Правильное произношение особенно важно в таком языке, как французский. Небольшие вариации в произношении могут указывать на совершенно разные слова и значения. В качестве одного примера, и , и и на все носовые звуки, но их произношение немного отличается от одного к другому.

Носители французского языка освоили эти тонкие различия много лет назад. Тем из нас, кто не является носителем языка, может быть непросто услышать, не говоря уже о произношении, разницу между ними.Когда мы не можем точно сказать, что говорят люди, возникает множество недопониманий.

Таким образом, изучение правильного произношения на французском языке поможет вам избежать недопонимания между вами и вашим собеседником. И что еще лучше, это помогает сделать разговор более плавным, если вы можете понять, не пропуская ни одной доли и не прося говорящего что-то повторить.

Это уважительно.

Правильное произношение слов на иностранном языке помогает проявить уважение к языку и культуре.Когда кто-то пытается правильно произносить звуки вашего родного языка, вы это цените.

С другой стороны, если кажется, что кто-то меньше заботится о правильном произнесении слов на вашем языке, это не только затрудняет их понимание, но и может показаться неуважительным.

Каждая культура и каждый язык прекрасны по-своему. Узнайте о языке и культуре, стоящей за ним, и проявите к языку уважение и усилия, которых он заслуживает.Люди могут почувствовать вашу заботу и будут благодарны и добры в ответ.

Конечно, у вас не будет идеального произношения с самого начала, но люди поймут, что вы прилагаете усилия, и это действительно важно! К тому же, проявив немного уверенности и мотивации, вы доберетесь до цели в кратчайшие сроки.

Это вдохновит вас продолжать учиться.

Чем увереннее вы чувствуете себя, говоря и понимаете язык, тем больше вы хотите выучить и принять как язык, так и культуру, стоящую за ним.

Это похоже на феномен наклейки с золотой звездой : Когда вы чувствуете, что делаете что-то хорошо, и когда вас признают за ваши усилия (например, золотыми звездами), вы хотите продолжать работать лучше и Лучше продолжать зарабатывать все больше и больше золотых звезд.

Теперь, когда мы убедили вас, что правильное произношение на французском — или на любом другом языке — важно, вот пять наших любимых приложений для улучшения ваших навыков разговорного французского (в дополнение ко всем другим приложениям для французского языка, которые мы » я уже говорил вам об этом раньше).

Чем больше работы вы вложите в работу с этими приложениями, тем больше вы получите от них. По-настоящему пользуйтесь ими каждый день, и вы заметите разницу в своих навыках произношения еще до того, как заметите это!

В наличии: iPhone / iPad | Android | Окна

Duolingo включает французское произношение во всех частях приложения.

Приложение не только диктует вам французский текст, но и заставляет вас повторять французские фразы в микрофон.Это укрепит навыки произношения, которые вы начали приобретать, заставляя вас практиковаться вслух. И приложение вознаграждает вас и стимулирует (желанными призами гордости, очками хвастовства и их цифровой валютой, линготами) продолжать учиться и практиковаться каждый день.

Менее чем отличная часть приложения заключается в том, что франкоязычные голоса в некоторой степени автоматизированы, поэтому вам придется к этому привыкнуть, если вы хотите получить от приложения максимум удовольствия. Он также иногда неправильно произносит слова , , но я сталкивался с этой проблемой лишь несколько раз.

В целом приложение представляет собой действительно надежный ресурс для изучения словарного запаса, грамматики и произношения. К тому же это действительно легко превратить в привычку. Например, если вы посвящаете 15 минут каждое утро в дороге или 15 минут каждый вечер перед сном, чтобы пройти один или два урока на Duolingo, вы быстро закончите работу с приложением.

Как только вы зайдете так далеко, у вас будет довольно твердое понимание основ языка, на котором можно строить.

Чтобы получить максимальную отдачу от обучения с Duolingo, лучшая стратегия — объединить его с другим приложением, которое больше ориентировано на то, чтобы познакомить вас с подлинным французским языком , на котором носители языка говорят на — например, FluentU .

FluentU берет реальные видео — например, музыкальные видеоклипы, трейлеры к фильмам, новости и вдохновляющие выступления — и превращает их в индивидуальные уроки изучения языка.

Другие сайты используют контент по сценарию. FluentU использует естественный подход , который поможет вам со временем усвоить французский язык и культуру.Вы выучите французский так, как на нем говорят реальные люди.

На FluentU есть множество отличных материалов, таких как интервью и веб-сериалы, как вы можете видеть здесь:

FluentU делает родные видео доступными благодаря интерактивным субтитрам.

Вы можете нажать на любое слово, чтобы мгновенно его найти. Каждое определение содержит примеры, которые помогут вам понять, как используется это слово.

Например, если вы нажмете на слово «круа», , вы увидите следующее:

Практикуйте и укрепляйте словарный запас, который вы выучили в данном видео, с помощью адаптивных тестов FluentU . Проведите пальцем влево или вправо, чтобы увидеть больше примеров слова, которое вы изучаете, и сыграйте в мини-игры из динамических карточек, например «заполните пробел».

По мере вашего обучения FluentU отслеживает словарный запас, который вы изучаете, и использует эту информацию, чтобы дать вам 100% персонализированный опыт.

Это дает вам дополнительную возможность попрактиковаться в трудных словах и напоминает вам, когда пришло время повторить то, что вы узнали.

Начните использовать FluentU на веб-сайте со своего компьютера или планшета или, что еще лучше, загрузите приложение FluentU из магазинов iTunes или Google Play.

В целом, Duolingo сам по себе отлично подходит для начинающих. , но если вы немного более продвинуты или нуждаетесь в помощи по произношению только изредка, вы можете попробовать FluentU, а также другие приложения в этом списке.

В наличии: iPhone / iPad

С помощью (How to) Pronounce вы можете выучить произношение на языках от испанского до польского и, конечно же, до французского. Самое замечательное в этом приложении то, что будет читать любой текст, который вы вводите вслух, либо с нормальным темпом речи , , либо с немного медленнее, чем .

Все, что вам нужно сделать, это выбрать «французский» в качестве языка и ввести французский текст, который вам нужно знать, как произносится.

Важно знать, что это приложение отлично подходит для изучения произношения отдельных слов , но не так хорошо с потоками текста.

Например, если вы напечатаете слово fatigué (устала), приложение вернет вам текст безупречно. Однако, если вы наберете такое предложение, как Ma mère est fatiguée parce qu’elle a beaucoup travaillé (Моя мама очень устала, потому что много работала), приложение прочитает предложение обратно, но произношения не будут. Не буду так ясно.При произнесении предложений приложение объединяет все слова в монотонный поток, что затрудняет понимание произношения каждого отдельного слова.

Конечно, на французском часто говорят с большим количеством пропущенных слов и без четких разрывов между словами, поэтому приложение соответствует языку в этом отношении. Тем не менее, говорящие по-французски обычно также имеют интонации в голосе и разбирают предложения, в то время как в этом приложении их нет.

Когда вы изучаете базовые навыки произношения, слышать, как голос Siri диктует монотонные потоки текста, — это не очень хорошо, но если вам нужно знать произношение определенного отдельного слова , это приложение — отличный ресурс.

Да, и вы также можете выбирать между французским, как он произносится во Франции, и французским, как он произносится в Канаде, если вам интересно, потому что важно помнить о своей аудитории!

В наличии: iPhone / iPad | Android | Окна

С Memrise изучающие язык проходят тестирование по всем предметам разговорного французского, но все это часть веселого приключения, которое превращает изучение языка в увлекательное и сложное путешествие.Начинается:

«Фронт униформистов проникает в Мультивселенную … Скоро они свергнут Альянс и установят правило единообразия и ненависти … Добро пожаловать в Альянс, вербовать. Чтобы начать обучение, подтвердите свои полномочия ».

Как видите, конечно же занимательно!

В этом отношении Memrise похож на Duolingo тем, что делает изучение языка увлекательным, увлекательным и увлекательным занятием для пользователей. Это также побуждает пользователей тренироваться каждый день с целями и таблицами лидеров.

Он также предлагает хорошее французское произношение всех слов, которые он вам знакомит. А его запатентованная функция «мемов» позволяет вам добавлять собственные средства запоминания к каждому слову, что может быть очень полезно для запоминания французского произношения. Memrise рекомендует подумать о том, как звучит слово, о чем напоминают звуки и с чем оно рифмуется. Все хорошие привычки для изучающих французский язык, которые улучшают произношение.

Однако, в отличие от Duolingo, многие языки, которые вы выучите с помощью этого приложения, довольно обычны. Например, первые несколько слов, которые вы выучите: salut (привет), что является обычным способом сказать b onjour (привет), q uoi de neuf? (что нового? / Что случилось?) И сокращенные фразы, такие как j’ai pas, составляют , что является случайной, усеченной версией j e n’ai pas состоит из (я не понимаю). Это делает его идеальным приложением для изучающих французский язык, которые хотят научиться только навыкам повседневной беседы и ничего особенного.

Приложение предлагает своим пользователям несколько интересных вариантов перевода на английский язык, например «снизу вверх!» как перевод « салют! ”Но ведь это определенно делает процесс изучения языка интересным!

В наличии: iPhone / iPad

С помощью этого приложения вы можете набрать или произнести текст , который вы хотите знать, как сказать на английском (или на любом из множества других языков), и приложение переведет и продиктует слово / фразу на французском языке для вас. .

В этом отношении приложение занимает довольно уникальную нишу. Приложение отлично подходит для изучающих французский язык, которым нравится изучать язык с помощью словаря или словаря. По сути, это приложение служит той же цели, что и словарь , но с дополнительным преимуществом — научить вас, как произносятся французские слова.

Однако, как и многие другие службы машинного перевода, приложение, безусловно, допускает свои ошибки. Это на лучше с отдельных слов , чем с полными предложениями . Например, когда я продиктовал «Моего отца нет дома» в микрофон, приложение повторило это на французском языке как « Mon père n’est pas maison, », что является более чем буквальным, грамматически неверным переводом слова Английское предложение.

Да, конечно, я мог бы сказать: «Мой отец не в доме », чтобы прояснить любую путаницу для приложения, но, тем не менее, это указывает на то, что приложение, как и многие службы машинного перевода, еще не совсем сроки полного перевода предложения.

Тем не менее, приложение довольно хорошо переводит отдельные слова, такие как «отец», «мать» и т. Д. Таким образом, это определенно больше похоже на словарь произношения , чем на разговорник произношения. И произношение слов очень хорошее.

Одна интересная особенность приложения заключается в том, что вы также можете сохранять переводов, которые вы уже искали, , по сути создавая свой собственный автономный персонализированный словарь, который можно использовать в любое время.

В наличии: iPhone / iPad | Android | Настольное приложение

Это приложение представляет собой проигрыватель аудиокниг и учебник , специально предназначенное для изучающих французский язык. Проверьте и загрузите свою первую бесплатную аудиокнигу, первую часть серии аудиокниг под названием « À moi Paris», бесплатно, чтобы узнать, о чем она вообще.

Каждая аудиокнига рассказывает историю с персонажами и сюжетом. Приложение предлагает вам возможность прослушать французский текст рассказа, продиктованный вам с разной скоростью (нормальный, медленный или современный уличный французский) , когда вы читаете вместе с текстом. Произношение идеальное, совсем не роботизированное и очень четкое.И вы также можете читать вместе с французским текстом, с английским переводом внизу или без него.

После каждой главы идет раздел вопросов и ответов , где вы можете проверить свое понимание, и раздел учебного пособия со словарными таблицами и пояснениями по грамматике. (Вот тут-то и пригодится «учебная» часть!)

Приложение, вероятно, не для всех подходит. Но первая партия аудиокниг серии « À moi Paris» бесплатна, так что вы можете также проверить ее и посмотреть, нужен ли вам инструмент для изучения языка и произношения, чтобы вывести свои навыки французского на новый уровень. !

Вот и все, ребята.

Вам нечего терять с этими бесплатными (или, по крайней мере, доступными) французскими приложениями.

Попробуйте и посмотрите, как далеко вы продвинетесь со своим французским произношением!

Загрузить: Это сообщение в блоге доступно в виде удобного и портативного PDF-файла, который вы можете можно взять куда угодно. Щелкните здесь, чтобы получить копию. (Скачать)

Если вам понравился этот пост, что-то подсказывает мне, что вам понравится FluentU, лучший способ выучить французский с помощью реальных видео.

Испытайте французское погружение в онлайн!

.

admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *