Фонетический разбор. Образец | сочинение, краткое содержание, анализ, биография, характеристика, тест, отзыв, статья, реферат, ГДЗ, книга, пересказ, сообщение, доклад, литература | Читать онлайн
Тема: Лингвистические термины и определения
Фонетический разбор — анализ звучания слова или сочетания слов, который предполагает определение звукового состава слова, артикуляционных и акустических характеристик отдельных звуков слова, деление анализируемого слова на слоги, определение места ударения, указание на соотношение звучания слова (звуков) и написания слова (букв). Фонетический разбор осуществляется по следующей схеме:
- Сделать фонетическую транскрипцию слова, поставить ударение.
- В транскрипции проставить знаки слогораздела (дефис или вертикальная черта), определить количество слогов в слове, отметить ударный слог.
- В столбик выписать буквы слова, рядом — соответствующие им звуки. Указать количество букв и звуков в слове.
- Каждому звуку дать фонетическую характеристику: для гласного звука указать, ударный он или безударный; для согласного звука определить, сонорный он, звонкий или глухой; твердый он или мягкий (с указанием парности).
Образец фонетического разбора:
Яма [j’а—ма] 2 слога, первый слог ударный Материал с сайта //iEssay.ru
[j’] — согласный, сонорный, мягкий непарный
[а] — гласный ударный
м — [м] — согласный, сонорный, твердый парный
а — [а] — гласный безударный.
В этом слове 3 буквы и 4 звука.
На этой странице материал по темам:- фонетический разбор слова сторожит
- фонетический разбор слова жестче
- повествовать фонетический разбор образец
- бодлер фонетический разбор
- фонетический разбор слова александр
Фонетический (звуко-буквенный) разбор слова | ПОЛЕЗНЫЕ ПРОГРАММЫ ДЛЯ УЧЕБЫ И РАБОТЫ
Фонетический или звуко-буквенный разбор слова — это анализ слова. Чтобы сделать фонетический разбор слова, нужно разобрать каждую букву. Для этого необходимо:
- разделить слово по слогам, обозначить ударный слог;
- сделать транскрипцию слова, подсчитать количество букв и звуков;
- разобрать каждую букву и записать ее характеристику:
- для гласного – ударный/безударный
- для согласного – парный/непарный, твердый/мягкий, звонкий/глухой
- составить цветовую схему слова (графическую форму слова).
Гласные звуки | ||||||
Согласный, который стоит перед — твердый | [А] | [О] | [У] | [Ы] | [Э] | |
Согласный, который стоит перед — мягкий | [ЙА] буква «Я» | [ЙО] буква «Ё» | [ЙУ] буква «Ю» | [И] | [ЙЭ] буква «Е» | |
Согласные звуки | ||||||
звонкие парные | [Б] | [В] | [Г] | [Д] | [Ж] | [З] |
глухие парные | [П] | [Ф] | [К] | [Т] | [Ш] | [С] |
звонкие непарные | [Й’] | [Л] | [М] | [Н] | [Р] | |
глухие непарные | [Х] | [Ц] | [Ч’] | [Щ’] | ||
Согласные, которые всегда… | ||||||
всегда мягкие | [Ч’] [Щ’] [Й’] | |||||
всегда твердые | [Ж] [Ш] [Ц] | |||||
всегда звонкие | [Й’] [Л] [М] [Н] [Р] | |||||
всегда глухие | [Х] [Ц] [Ч’] [Щ’] | |||||
без звука | Ь — чтобы смягчить, Ъ — чтобы разъединить |
Комментарий
Транскрипция слова — звуки, которые записываются в квадратные скобки. Могут использоваться дополнительные знаки, например, обозначение мягкости.
Звонкие согласные образуются с участием звука, а глухие — с помощью шума.
Парные согласные образуют пару глухой/звонкий. Например, [Б]/[П], [В]/[Ф], [Г]/[К].
Непарные согласные не образуют пары: [Л], [М], [Р].
Пример: фонетический (звуко-буквенный) разбор слова «ягода»
Слоги: я́-го-да (3 слога, ударение падает на 1-й слог)
Переносы слова: яго-да
Фонетическая транскрипция слова: [й’агада]я́-го-да [й’агада] — 5 букв, 6 звуков
я [ й’] согласный, звонкий непарный, мягкий
[ а ] гласный, ударный
г [ г ] согласный, звонкий парный, твёрдый, шумный
о [ а ] гласный, безударный
д [ д ] согласный, звонкий парный, твёрдый, шумный
а [ а ] гласный, безударный
Цветовая схема | й | а | г | а | д | а |
На сайте можно скачать программу «Русский алфавит — карточки для печати«, с помощью которой можно распечатать все буквы алфавита с их характеристиками для звуко-буквенного разбора слова.
Все статьи по русскому языку можно прочитать по метке «Русский язык«
P.S. Это мы сделали себе шпаргалку по фонетическому (звуко-буквенному) разбору слова — не потеряется и всегда под рукой :))
Навигация по записям
Как сделать фонетический разбор слова «друзья»? | 4 info
Чтобы сделать фонетический, или звуко-буквенный, разбор слова друзья, вначале разделим его на слоги и поставим ударение.
В слове содержится два гласных слогообразующих звука, следовательно столько же слогов:
дру-зья.
А теперь запишем звучание слова в виде транскрипции:
д р у з й а.
Небольшой комментарий к этой записи фонетического звучания существительного:
мягкий знак не обозначает звука, а после него буква «я», как, впрочем, буквы «е», «», «ю» в аналогичной позиции, обозначает два звука.
Дадим характеристику каждому звуку:
первый согласный звук д звонкий парный (пара — звук т), твердый парный:
второй звук р — согласный непарный (сонорный), твердый парный;
звук у гласный безударный;
согласный звук з звонкий парный (пара — звук с), мягкий парный;
согласный й непарный звонкий, или сонорный, непарный по признаку мягкости;
конечный гласный а ударный.
Подытожим звуко-буквенный анализ утверждением:
в слове «друзья» содержится 6 букв и 6 звуков.
Друзья:
- дру-зья;
- друзйа
Д д — согласный,звонкий,тврдый;
Р р — согласный,звонкий,тврдый;
У у — гласный,безударный;
З з- согласный,звонкий,мягкий;
Ь —
Я
- й- согласный,звонкий,мягкий;
- а — гласный,ударный.
6 букв,6 звуков.
Сделаем орфограф-ую запись слова, которое будем разбирать: друзья;
теперь запишем так, чтобы показать в нм ударение: друзья;
далее делим на слоги { дру-зья } — два слога;
сейчас оформим его в транскрипции {друзйа}, {з}, {и}-мягкие.
Наконец, дадим харак-ку всех зВуков, которые слова:
6 б, и 6 зв.
Фонетический анализ слова щука
Фонетический разбор слова щуки?
Русский язык | 5 – 9 классы
Фонетический разбор слова щуки!
ЩУКА, 2 слога, удар на 1 слог
щ – мягк, согл, глух
к – согл, тв, глух
Фонотичиски разбор слово друг и щука?
Фонотичиски разбор слово друг и щука.
Сделай фонетическую запись слов якорь телефон щука день ПОМОГИТЕ ПОЖАЛУЙСТА?
Сделай фонетическую запись слов якорь телефон щука день ПОМОГИТЕ ПОЖАЛУЙСТА.
Выполните звуко – буквенный разбор слова Щуку?
Выполните звуко – буквенный разбор слова Щуку.
Как сделать орфографический разбор слова щуку?
Как сделать орфографический разбор слова щуку?
Звуко – буквенный разбор слова щуку?
Звуко – буквенный разбор слова щуку.
Фонетический разбор слово Слово и надо?
Фонетический разбор слово Слово и надо.
Как звука буквеный разбор слова щука?
Как звука буквеный разбор слова щука.
ФОНЕТИЧЕСКИЙ РАЗБОР СЛОВА “ВМЕСТЕ”?
ФОНЕТИЧЕСКИЙ РАЗБОР СЛОВА “ВМЕСТЕ”.
И ФОНЕТИЧЕСКИЙ РАЗБОР СЛОВА “ОЧЕНЬ”.
Звуко – буквенный разбор слова щуку?
Звуко – буквенный разбор слова щуку.
Фонетический разбор слова группа фонетический разбор слова гербарий?
Фонетический разбор слова группа фонетический разбор слова гербарий.
Вы зашли на страницу вопроса Фонетический разбор слова щуки?, который относится к категории Русский язык. По уровню сложности вопрос соответствует учебной программе для учащихся 5 – 9 классов. В этой же категории вы найдете ответ и на другие, похожие вопросы по теме, найти который можно с помощью автоматической системы «умный поиск». Интересную информацию можно найти в комментариях-ответах пользователей, с которыми есть обратная связь для обсуждения темы. Если предложенные варианты ответов не удовлетворяют, создайте свой вариант запроса в верхней строке.
Картина «Птицелов» была написана В. Г. Перовым в 1870 году. Она изображает сцену ловли птиц на окраине густого многолетнего леса. Пожилой мужчина лежит на земле в золотистых лучах тёплого утреннего солнца и терпеливо ждёт, заманивая птицу в силок ..
. В словообразовательный – входит и разбор по морфемам : песчаному – песч – ан – ому корень, суффикс, окончание, основа песчан – белогрудых – бел – о – груд – ых корень, соед. Гласная, корень окончание, основа белогруд – Нужно указать способ образов..
Песчан – ∧ому⇒песокбел⊕грудых⇒белая грудь.
Стукнулся о камень или споткнулся о камень Совсем нет пользы.
Топор – помоему, всё слово корень.
1. подлежащее 2. Сказуемое 3. Дополнение 4. Определение.
(Повеств, невоскл, распр, простое, двух состав, полное, не осложнено) Дремал подчеркиваем – = = = = = Комок – – – – – – – – – – Этот – волнистой чертой На подоконнике – _. _. _. _. _ На солнце – _. _. _. _. _ Дремал – гл Этот – местоимение Комок ..
Повествовыательное, невосклицательное, распространенное. ( если ты этио имеешь в виду : 0).
Как сделать звуко-буквенный (фонетический) разбор слова “щука”?
Как сделать звуко-буквенный (фонетический) разбор слова “щука”?
Слово quot;щукаquot; очень простое слово с точки зрения фонетики, то есть слово не усложнено такими буквами, которые обозначают 2 звука, или знаками(мягкий знак, твердый знак). Запишем фонетическое слово(транскрипцию)-щука,звук щ всегда мягкий в русском языке, не обязательно ставить знак мягкости . Итак:
щ- согласный,глухой, мягкий , непарный
у- гласный, ударный
к- согласный,глухой, твердый, парный
а- гласный, безударный
4 буквы, 4 звука
Звуко-буквенный (фонетический) разбор слова quot;щукаquot; для взрослого человека прост, но вот для детишек — не всегда. Слоги дети учат в первом классе, не зная букв (новая методика). Поэтому и они с легкостью ответят, что в слове щука — 2 слога и ударение падает на первый слог. Посчитают 4 буквы. Остальное уже смогут ребята более старших классов. Они ответят, что слово состоит из четырех звуков.
Закончим с разбором.
щ щ — согласный звук, мягкий, глухой и непарный,
у у — гласный, ударный,
к к — согласный звук, твердый, глухой и парный,
а а — гласный, безударный
Фонетический разбор слова ЩУКА будет таким:
количество букв — четыре, количество звуков в слове также четыре.
Слово состоит из двух слогов: ЩУ-КА. Ударение будет падать на первый слог.
первая буква Щ дает звук щ — это непарный, согласный, глухой, мягкий звук,
вторая буква У дает звук у — это ударный гласный звук,
третья буква К дает звук к — это парный, согласный, глухой, тврдый звук,
четвертая буква А дает звук а — это гласный, безударный звук.
Фонетический разбор слова ЩУКА.
1) Слово состоит из двух слогов ЩУ — КА.
2) Ударение падает на первый слог, на букву У.
3) Транскрипция записывается следующим образом щука.
4) Характеристика каждого звука в слове:
- щ щ — согласный звук, мягкий, глухой и непарный,
- у у — гласный, ударение падает на этот звук,
- к к — согласный звук, твердый, глухой и парный,
- а а — гласный, безударный (так как в слове не может быть два ударных звука).
5) В слове ЩУКА 5 букв и такое же количество звуков — 5.
Делая фонетический разбор, для начала нужно определить количество букв в слове и в конце разбора подвести итог, сколько звуков в слове.
Первая буква Щ и звук щ
Вторая буква У и звук у
Третья буква К и звук к
Последняя А и звук а
После разбора получается, что ровно четыре звука по количеству букв.
Фонетический (звуко-буквенный) разбор слова quot;щукаquot; сделать несложно (мне кажется, что это вообще самый простой из всех видов разбора) — в нм всего четыре буквы, четыре звука, т.е., количество звуков совпадает с количеством букв. В слове два слога, первый из них является ударным.
Щ щ — согл., глух., мягк., непарн.
У у — гласн., ударн.
К к — согл., глух., тврд., парн.
А а — гласн., безударн.
Фонетический (звуко-буквенный) разбор слова quot; щука quot;.
- -й звук -Щ щ-согласный, глухой, не имеет пары по звонкости-глухости, мягкий,
- -й звук -У у-гласный, ударный,
- -й звук -К к-согласный, глухой, имеет пару по звонкости-глухости, твердый,,
- -й звук -А а-гласный, безударный.
Звуко-буквенный анализ слова предполагает характеристику каждого звука, которые передают буквы в слове. В слове quot;щукаquot;, как мы видим, всего четыре буквы, а слогов два: щу-ка. Теперь обратимся к звукам:
Буква Щ передает мягкий звук Щ — согласный, мягкий и глухой, не парный,
буква У передает ударный гласный звук У,
буква К передает звук К — он согласный, глухой (пара по звонкости Г), твердый
и последняя буква А передает безударный гласный А.
Итого в слове тоже четыре звука.
Щ щ-согласный, глухой, не имеет пары по звонкости-глухости, мягкий, не имеет пары по твердости-мягкости,
У у-гласный, ударный,
К к-согласный, глухой, имеет пару по звонкости-глухости, твердый, имеет пару по твердости, мягкости,
Разное — Страница 9 — РОСТОВСКИЙ ЦЕНТР ПОМОЩИ ДЕТЯМ № 7
Морфологический разбор слова «хорошо» Слово можно разобрать в 4 вариантах, в зависимости от того, в каком контексте оно используется.1 вариант разбора Часть речи: Наречие 2 вариант разбора Часть речи: Частица 3 вариант разбора Часть речи: Краткое прилагательное ХОРОШО — слово может быть как одушевленное так и неодушевленное, смотрите по предложению…
Почему нельзя убивать паука, который проник в ваш дом Фото: VadimV/Википедия Большинство людей относятся к паукам с опаской, а кто-то вообще испытывает панический страх при одном виде этих существ. Между тем, пауки, которые представляют реальную угрозу для человека, встречаются крайне редко, да и те нападают на людей только в целях самообороны. Все знают, что убить паука — плохая примета, но это…
Народные игры и забавы В Музее Русских Забав под открытым небом, созданном специально для возрождения русской народной игры, краеведами собраны игры, в которые вятские крестьяне играли век и более назад. Предлагаем Вашему вниманию некоторые из них: Малечина-калечина Малечина-калечина — старинная народная игра. Игра состоит в том, что палочку ставят вертикально…
Разбор по составу школьница — энцеклопедия секса Разбор по составу слова УЧЕНИЦА: уч/е/ниц/а. Подробный разбор, графическую схему и сходные по морфемному строению слова вы найдёте на сайте. Разбор по составу слова «ученица». Печать, Уотсон, – настоящее сокровище, если уметь ею пользоватьсяШкольница — школ(корень), ниц(суффикс), а(окончание), школьниц(основа слова). Мы видели, как она…
Как найти адрес передачи Битва Экстрасенсов | У передачи Битва экстрасенсов один-единственный электронный адрес почты, других адресов для связи с программой нет. В редакцию программы Битва Экстрасенсов нельзя также и позвонить, поскольку номера телефонов не даются. Даже если каким-то образом вы узнаете телефонные номера редакции, им вежливо откажут в общении…
Самые неожиданные вопросы и ответы игры «Что? Где? Когда?» — Российская газета4 сентября 1975 года ровно в 12:00 впервые в эфир вышла программа «Что? Где? Когда?». Сегодня правила этой игры может рассказать даже ребенок, но мало кто помнит, что 38 лет назад не было ни знатоков, ни волчка, ни знаменитой…
What does npm exec do? What is the difference between «npm exec» and «npx»?What are the building blocks of OWL ontologies?Learn more about «RDF star», «SPARQL star», «Turtle star», «JSON-LD star», «Linked Data star», and «Semantic Web star».The Hadamard gate is one of the simplest quantum gates which acts on…
Школьные каникулы на 2021 год: когда будут отдыхать ученики школ в Томской областиДмитрий Кандинский / vtomske.ruЗимние каникулы в школах Томской области начнутся 28 декабря 2020 и продлятся до 10 января, сообщили в администрации региона. Уже стало известно, в какие сроки школьники будут отдыхать весной, а также примерные даты каникул летом…
Значение имени Ирина (Ира) для девочки, характер и судьба. Женское имя Ирина по происхождению древнегреческое. Скорее всего образовано от имени «Eirene» (Эйрена), что принадлежало древнегреческой Богине мирной жизни. Буквальная трактовка значения этого имени звучит как «мир и покой». Хотя имеются и другие версии, но в России они не пользуются авторитетом. Имя Ирина…
Дидактический материал по русскому языку по теме «Фонетический разбор слова. 4 класс» Фонетический разбор слова План разбора: Запиши слово. Поставь ударение. Раздели слово на слоги. В квадратных скобках запиши слово звуками. Выпиши в столбик все буквы этого слова. Справа от каждой буквы, в квадратных скобках, напиши звук, который эта буква…
125 | Фонетика: статьи на gramota.me
Если говорить про фонетический разбор слова «поэзия», который требуется выполнить, то будет подразумеваться анализ букв и звуков, вошедших в предварительно составленную транскрипцию. Таким должен быть звуко-буквенный разбор слова «поэзия». Осуществим его. Фонетический разбор Сколько звуков и букв в слове «поэзия»? Предлагаю посчитать. Этот… Читать »
Раздел: Фонетика ПодробнееЕсли обсуждать фонетический разбор слова «женя», который требуется правильно провести, то будет подразумеваться подбор характеристик букв и звуков, входящих в его транскрипцию. Таким должен быть звуко-буквенный разбор слова «женя». Сделаем его. Фонетический разбор Сколько звуков и букв в слове «женя»? Давайте посмотрим. Этот момент будет… Читать »
Раздел: Фонетика ПодробнееЕсли говорить про фонетический разбор слова «цель», который важно верно провести, то будет подразумеваться предоставление характеристик букв и звуков, входящих в составленную для него транскрипцию. Такой должен быть звуко-буквенный разбор слова «цель». Проведем его. Фонетический разбор Сколько звуков и букв в слове «цель»? Давайте посчитаем… Читать »
Раздел: Фонетика ПодробнееЕсли размышлять про фонетический разбор слова «учиться», который нужно грамотно сделать, то будет идти речь про подбор характеристик букв и звуков, входящих его транскрипцию. Таким должен быть звуко-буквенный разбор слова «учиться». Проведем его. Фонетический разбор Сколько звуков и букв в слове «учиться»? Давайте сделаем расчет. Этот этап… Читать »
Раздел: Фонетика ПодробнееЕсли рассуждать про фонетический разбор слова «пошёл», который нужно правильно провести, то будет подразумеваться подбор характеристик букв и звуков, входящих в составленную для него транскрипцию. Таким должен быть звуко-буквенный разбор слова «идёшь». Проведем его. Фонетический разбор Сколько звуков и букв в слове «идёшь»? Давайте посчитаем.… Читать »
Раздел: Фонетика ПодробнееЕсли говорить про фонетический разбор слова «пошёл», который требуется грамотно провести, то будет подразумеваться анализ букв и звуков, входящих в предварительно составленную транскрипцию. Таким должен быть звуко-буквенный разбор слова «пошёл». Осуществим его. Фонетический разбор Сколько звуков и букв в слове «пошёл»? Давайте посчитаем. Этот… Читать »
Раздел: Фонетика ПодробнееДля того, чтобы разобрать слово “лежал” с точки зрения его звукового и буквенного состава нужно опираться на главные принципы и план проведения. Основы анализа базируются на правильном произношении слова. Итак, приступим к фонетическому разбору единицы языка “лежал”. Фонетический разбор Определим постановку ударения в слове “лежал”: лежАл.… Читать »
Раздел: Фонетика ПодробнееДля того, чтобы проанализировать слово “брусника” с точки зрения его звукового и буквенного состава необходимо опираться на главные принципы и план проведения. Основы анализа базируются на правильном произношении слова. Итак, приступим к фонетическому разбору единицы языка “брусника”. Фонетический разбор Определим постановку ударения в слове… Читать »
Раздел: Фонетика ПодробнееФонетические алгоритмы / Хабр
Фонетические алгоритмы сопоставляют двум словам со схожим произношением одинаковые коды, что позволяет осуществлять сравнение и индексацию множества таких слов на основе их фонетического сходства.Часто довольно трудно найти в базе нетипичную фамилию, например:
— Леха, поищи в нашей базе Адольфа Швардсенеггера,В этом случае использование фонетических алгоритмов (особенно в сочетании с алгоритмами нечеткого сопоставления) может значительно упростить задачу.
— Шворцинегира? Нет такого!
Такие алгоритмы очень удобно использовать при поиске в базах по спискам людей, в программах проверки орфографии. Зачастую они используются совместно с алгоритмами нечеткого поиска (которые, несомненно, заслуживают отдельной статьи), предоставляя пользователям удобный поиск по именам и фамилиям в различных базах данных, списках сотрудников и так далее.
В этой статье я рассмотрю наиболее известные алгоритмы, такие как Soundex, Daitch-Mokotoff Soundex, NYSIIS, Metaphone, Double Metaphone, русский Metaphone, Caverphone.
Soundex
Одним из первых был алгоритм Soundex, изобретенный еще в 10-x годах прошлого века Робертом Расселом. Этот алгоритм (а точнее, его американская версия) сопоставляет словам численный индекс вида A126. Принцип его работы основан на разбиении согласных букв на группы с порядковыми номерами, из которых затем и составляется результирующее значение. Позднее также был предложен ряд улучшений.
Первая буква сохраняется, последующие буквы сопоставляются цифрам по таблице. Символы, не представленные в таблице (а это все гласные и некоторые согласные), игнорируются. Смежные символы, или символы, разделенные буквами H или W, входящие в одну и ту же группу, записываются как один. Результат обрезается до 4 символов. Недостающие позиции заполняются нулями. Несложно заметить, что после всех этих процедур остается всего лишь 7 тысяч различных вариаций такого кода, что влечет за собой множество совершенно ничем не похожих друг на друга слов, имеющих одинаковый Soundex-код. Таким образом, результат в большинстве случаев включает в себя большое количество «ложноположительных» значений.
В улучшенной версии, как можно заметить, буквы разбиты на большее количество групп. Помимо этого, никакого особого внимания буквам H и W не уделяется, они просто игнорируются. Кроме того, никаких операций с длиной результата не производится — код не имеет фиксированной длины и не обрезается.
Примеры
Оригинальный Soundex:
D341 → Дедловский, Дедловских, Дидилев, Дителев, Дудалев, Дудолев, Дутлов, Дыдалев, Дятлов, Дятлович.
N251 → Нагимов, Нагмбетов, Назимов, Насимов, Нассонов, Нежнов, Незнаев, Несмеев, Нижневский, Никонов, Никонович, Нисенблат, Нисенбаум, Ниссенбаум, Ногинов, Ножнов.
Улучшенный Soundex:
N8030802 → Насимов, Нассонов, Никонов.
N80308108 → Нисенбаум, Ниссенбаум.
N8040802 → Нагимов, Нагонов, Неганов, Ногинов.
N804810602 → Нагмбетов.
N8050802 → Назимов, Нежнов, Ножнов.
В среднем, на одно значение кода Soundex приходится 21 фамилия. В случае же улучшенной версии Soundex, к одному и тому же коду преобразуются всего 2-3 фамилии.
NYSIIS
Разработанный в 1970 году как часть системы «New York State Identification and Intelligence System», этот алгоритм дает несколько лучшие результаты относительно оригинального Soundex, используя более сложные правила преобразования исходного слова в результирующий код. Этот алгоритм разработан для работы именно с американскими фамилиями.
Алгоритм вычисления кода NYSIIS
- Преобразовать начало слова по следующим правилам:
MAC → MCC
KN → N
K → C
PH, PF → FF
SCH → SSS - Преобразовать конец слова по следующим правилам:
EE → Y
IE → Y
DT, RT, RD, NT, ND → D - Затем все буквы, кроме первой, преобразуются по следующим правилам:
EV → AF
A, E, I, O, U → A
Q → G
Z → S
M → N
KN → N
K → C
SCH → SSS
PH → FF
После гласных: удалить H, преобразовать W → A - Удалить S на конце
- Преобразуем AY на конце → Y
- Удалить A на конце
- Обрезать до 6 символов (необязательный шаг).
Примеры
CASPARAVAS → Каспаравичус, Касперович, Каспирович.
CATNACAV → Катников, Цитников, Цотников.
LANSANC → Ленченко, Леонченко, Линченко, Лунченко, Лямзенко.
PRADSC → Приходский, Проходский, Прудский, Прудских, Прудской.
STADNACAV → Стадников.
NYSIIS преобразует к одному и тому же коду немногим более двух фамилий.
Daitch-Mokotoff Soundex
Этот алгоритм в 1985 году разработали два генеалога — Гарри Мокотофф и Рэнди Дэйч, стремясь достичь лучших, относительно оригинального Soundex, результатов при работе со восточно-европейскими (в том числе русскими) фамилиями.
Этот алгоритм имеет мало общего с оригинальным Soundex, разве что результатом всё так же остается последовательность цифр, однако теперь первая буква также кодируется.
Он имеет значительно более сложные правила конверсии — теперь в формировании результирующего кода участвуют не только одиночные символы, но и последовательности из нескольких символов. Кроме того, результат вида 023689 обеспечивает около 600 тысяч различных вариаций кода, что вкупе с усложненными правилами уменьшает количество «лишних», т.е. «ложноположительных» слов в результирующем множестве.
Преобразования осуществляются по следующей таблице (порядок преобразований соответствует порядку буквосочетаний в таблице):
Исходные буквосочетания | В начале | За гласной | Остальное |
AI, AJ, AY, EI, EY, EJ, OI, OJ, OY, UI, UJ, UY | 0 | 1 | |
AU | 0 | 7 | |
IA, IE, IO, IU | 1 | ||
EU | 1 | 1 | |
A, UE, E, I, O, U, Y | 0 | ||
J | 1 | 1 | 1 |
SCHTSCH, SCHTSH, SCHTCH, SHTCH, SHCH, SHTSH, STCH, STSCH, STRZ, STRS, STSH, SZCZ, SZCS | 2 | 4 | 4 |
SHT, SCHT, SCHD, ST, SZT, SHD, SZD, SD | 2 | 43 | 43 |
CSZ, CZS, CS, CZ, DRZ, DRS, DSH, DS, DZH, DZS, DZ, TRZ, TRS, TRCH, TSH, TTSZ, TTZ, TZS, TSZ, SZ, TTCH, TCH, TTSCH, ZSCH, ZHSH, SCH, SH, TTS, TC, TS, TZ, ZH, ZS | 4 | 4 | 4 |
SC | 2 | 4 | 4 |
DT, D, TH, T | 3 | 3 | 3 |
CHS, KS, X | 5 | 54 | 54 |
S, Z | 4 | 4 | 4 |
CH, CK, C, G, KH, K, Q | 5 | 5 | 5 |
MN, NM | 66 | 66 | |
M, N | 6 | 6 | 6 |
FB, B, PH, PF, F, P, V, W | 7 | 7 | 7 |
H | 5 | 5 | |
L | 8 | 8 | 8 |
R | 9 | 9 | 9 |
CH → TCH
CK → TSK
C → TZ
J → DZH
Примеры
095747 → Архипцев, Архипцов, Архипычев, Арцыбасов, Арцыбашев, Арчибасов
095757 → Архипков, Архипцев, Архипцов, Архипычев
584360 → Галстян, Галустян, Гильштейн, Глистин, Глуздань, Голштейн, Гольдштеин, Гольдштейн, Калустьян, Хлистун, Хлыстун, Хлюстин.
К одному и тому же коду этот алгоритм преобразует в среднем 5 фамилий.
Впоследствии Александр Бейдер и Стивен Морзе разработали Beider-Morse Name Matching Algorithm, нацеленный на уменьшение количества «ложноположительных» значений относительно Daitch-Mokotoff Soundex при работе с еврейскими (ашкенази) фамилиями.
Metaphone
Несколько лучшими характеристиками обладает алгоритм Metaphone (1990 год), отличающийся от предыдущих алгоритмов несколько иным подходом к процессу кодирования: он преобразует исходное слово с учетом правил английского языка, используя заметно более сложные правила, и при этом теряется значительно меньше информации, так как буквы не разбиваются на группы. Итоговый код представляет собой набор символов из множества 0BFHJKLMNPRSTWXY, в начале слова также могут быть гласные из множества AEIOU.
Алгоритм вычисления кода Metaphone
- Удаляем все повторяющиеся соседние буквы, за исключением буквы C.
- Начало слова преобразовать по следующим правилам:
KN → N
GN → N
PN → N
AE → E
WR → R - Удаляем на конце букву B, если она идет после M.
- Заменяем C по следующим правилам
На Х: CIA → XIA, SCH → SKH, CH → XH
На S: CI → SI, CE → SE, CY → SY
На K: C → K - Заменяем D по следующим правилам
На J: DGE → JGE, DGY → JGY, DGI → JGY
На T: D → T - Заменяем GH → H, если это буквосочетание стоит не в конце и не перед гласной.
- Заменяем GN → N и GNED → NED, если эти буквосочетания стоят в конце.
- Заменяем G по следующим правилам
На J: GI → JI, GE → JE, GY → JY
на K: G → K - Удаляем все H, идущие после гласных, но не перед гласными.
- Выполняем последующие преобразования по правилам:
CK → K
PH → F
Q → K
V → F
Z → S - Заменяем S на X:
SH → XH
SIO → XIO
SIA → XIA - Заменяем T по следующим правилам
На X: TIA → XIA, TIO → XIO
На 0: TH → 0
Удаляем: TCH → CH - В начале слова преобразовать WH → W. Если после W нет гласной, то удалить W.
- Если X в начале слова, то преобразовать X → S, иначе X → KS
- Удалить все Y, которые не находятся перед гласными.
- Удалить все гласные, кроме начальной.
Примеры
AKXN → Агашин, Акаченок, Акишин, Аксионенко, Аксионов, Акчунаев, Акшанов, Акшенцев, Акшинский, Акшинцев, Акшонов.
FSLX → Василишин, Васильчак, Васильченко, Васильчик, Васильчиков, Васильченко, Васильчук, Василющенко.
SRFM → Серафимов, Серафимский, Серафимчук, Церейфман.
Одно и то же значение кода Metaphone имеют в среднем 6 фамилий.
Double Metaphone
Double Metaphone (2000 год) несколько отличается от других фонетических алгоритмов, генерируя из исходного слова не один, а два кода (оба длиной до 4 символов) — один отражает основной вариант произношения слова, другой же — альтернативную версию. Он имеет большое количество различных правил, учитывающих, помимо всего прочего, различное происхождение слов, уделяя внимание восточно-европейским, итальянским, китайским словам и так далее. Правила преобразований достаточно многочисленны, я не буду их публиковать, а желающие смогут прочитать о них в статье журнала Dr Dobbs.
Примеры
JXRF → Гишаров.
KKRF → Гагаров, Кагаров, Качаровский, Качеровский, Качуривский, Качуров, Качуровский, Кичеров, Кокарев, Кокоуров, Кокоуров, Кочаров, Кочуров, Кукарев, Цакиров, Цокуров, Цугров.
KXRF → Гишаров, Гочаров, Качеров, Качеровский, Кашаревский, Кочаров, Кочерев, Кочеряев, Кочураев, Кошарев, Кошеров.
PNFS → Бановский, Бахновский, Биневский, Бинявский, Буйновский, Буяновский, Паневский, Пановский, Пановских, Пеньевский, Пиневский, Пиуновский, Пихновский.
Double Metaphone сопоставляет в среднем 8-9 фамилий одному и тому же коду.
Русский Metaphone
В 2002 году в 8-ом выпуске журнала «Программист» была опубликована статья Петра Каньковски, рассказывающая о его адаптации английской версии алгоритма Metaphone к суровым сибирским морозам, медведям и балалайкам. Этот алгоритм преобразует исходные слова в соответствии с правилами и нормами русского языка, учитывая фонетическое звучание безударных гласных и возможные «слияния» согласных при произношении. Он показывает очень хорошие результаты на практике, несмотря на то, что основывается на довольно простых правилах. Все буквы разбиты на группы по звучанию — гласные и согласные (vowels и consonants соответственно в английской терминологии), глухие и звонкие. Звонкие согласные преобразуются в соответствующие им парные глухие, объединяются «сливающиеся» при произношении последовательности букв, и проводятся некоторые другие манипуляции. Ниже я приведу немного доработанный вариант, который, в отличие от оригинала Петра Каньковски, привносит правила, связанные с фонетической эквивалентностью Ц и ТС или ДС, и не сжимает окончания — байты экономить — это не наша задача.
Алгоритм вычисления кода русского Metaphone
- Для всех гласных букв проделать следующие операции.
ЙО, ИО, ЙЕ, ИЕ → И
О, Ы, Я → А
Е, Ё, Э → И
Ю → У - Для всех согласных букв, за которыми следует любая согласная, кроме Л, М, Н или Р, либо же для согласных на конце слова, провести оглушение:
Б → П
З → С
Д → Т
В → Ф
Г → К - Склеиваем ТС и ДС в Ц:
ТС → Ц
В случае Адольфа Швардсенеггера результатом работы алгоритма русского Metaphone будет:
Таким образом, алгоритм в данном случае отражает реальное фонетическое сходство этих двух фамилий.
Примеры
ВИТАФСКИЙ → Витавский, Витовский.
ВИТИНБИРК → Витенберг, Виттенберг.
НАСАНАФ → Насанов, Насонов, Нассонов, Носонов.
ПИРМАКАФ → Пермаков, Пермяков, Перьмяков.
Этот алгоритм преобразует к одному и тому же коду в среднем 1-2 фамилии.
Caverphone
Алгоритм Caverphone был разработан в 2002 году в рамках одного из новозеландских проектов для сопоставления данных в старых и новых электоральных списках, потому он наиболее ориентирован на местное произношение, хотя и для русских фамилий он дает вполне приемлемые результаты.
Алгоритм вычисления кода Caverphone
- Преобразовать имя или фамилию в нижний регистр (алгоритм чувствителен к регистру).
- Удалить буквы e на конце.
- Преобразовать начало слова по следующей таблице (актуально для местных новозеландских имен и фамилий). При этом цифра 2 означает временную метку для согласной буквы, которая впоследствии будет удалена.
cough rough tough enough gn mb cou2f rou2f tou2f enou2f 2n m2 - Провести замены символов по следующей таблице:
cq ci ce cy tch c q x v dg tio tia d ph b sh z 2q si se sy 2ch k k k f 2g sio sia t fh p s2 s - Заменить все гласные в начале слова на A, в остальных случаях — на 3. h
h r3 r$ r l3 l$ l N W3 Wh4 3 2 A 2 R3 3 2 L3 3 2 - Удалить все цифры 2. Если на конце слова осталась цифра 3, то заменить её на A. Затем удалить все цифры 3.
- Обрезать слово до 10 символов, либо же дополнить до 10 символов единицами.
Примеры
KPRLN11111 → Габрелян, Габриэлян, Габриэльян, Капарулин, Капралин, Капрелян.
MSRFK11111 → Мейзерович, Мисарович, Мисюревич.
PLLF111111 → Балалаев, Балалиев, Балалуев, Билалиев, Билалов, Билялов, Болелов, Палилов, Полилов, Полуляхов.
Caverphone сопоставляет одному и тому же коду около 4-5 фамилий.
Итого
Большая часть этих алгоритмов реализована на множестве языков, в том числе на C, C++, Java, C# и PHP. Некоторые из них, например Soundex и Metaphone, интегрированы или реализованы в виде плагинов для многих популярных СУБД, а также используются в составе полноценных поисковых движков, например, Apache Lucene. Область их применения довольно специфична, ведь значительного повышения удобства для пользователей можно добиться лишь при поиске фамилий, но тем не менее грамотное их использование — это плюс для поисковых систем.
Ссылки
- Код на Java к статье. Яндекс.Диск
- Реализации Soundex, Refined Soundex, Metaphone, Double Metaphone, Caverphone на Java.
Apache Commons Codec - Реализация NYSIIS на Java. Проект Egothor
- Реализация Daitch-Mokotoff Soundex на Java. http://joshualevy.tripod.com/genealogy/dmsoundex/dmsoundex.zip
- Описание Soundex. http://en.wikipedia.org/wiki/Soundex
- Описание Daitch-Mokotoff Soundex. http://www.jewishgen.org/infofiles/soundex.html
- Описание NYSIIS.
http://en.wikipedia.org/wiki/New_York_State_Identification_and_Intelligence_System - Описание Metaphone. http://en.wikipedia.org/wiki/Metaphone
- Описание Double Metaphone. http://www.drdobbs.com/article/184401251
- Описание русского Metaphone. http://forum.aeroion.ru/topic461.html
- Описание Caverphone. http://en.wikipedia.org/wiki/Caverphone
- Онлайн-демо Soundex. http://www.gedpage.com/soundex.html
- Онлайн-демо NYSIIS. http://www.dropby.com/NYSIIS.html
- Онлайн-демо Daitch-Mokotoff Soundex. http://stevemorse.org/census/soundex.html
- Онлайн-демо Metaphone. http://www.searchforancestors.com/utility/metaphone.php
Авангард лингвистики
Главные редакторы
Александр Бергс
Оснабрюкский университет, Германия
Эбигейл К. Кон
Корнельский университет, Итака, Нью-Йорк, США
Джефф Гуд
Университет в Буффало, Нью-Йорк, США
Район Редакторы
Кристин Димрот (Мюнстерский университет, Германия) [овладение вторым языком, двуязычие, информационная структура]
Сюзанна Флах (Невшательский университет, Швейцария) [когнитивная лингвистика, количественная корпусная лингвистика, (диахроническая) строительная грамматика, лексико-грамматика; Английский]
Диана Форкер (Йенский университет, Германия) [языковая документация, функциональное описание языка, языковые контакты; Восточно-кавказский, западно-кавказский, картвельский, армянский]
Алиса Габи (Университет Монаша, Австралия) [языки австралийских аборигенов, когнитивная лингвистика, лингвистическая антропология]
Эйтан Гроссман (Еврейский университет Иерусалима) [типология, историческая лингвистика, языковые контакты; Афроазиатские языки (особенно египетско-коптский и семитский)]
Мие Хирамото (Национальный университет Сингапура, Сингапур) [социолингвистика, лингвистическая антропология, гендер и сексуальность]
Томас Хоффманн (Католический университет Эйхштетт-Ингольштадт, Германия) [строительная грамматика, использование- основанная лингвистика, корпусная лингвистика; разновидности английского языка]
Гийом Жак (CRLAO, CNRS, Париж, Франция) [историческая лингвистика, языковая документация, грамматикализация; Сино-тибетские, алгонкинские, сиуанские языковые семьи]
Сигету Кавахара (Университет Кейо, Япония) [фонетика, фонология, экспериментальная фонология; Японский]
Лорел Маккензи (Нью-Йоркский университет, США) [социолингвистика, языковые вариации и изменения, диалектология; разновидности английского языка, разновидности французского]
Арне Нагельс (Университет Майнца, Германия) [нейролингвистика, психолингвистика, языковые дисфункции / расстройства]
Бхувана Нарасимхан (Университет Колорадо, США) [освоение первого языка, дискурс-прагматика, лексическая семантика; Хинди, тамильские языки]
Джейсон Шоу (Йельский университет, США) [фонетика, фонология, просодия]
Кайус Синнемяки (Университет Хельсинки, Финляндия) [типология, языковой контакт, морфология, сложность языка]
Ребекка Старр (Национальный университет Сингапура , Сингапур). [социолингвистика, языковые вариации и изменения, приобретение вариативности; Японский, китайский языки, мировой английский]
Реми ван Трайп (Sony Computer Science Laboratory, Париж, Франция) [компьютерная лингвистика, строительная грамматика, эволюционная лингвистика]
Ева Виттенберг (Калифорнийский университет, Сан-Диего, США) [психолингвистика, обработка языков, лингвистическая архитектура; Немецкий, английский]
Игорь Янович (Тюбингенский университет, Германия) [компьютерная лингвистика, историческая лингвистика, семантика]
Йохен Целлер (Университет Квазулу-Наталь, ЮАР) [морфология, синтаксис, лексика; Языки банту]
Джорджия Зеллоу (Калифорнийский университет, Дэвис, США) [фонетика, фонология, восприятие речи]
Статус фонетических явлений в конце слова | Рач
Статус фонетических явлений в конце слова
Меган Роуч, Аня Лунден
Абстрактные
Правый край слова является известной областью для таких процессов, как фонологический звук.Утверждалось, что это результат аналогии из высших просодических областей, а не изменение, мотивированное in situ (Hock 1999, Hualde and Eager 2016). Было обнаружено, что фонетические явления на уровне слов окончательного удлинения и окончательного обособления происходят изначально в виде слова-finally (Lunden 2006, 2017, Nakai et al. 2009), несмотря на утверждения, что они не имеют естественного фонетического давления, происходящего из этого положения (Hock 1999). Мы представляем результаты исследований искусственного обучения языку, которые стремятся ответить на вопрос, могут ли сигналы фонетического уровня о позиции последнего слова помочь в синтаксическом анализе языка.Если это так, это свидетельствует о том, что слушатели могут использовать фонетические явления на уровне слов, которые вместе с исследованиями, которые обнаружили, что они присутствуют, говорят об их внутреннем присутствии на уровне слов. Мы обнаружили, что взрослые слушатели лучше способны распознавать слова, которые они слышали в речевом потоке, и лучше способны отвергать слова, которые они не слышали, когда окончательное удлинение присутствовало на правом краю слова. Не было обнаружено, что финальное высвобождение дает такой же импульс синтаксическому анализу.
Ключевые слова
фонологический домен; искусственное изучение языка; заключительная песня; окончательное удлинение
DOI: https: // doi.org / 10.3765 / plsa.v5i1.4730
Copyright (c) 2020 Меган Роуч, Аня Лунден
Эта работа находится под международной лицензией Creative Commons Attribution 4.0.
Лингвистическое общество Америки
Развитие научного изучения языка с 1924 года
ISSN (онлайн): 2473-8689
Эта публикация предоставляется бесплатно для читателей и бесплатно для авторов, отчасти благодаря тому, что вы продолжаете Членство в LSA и ваши пожертвования в фонд открытого доступа.
Исследование поведения опекунов и младенцев с использованием вычислительной модели
Образец цитирования: Howard IS, Messum P (2014) Обучение произношению первых слов на трех языках: исследование поведения опекунов и младенцев с использованием вычислительной модели ребенок. PLoS ONE 9 (10): e110334. https://doi.org/10.1371/journal.pone.0110334
Редактор: Йохан Болхуис, Утрехтский университет, Нидерланды
Поступила: 25 апреля 2014 г .; Принята к печати: 12 сентября 2014 г .; Опубликовано: 21 октября 2014 г.
Авторские права: © 2014 Howard, Messum.Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.
Финансирование: Эта работа изначально была выполнена авторами в их собственное время, а позже она была поддержана Плимутским университетом. Спонсор не имел никакого отношения к дизайну исследования, сбору и анализу данных, принятию решения о публикации или подготовке рукописи.
Конкурирующие интересы: Пирс Мессум является директором и акционером коммерческой компании Pronuction Science Ltd., которая производит материалы для обучения языкам. Это не меняет приверженности авторов политике PLOS ONE в отношении обмена данными и материалами.
Введение
Фон
В развитии произношения слов и фраз, несомненно, задействован ряд механизмов обучения, включая некоторые формы имитации. Например, когда маленькие дети перенимают свои первые окружающие словоформы, они вполне могут воссоздать их с помощью мимикрии «целого слова» [1].Точно так же «прогрессивные фонологические идиомы» [2], высказывания, произношение которых заметно опережает или отстает от общей производительности ребенка, могут быть воссозданы как не проанализированные целые. Но считается, что в какой-то момент произношение слов изучается путем (1) их анализа для определения составляющих их речевых звуков (которые обычно представляют собой фрагменты размером со слог, а не отдельные фонемы) и (2) воспроизведения этих элементов в их правильном виде. приказ. Эта форма имитации, копирование звуков речи в последовательном порядке, требует, чтобы младенец уже решил «проблему соответствия» [3] для звуков речи.То есть он разработал соответствия между его вокально-моторными схемами (VMS) [4] и звуками речи, которые он слышит, так что результат первого воспринимается его слушателями как эквивалентный (но не обязательно подобный) последнему. .
Обычно считается, что дети решают эту задачу соответствия посредством слухового сопоставления под самоконтролем. В таком описании младенец сравнивает издаваемый им речевой звук с тем, что он слышит, издаваемым другими [5], или с тем, что он слышал в прошлом [6].Затем он полагается на собственное суждение об их сходстве, чтобы улучшить свои последующие результаты. В другом сообщении предполагается, что после того, как младенец открыл для себя звуковые произведения, они делают аналогичные акустические последовательности в окружающей среде особенно заметными с помощью «артикуляционного фильтра». Это облегчает ему сопоставление и соотнесение некоторых своих произведений с произведениями в его лингвистической среде [7]. Однако эти описания требуют, чтобы младенец был в состоянии сравнивать акустические качества своих звуков и звуков речи других людей.Эта предполагаемая способность проблематична по ряду причин [8]. Действительно, очевидное отсутствие акустической саморегуляции речевого вывода у младенцев [9] и даже у некоторых взрослых [10] также говорит против такого механизма акустического согласования. Более того, в рамках парадигмы акустического соответствия нет объяснения хорошо известного феномена «рыба / рыба» в речи младенца, при котором речь ребенка воспроизводится (например, «fis») и правильная форма L1, которую он слышит («рыба» ) акустически различаются. Загадка состоит в том, что неправильные постановки ребенка остаются стабильными дольше, чем можно было бы ожидать, несмотря на очевидные акустические свидетельства несоответствия, доступные ему; несоответствие, которое он может различать в речи других и которое часто явно привлекает его внимание опекуном [11] — [13].
Было много предыдущих вычислительных моделей развития речи; см. [14] для подробного обзора. Они, как правило, касались других вопросов, нежели те, что были в нашей работе здесь. В частности, они предположили, что слуховое согласование — беспроблемный механизм для обучения произношению звуков речи. Некоторые также игнорировали или преуменьшали значение проблемы нормализации, которая возникает из-за разных размеров речевых трактов взрослых и младенцев и неизбежных различий в звуковых качествах, которые возникают в результате [15] — [22].
Тем не менее, группа Asada определила проблемы с традиционным подходом и смоделировала решения для обучения гласным, которые используют аналогичную парадигму подкрепления и имитации опекуна, что и наша [23] — [26]. В целом основное различие между их набором исследований и нашим состоит в том, что они сосредоточены на начальном обучении и последующем развитии качеств гласных у младенца, моделируя различные структурные аспекты взаимодействия младенца и опекуна. Elija, с другой стороны, представляет собой продольную модель, начинающуюся от обнаружения звуков речи (как гласных, так и согласных) и заканчивающуюся имитацией слов.Мы разделяем то же убеждение, что младенцы недостаточно хорошо подготовлены для решения проблемы соответствия сами посредством слухового сопоставления, и что решение может быть найдено в рамках динамики взаимодействия воспитателя и младенца.
В этой статье мы рассматриваем альтернативу общепринятому представлению о слуховом сопоставлении о том, как младенец учится произносить L1. Альтернативный подход включает в себя основной механизм, предложенный Гаттегно [27] и разработанный Мессумом [8]. Мы тестируем это с помощью вычислительной модели под названием Elija [28], и, в частности, мы сосредотачиваемся на роли, которую играют воспитатели во взаимодействии с младенцами.(Мы отмечаем, что он хотел бы назвать нашу младенческую Элизу, в честь женского персонажа в сериале Шоу Pygmalion и мюзикле My Fair Lady , который выучил «Полученное произношение» у профессора фонетики. Однако Элиза — это имя известного , новаторская система искусственного интеллекта [29]. Кроме того, мы можем более эффективно использовать местоимения, когда полагаем, что ребенок мужского пола и женщина, ухаживающая за ним.)
Элайджа начинает с «открытия» двигательных паттернов своего голосового аппарата, который производит звуки.Это сформулировано как задача обучения без учителя.
Затем Элия взаимодействует с опекуном с двумя эффектами. Во-первых, он сохраняет те двигательные паттерны, которые генерировали звуки, на которые отвечал опекун, и отбрасывает те, которые игнорировались. Таким образом, ответ опекуна используется как простой механизм выбора.
Во-вторых, он решает проблему двунаправленного соответствия между звуками, которые он слышит, и теми, которые он производит. Он делает это, используя естественное, хорошо подтвержденное взаимодействие, в котором опекун голосом реагирует на продукцию младенца; взаимодействие, в котором имитация обычно задействована и считается вовлеченной обеими сторонами, но в большей степени осуществляется опекуном, чем ребенком. Важно отметить, что в этом взаимодействии любое суждение о звуковом сходстве (или эквивалентности), которое имеет место, делается лицом , осуществляющим уход, , а не Элайджей. Наконец, используя способность Элайджи анализировать вводимые речевые высказывания с точки зрения недавно приобретенного набора эквивалентов его собственных токенов, каждый воспитатель может научить Элайджу произносить несколько простых слов путем последовательного подражания на ее родном языке (одном из трех европейских языков). .
Основная цель настоящего исследования заключалась в том, чтобы продемонстрировать, что Элайджа можно научить говорить первые слова на трех языках, и изучить поведение опекуна, которое возникает во время голосового взаимодействия младенца с опекуном.Хотя известно, что в реальной жизни лепет младенцев (обнаружение двигательных паттернов) и взаимодействие с опекунами пересекаются во времени, это не было смоделировано в этой версии Elija, которая вместо этого выполнялась в три отдельных этапа по нескольким причинам. К ним относятся необходимость ограничивать время взаимодействия с лицами, осуществляющими уход, и требование, чтобы все лица, осуществляющие уход, слышали одни и те же звуки, чтобы можно было сравнивать их ответы.
Неконтролируемое обнаружение звука Элайей
В процессе речевого развития младенцы проходят несколько идентифицируемых стадий [30].В течение нескольких месяцев после рождения они начинают издавать квазигласные звуки и ворковать. В течение следующих нескольких месяцев они начинают маргинальный лепет; производя гласные, малиновые и визжащие. Канонический лепет можно начинать с 5 месяцев. Это начальное развитие, по-видимому, является результатом бесконтрольных экспериментов младенца со своим речевым аппаратом.
Чтобы смоделировать это естественное развитие, Элайджа начинает с исследования своего голосового аппарата. Он создает двигательную активность, которая перемещает его голосовые артикуляторы из состояния покоя, и он оценивает сенсорные последствия [31]: иногда это приводит к генерации акустического выхода, а иногда сомато-сенсорным эффектам, таким как прикосновение, возникающее в результате закрытия речевого тракта. Действуя на эту обратную связь, он пытается улучшить свои двигательные действия в соответствии со схемой вознаграждения, включающей несколько терминов, выбранных так, чтобы быть правдоподобными с точки зрения развития. Таким образом, его исследования приводят к развитию двигательных паттернов для производства звуков, которые впоследствии могут оказаться полезными в качестве звуков речи. (Примечание: у реальных младенцев двигательные паттерны, которые производят звуки и стабилизируются, описываются как вокально-двигательные схемы (VMS) [4].) Процесс обнаружения двигательных паттернов, используемый в Elija, проиллюстрирован на рис.1.
Рис. 1. Элайджа учится на лепете.
Панель A: (виртуальная) двигательная активность Элайджи приводит в движение его голосовой аппарат, и он может исследовать сенсорные последствия этой активности (1). Иногда это приводит к появлению акустического сигнала (2). Присутствие акустического выхода может быть замечено Elija (3a), как и другие сомато-сенсорные последствия движения речевого тракта, такие как прикосновение, возникающее в результате закрытия речевого тракта (3b). Исследование может привести к открытию двигательного паттерна (4).Панель B: Обнаруженный моторный паттерн сохраняется в моторной памяти (5).
https://doi.org/10.1371/journal.pone.0110334.g001
Элайджа использует ответы опекунов
Знакомство с языком необходимо для развития произношения у ребенка, и ясно, что во время усвоения слова L1 всегда происходит взаимодействие с выученными носителями. По нашему мнению, взаимодействие необходимо перед этим, чтобы развить способность выполнять имитацию слов.(Отметим, что в реальной жизни процессы, поддерживающие развитие речи, перекрываются. Многие вещи происходят параллельно. Для ясности изложения здесь мы описываем события, как если бы они происходили последовательно). Процесс начинается с того, что воспроизведение звука младенцем начинает привлекать внимание его опекуна. Его развитие на этом этапе зависит от готовности опекуна вокально «подражать» ему, как это естественно [32], [33]. Во время этих взаимодействий обе стороны понимают, что она имитирует его [33], [34], поэтому он понимает, что его опекун должен рассматривать его и ее высказывания как в некотором роде.
Хотя это не было явным образом проинструктировано, в наших более ранних экспериментах мы обнаружили, что один (мужчина) экспериментальный опекун счел естественным реагировать на те высказывания Элайджи, которые, по его мнению, были похожи на звуки, которые он мог легко воспроизвести сам [28]. . В подавляющем большинстве случаев он переформулировал высказывания Элайджи в правильно сформированные звуки речи L1. Здесь мы дополнительно исследуем это наблюдение на восьми носителях трех языков.
Ответ воспитателя влияет на Элайджу двояко.Во-первых, ответ усиливает выработку двигательного паттерна, который его спровоцировал, тогда как его отсутствие препятствует дальнейшему использованию этого двигательного паттерна. Во-вторых, Элайджа позволяет связать свои двигательные паттерны с реакциями опекуна. Мы утверждаем, что оба эффекта отражают вероятную реальность речевого развития. О первом сообщили, например, Pelaez et al. [35]. Второй вариант разумен, поскольку предъявление ответа сразу после голосового действия младенца создает благоприятные условия для ассоциативного обучения [36].Такой ответ дает реальному ребенку интерпретацию своего произведения; учитывая имитационный контекст, в котором это происходит, ему сообщают, что, по мнению его опекуна, результат его двигательного паттерна и ее реакция в некотором смысле эквивалентны. Важно отметить, что это не требует, чтобы младенец (или Элия) делал суждение о сходстве между его и ее результатами. Следовательно, на этой стадии его развития не требуется никаких сложных перцептивных навыков со стороны младенца (или Элайджи).(Такой опыт, необходимый для решения проблемы нормализации, должен предполагаться традиционными имитационными теориями).
На рис. 2 показано, как работает эта парадигма эквивалентности с обучением. Элайджа сначала вспоминает двигательный паттерн, который он ранее обнаружил путем исследования. Затем он использует его, чтобы управлять своим голосовым аппаратом и генерировать высказывания в присутствии опекуна. Воспитатель слышит звуки, и если она считает, что это естественно, она может это сделать. В течение этого периода Элайджа ухаживает за опекуном, слышит любой ответ, который она делает, и связывает их.Если на двигательный паттерн не реагировать, он будет отменен, и связь со слуховой памятью не будет создана.
Рисунок 2. Эквивалентность с обучением.
Элайджа учится произносить слова, используя ответы воспитателя, которые усиливают некоторые высказывания и позволяют ему связывать свои двигательные паттерны с речевым выходом L1 взрослого. Панель A: Элайджа сначала вспоминает двигательный паттерн, например двигательный паттерн 3, (1) и использует его для произнесения высказывания (2). Воспитатель слышит звуки (3). Панель B: Воспитатель может переформулировать его, используя свою интерпретацию L1 звуковоспроизведения Элии (4).Элайджа слышит ответ воспитателя (5). Осознавая, что ему подражают, Элайджа воспринимает высказывание опекуна как эквивалент выхода его двигательного паттерна, который усиливает двигательный паттерн 3 и связывает его с реакцией (6). Если на двигательный паттерн не реагировать, он будет отключен и не будет связан со слуховой памятью (например, двигательный паттерн 2).
https://doi.org/10.1371/journal.pone.0110334.g002
Последовательная имитация звуков речи
После того, как Элайджа связал некоторые из своих двигательных паттернов с реакциями опекуна (которые, как мы покажем, обычно являются переформулировками его вывода в L1), у него есть информация, необходимая для анализа строк входных звуков с точки зрения звуков, которые он слышал прежде и реагировать, используя связанные с ним двигательные паттерны.Таким образом, после первого этапа взаимодействия опекун может научить Элайджу произносить слова путем последовательной имитации составляющих их речевых звуков. Конечно, способность Элайджи хорошо выполнять имитацию слов зависит от того, в какой степени его репертуар соответствий двигательных паттернов / переформулировок охватывает звуки, составляющие слова, которым его опекун пытается научить его, и от качества выходных данных его двигательных паттернов. внутри этих пар.
Рис. 3 дает обзор того, как этот механизм реализован в модели Элайи.Сначала воспитатель произносит слово, которое она выбрала, чтобы научить Элайджу. Он слышит высказывание опекуна и разбивает его на составляющие речи звуки размером со слог. Затем он выполняет слуховое сопоставление между этими входящими звуками и всеми реакциями опекуна, которые он ранее связывал со своими двигательными паттернами. Когда обнаруживаются совпадения со слуховыми воспоминаниями, активируются соответствующие двигательные паттерны в моторной памяти. Эти двигательные паттерны вызываются последовательно и используются для управления его речевым аппаратом, что приводит к генерации выходной речи.Это представляет собой его имитацию слова опекуна, и опекун может его услышать.
Рис. 3. Обучение произношению слова с помощью последовательного имитации составляющих его звуков речи.
Панель A: Опекун произносит слово, в данном случае состоящее из двух различных звуков речи (1). Элайджа слышит высказывание опекуна (2) и начинает его обрабатывать (3). Это включает выполнение слухового сопоставления с ранее услышанными ответами (4). Затем последовательно активируются соответствующие слуховые воспоминания (5,6).Панель B: Активированные слуховые воспоминания, в свою очередь, активируют двигательный паттерн 3 и двигательный паттерн 1 в моторной памяти (7,8). Затем они вызываются в последовательности (9), что приводит к генерации выходной речи (10), которая представляет собой имитацию Элайджей высказываний опекуна. Наконец, воспитатель слышит и может оценить ответ Элайджи (11).
https://doi.org/10.1371/journal.pone.0110334.g003
Однако это не обязательно конец процесса. Элайджа и его опекун могут повторять повторяющиеся циклы, как показано на рис.4. Когда опекун слышит ответ Элайджи, она может быть не удовлетворена его попыткой. Затем она сможет сказать это слово еще раз, возможно, более четко и так, как, по ее мнению, Элайджа сможет легче понять. Это дает Элии еще одну возможность выучить слово, что он снова и делает, пытаясь распознавать ее звуки и генерируя ответ. Эта процедура продолжается до тех пор, пока опекун не решит, что работа удовлетворительная, или, если его попытки не увенчались успехом, не сдастся и не попытается научить Элиджу другому слову.
Рис. 4. Повторяющиеся циклы взаимодействия при изучении слов.
Воспитатель сначала говорит слово (1). Элайджа распознает составляющие его звуки в терминах звуков, которые он слышал раньше (2). Затем, используя ассоциированные двигательные паттерны, он генерирует речевой вывод (3). Воспитатель оценивает ответ Элайджи и, если он не удовлетворен, может повторить это слово еще раз, возможно, более четко (4). Элайджа снова выполняет распознавание (5) и генерирует другой ответ (6). Этот процесс может продолжаться (7–9) до тех пор, пока (как в этом случае) лицо, осуществляющее уход, не решит, что его работа удовлетворительна.В качестве альтернативы, если задача не продуктивна, воспитатель может сдаться и попытаться научить Элайджу новому слову.
https://doi.org/10.1371/journal.pone.0110334.g004
Материалы и методы
Мы моделируем младенца как вычислительного агента, Элайю, у которого нет a priori артикуляционных или перцептивных знаний речи [28]. Более подробная информация о его работе представлена в разделе расширенных методов в Приложении S1 в файле S1.
Основные характеристики двигательной системы Элайджи показаны на рис.5А. Элия обладает способностью воспроизводить речь на основе модифицированного артикуляционного синтезатора Maeda [37], [38]. Этим управляет двигательная система, в которой представления двигательных действий сродни жестовой оценке, используемой в модели динамики задачи [39]. Моторный паттерн — это последовательность артикуляционных целей для управляющих параметров синтезатора. Контроллер предполагает, что движения артикулятора следуют 2 траекториям с критическим затуханием порядка и , и выполняет интерполяцию между этими целями. Результирующие последовательности изменяющихся во времени векторов параметров приводят в действие синтезатор. Это может привести к акустическому выходу, воспроизводимому через громкоговоритель.
Рис. 5. Двигательная система и система восприятия Элайджи.
Панель A: Система управления двигателем Элайджи включает синтезатор артикуляционной речи Maeda. Моторный паттерн — это последовательность артикуляционных целей для управляющих параметров синтезатора. Они интерполируются контроллером, который предполагает, что движения артикулятора следуют 2 траекториям с критическим затуханием порядка и .Результирующие последовательности изменяющихся во времени векторов параметров приводят в действие синтезатор. Это потенциально генерирует акустический выход, который воспроизводится через громкоговоритель. Кроме того, оцениваются усилия при постановке и сообщается о любом закрытии речевого тракта. Панель B: Система восприятия Элайджи. USB-микрофон сначала оцифровывает акустический вход. Автокорреляционный анализ применяется непосредственно к форме сигнала для оценки его основной частоты F0. Банк слуховых фильтров обеспечивает предварительную обработку входных данных.Дальнейшая обработка оценивает значимость сигнала, который используется механизмом вознаграждения. Предварительно обработанный ввод можно записать в слуховую память, а также сравнить с прошлыми воспоминаниями с помощью распознавателя звуков речи, основанного на DTW.
https://doi.org/10.1371/journal.pone.0110334.g005
Схема системы восприятия Элайджи показана на рис. 5B. Слуховой аппарат Элайджи получает сигнал от USB-микрофона Rode Podcaster. Автокорреляционный анализ применяется непосредственно к входному сигналу для оценки основной частоты F0.Банк слуховых фильтров обеспечивает первоначальную предварительную обработку входных данных [40]. Наша реализация основана на гамматоноподобных спектрограммах, реализованных Эллисом [41].
Анализ собственного акустического выхода Элайджи выполняется непосредственно на оцифрованном сигнале синтезатора, хотя в принципе этого также можно достичь, передав акустический выход обратно из громкоговорителя через микрофон. Дальнейшая обработка оценивает значимость сигнала, который используется как компонент в механизме вознаграждения Элайджи.Предварительно обработанный ввод можно записать в слуховую память, а также сравнить с прошлыми воспоминаниями с помощью распознавателя звуков речи, основанного на динамическом искажении времени (DTW) [42]. Это позволяет Элии различать звуки речи.
Артикуляционный синтезатор Maeda
В нашей реализации артикуляционного синтезатора Maeda [37], [38] для управления голосовым аппаратом используются десять параметров, первые семь из которых являются артикуляционными: P1 положение челюсти, P2 положение тыльной стороны языка, P3 форма тыльной части языка, P4 вершина языка положение, P5 Высота губ (апертура), P6 Выступ губ, P7 Высота гортани.Кроме того, была добавлена модель источника низкочастотного голоса для управления моделью вокализованного возбуждения [43]. (LF, названная в честь авторов Liljencrants и Fant, представляет собой четырехпараметрическую модель голосового потока.) При этом используются два дополнительных параметра: глоттальная площадь P8 и основная частота P9. В исходной реализации VTCALCS к базовой модели был добавлен вело-глоточный порт, и его открытие регулируется с помощью параметра P10 Nasality. Таким образом, синтезатор Maeda позволил Элии издавать как оральные, так и носовые звуки.После того, как профиль речевого тракта определен параметрами элементарного артикулятора, вычисляется эквивалентный цифровой фильтр, который используется для фильтрации возбуждения от источника голоса и других источников шума. Фрикативы моделируются в модели путем введения шума в те места в речевом тракте, где прогнозируется турбулентный поток воздуха.
В наших экспериментах синтезатор работал с частотой дискретизации выходного сигнала 24 кГц. Чтобы аппроксимировать речевой тракт младенца адекватно для целей этих экспериментов, физические размеры модели по умолчанию, которые первоначально отражали размер речевого тракта взрослой женщины, были уменьшены в 0 раз. 8.
Аналогичным образом средний диапазон основной частоты был сдвинут с 210 Гц на 400 Гц. Мы добавили проприоцептивную обратную связь при контакте губ и языка, которая генерировалась временами, когда площадь поперечного сечения трубки голосового тракта достигала нуля. Elija был реализован на C ++, а все остальные анализы были написаны в Matlab (Mathworks Inc, Натик, Массачусетс, США), работающем на ПК. Акустический выход воспроизводился для лица, осуществляющего уход, через внутренний выход ЦАП ПК через пару активных динамиков.
Моделирование двигательных паттернов и динамики артикулятора
Как и в предыдущей реализации Элайджи [28], двигательные действия моделировались способом, близким к жестовой оценке, используемой в модели динамики заданий [39], а движение артикуляторов Элайджи между целями было реализовано в предположении 2 и динамики порядка которые следуют по критически затухающим траекториям [15].В этой работе мы расширяем наш прежний подход, и теперь динамические свойства различных артикуляторов речевого тракта больше не группируются вместе. Скорее им даются индивидуальные свойства (см. Ниже). Отметим, что другие приближения к движениям артикулятора также могут быть сделаны, например, с использованием траектории минимального рывка, которая часто используется для описания движений рук человека [44].
В Elija двигательный паттерн может быть последовательностью до трех различных суб-паттернов. Каждый подшаблон определяет параметры, необходимые для управления речевым аппаратом, и содержит целевой вектор из 10 элементов, вектор времени начала из 10 элементов и вектор времени длительности из 10 элементов, определяющий, как долго поддерживается цель.Существует также один общий параметр масштабирования скорости перехода. Таким образом, каждый подшаблон состоит из 31 элемента.
Каждый компонентный целевой вектор вызывает движение артикуляторов от их текущего состояния к новым целевым значениям. Как указано выше, такое движение артикулятора следует по критически затухающей траектории, что приводит к движению артикулятора к своей цели без перескока [15]. Мы вычисляем траекторию каждого управляющего параметра, используя уравнение: где — значение параметра во время, — это начальная точка, — это конечная точка (целевое значение), константа задается соотношением, где — жесткость пружины и — ассоциированная масса динамической системы.
Значение, связанное с различными параметрами артикулятора речевого тракта, соответствует их динамическим свойствам. Для движений артикуляторов во время генерации вокальных, сонорных и фрикционных звуков используется значение, поскольку оно хорошо соответствует типичной скорости артикуляции человека. Однако во время взрывного звукоизвлечения переходы происходят намного быстрее из-за быстрого сброса давления воздуха в точке закрытия речевого тракта. Чтобы учесть это явление, связанное значение переходов после закрытия увеличено до 160.Это приводит к созданию более реалистичных взрывных звуков.
Неконтролируемое обнаружение звука
Открытие Элайджей двигательных паттернов, генерирующих звук при вероятных с точки зрения развития влияний, сформулировано как задача оптимизации, которая работает без участия опекуна, и является продолжением предыдущей работы [31]. Моделирование автономных исследований в последнее время стало областью интереса для нескольких исследователей, в том числе тех, кто работает в области развивающей робототехники [45] — [50].Мы отмечаем, что Элайджа использует как внутреннее, так и внешнее подкрепление, как описано Варлаумоном [51], во время своего процесса открытия и уточнения звука.
Как и раньше, наша целевая функция для оптимизации двигательных паттернов включает в себя термины, которые поощряют заметность и разнообразие и препятствуют двигательным усилиям. Кроме того, теперь мы включаем термин, который препятствует обнаружению «чувствительных» двигательных паттернов, как описано ниже. Значение непрерывного скалярного вознаграждения, вычисляемое в целевой функции алгоритма, определяется следующим образом: Термин заметности побуждает Элайджу находить двигательные паттерны, которые вызывают сенсорные последствия. Сенсорная значимость оценивалась путем объединения нескольких компонентов: средней взвешенной низкой и взвешенной высокочастотной мощности по продолжительности двигательного паттерна и среднего сигнала прикосновения.
Мы предполагаем, что человеческий младенец может избирательно фокусировать свое внимание на этих различных аспектах сенсорной обратной связи. Элайджа делает это, изменяя относительный вклад компонентов заметности. Обращение к акустической мощности на более низких частотах будет способствовать обнаружению конфигураций, которые приводят к образованию гласных, в то время как внимание к акустическому выходу с доминирующим высокочастотным компонентом будет способствовать открытию фрикативных звуков.Внимание к прикосновениям будет благоприятствовать конфигурациям, используемым в согласных звуках, например, когда губы сомкнуты или язык соприкасается с зубами или небом рта.
Термин разнообразия включен в целевую функцию, чтобы способствовать открытию ряда двигательных паттернов, которые приводят к различным сенсорным последствиям. То есть он поощряет открытие новых закономерностей, которые отличаются от ранее обнаруженных. Разнообразие вычислялось как взвешенная сумма трех компонентов в пространстве акустических, тактильных и моторных паттернов.В каждом из этих пространств вычислялось минимальное расстояние, возникающее из текущего двигательного паттерна до всех предыдущих двигательных паттернов. Взвешивание повлияло на класс обнаруженных двигательных паттернов. Сильный тактильный вес смещал оптимизацию к обнаружению отчетливых взрывных артикуляций, тогда как сильный акустический вес смещал оптимизацию к обнаружению акустически различных вокальных и фрикативных звуков. Мы отмечаем, что такое явное взвешивание не является строго необходимым, поскольку термин разнообразия по самой своей природе приводит к активному исследованию.Однако его включение действительно ускоряет вычислительный процесс.
Усилия, необходимые для выполнения двигательного паттерна, вносят отрицательный вклад в целевую функцию. Усилие определялось сочетанием стоимости движения и громкости озвученного возбуждения. Стоимость движения рассчитывалась как взвешенная сумма скоростей артикулятора на протяжении двигательного паттерна. Громкость вокализованного возбуждения оценивалась суммированием голосового вклада в параметр P8 Маэда в течение продолжительности двигательного паттерна.Срок действия важен, потому что, если не включен штраф за громкость голоса, оптимизация обычно находит решение с параметром голоса, установленным на максимум, потому что это всегда максимизирует сенсорную значимость. Мы отмечаем, что термин «усилие» может быть усилен, например, путем включения «тяжелого труда» (относящегося к деформации речевого тракта), как это определено Йошикавой и др. [24].
В целевую функцию включен термин чувствительности для наказания за обнаружение двигательных паттернов, которые создают звуки, которые могут быть произведены только при очень точной артикуляции.В частности, чувствительность двигательного паттерна связана с тем, насколько изменяется акустический выход данной артикуляции, когда двигательный паттерн подвержен локальным возмущениям: проблемы с чувствительностью влияют на обнаружение гласных. Учитывая некоторую вариабельность речи, которая является особенностью процесса обучения, нечувствительные артикуляции с большей надежностью приведут к приемлемому заданному звуковому выходу, чем чувствительные. Есть основания полагать, что очень чувствительные конфигурации артикуляторов не используются при воспроизведении речи, как это указано в квантовой теории Стивена [52] и теории локальной линейности Ганнилштама [53].Обе гипотезы предполагают, что существуют предпочтительные области артикуляции в производстве речи и что существуют, например, области артикуляторного пространства, которые обеспечивают естественное расположение гласных звуков. Чувствительность акустической реализации данного двигательного паттерна вычислялась путем индивидуального положительного возмущения параметров от P1 до P5. Было использовано возмущение, соответствующее 5% от полного диапазона параметров (т. Е. Значение 0,1 было добавлено к каждому параметру Маэда). Все остальные параметры были установлены на постоянные значения по всем векторам двигательных паттернов, чтобы избежать дополнительной изменчивости акустической мощности.Формы выходных сигналов во времени для невозмущенного двигательного паттерна и для каждого из 5 возмущенных двигательных паттернов были сгенерированы с использованием синтезатора Maeda, а затем проанализированы с использованием банка слуховых фильтров. Было вычислено расстояние между слуховым представлением каждого нарушенного двигательного паттерна и невозмущенного паттерна. Затем общая чувствительность для данного двигательного паттерна была принята как квадратный корень из суммы квадратов 5 компонентов. Возмущенные паттерны использовались только для оценки чувствительности исследуемого паттерна и не сохранялись в памяти.
Обнаружение схемы движущегося двигателя
В модели Элайджи обнаружение двигательного паттерна начинается с установки для элементов двигательного паттерна случайных значений, взятых из равномерного распределения в их допустимом диапазоне (от -1 до 1). Затем находят решения моторного паттерна с использованием 3 итераций алгоритма квазиньютоновского градиентного спуска, реализованного функцией Matlab fmincon (которая находит ограниченный минимум).
Поскольку в этом исследовании изучались звук и последующее заучивание слов, было предпринято несколько шагов, чтобы Элайджа обнаружил широкий спектр подходящих двигательных паттернов в разумные сроки.Используя двигательные паттерны с единственной целью, были использованы отдельные прогоны оптимизации с упором на низкочастотную мощность (для гласных), высокочастотную мощность (для фрикативных) и прикосновение (для взрывных). Чтобы увеличить разнообразие звуков, озвучивание было явно включено или отключено для каждой взрывной и фрикативной артикуляции (то есть эта операция не выполнялась автоматически процедурой оптимизации). Точно так же закрытие было произведено с открытием вело-глоточного порта или без него, создавая носовые или взрывные устройства соответственно.Отметим, что во время открытия двигательных паттернов активное обучение всегда присутствовало. Следовательно, хотя априорное смещение использовалось для сокращения времени исследования, если бы процессу обнаружения двигательных паттернов дать возможность работать достаточно долго, он бы нашел сопоставимый окончательный набор согласных и гласных автономно, без таких вмешательств, как была достигнута в нашем предыдущем исследовании [28].
Чтобы ограничить общее количество двигательных паттернов, использовалась кластеризация, чтобы уменьшить возникновение сходных артикуляций.Такая кластеризация поддерживала разнообразие, но ограничивала избыточность и обеспечивала отсутствие последующего комбинаторного взрыва конфигураций C и V при генерации последовательностей (см. Ниже). Кластеризация взрывных конфигураций выполнялась непосредственно на двигательных паттернах с использованием стандартного алгоритма K-средних. Вокальные и фрикативные звуки были сгруппированы акустически с использованием модифицированной версии того же алгоритма с использованием динамического преобразования времени (DTW) в качестве метрики сходства [28]. Общее количество кластеров и категорий двигательных паттернов было установлено вручную, чтобы ограничить их количество.Снова отметим, что кластеризация была бы ненужной, если бы длительное время взаимодействия с опекунами было приемлемым. В идеале все исходные двигательные паттерны, обнаруженные при поиске оптимизации, использовались и оценивались лицом, осуществляющим уход, но для этого потребовались бы гораздо более длительные периоды взаимодействия.
Количество обнаруженных вокальных звуков было ограничено до 15, количество взрывных звуков — до 15, а количество фрикативных — до 10. В результате последующие эксперименты по взаимодействию можно было проводить в течение 2–3 часов для каждого воспитателя.
Расширение разнообразия моделей двигателей
Объединяя простые двигательные паттерны, обнаруженные процедурой оптимизации, Элайджа может генерировать более сложные высказывания, которые являются потенциальными звуками речи. Отдельные сочленения были объединены для создания VV (звучание похоже на настоящие дифтонги), CV, CVV и VC. Более конкретно, Elija сгенерировал CV (C v V, C u V, F v V, F u V, NV), VC (VC v , VC u , VF v , VF u , VN) и токены VV, где N = звонкий носовой согласный, C v = звонкий согласный, C u = глухой согласный, F v = звонкий фрикативный, F u = глухой фрикативный .В принципе, были возможны более длинные последовательности, но они не использовались в данном исследовании. Снова отметим, что объединение простых двигательных паттернов в сложные двигательные паттерны было выполнено только для сокращения времени, необходимого для обнаружения двигательных паттернов. Если бы процессу обнаружения двигательных паттернов было позволено длиться дольше и найти несколько целевых двигательных паттернов, процесс обнаружения сложных двигательных паттернов мог бы работать полностью автономно, как в нашем предыдущем исследовании [28].
После того, как авторы вручную удалили неправдоподобные звуки (например, артефакты синтезатора, такие как щелчки), Элия обнаружил 927 двигательных паттернов, которые можно было использовать для экспериментов по первому отклику.
Заявление об этике
После предоставления письменного информированного согласия 8 субъектов (3 мужчины, 5 женщин) играли роль опекунов Элайджи в отдельных экспериментах. Все испытуемые были взрослыми носителями языков, на которых они общались с Элайджей. Отметим, что в этом исследовании не участвовали дети. Кембриджский комитет по этике психологических исследований Кембриджского университета одобрил протокол эксперимента.
Эксперименты
В первом эксперименте изучались ответы лиц, осуществляющих уход, на трех разных языках с использованием всех 8 субъектов.Мы исследовали вариативность ответов у носителей одного языка. Во втором эксперименте изучалась вариативность ответов одного англоговорящего за 4 сеанса. В третьем эксперименте изучалось изучение слов Элайджей посредством последовательного подражания с использованием 6 испытуемых (по 2 на каждом языке), каждый из которых ранее отвечал на результат Элайджи в эксперименте 1.
Эксперименты 1 и 2: Взаимодействие с Элией, оказывающим первую помощь
В первых экспериментах изучалась реакция воспитателя на 927 двигательных паттернов Элии.Воспитателям было приказано закрыть глаза и представить, что они взаимодействуют с человеческим младенцем. Им не дали никакой информации о возрасте ребенка и не показали фотографию младенца. Их просили либо отвечать, либо не отвечать «естественно» на то, что они слышали.
Воспитатели побудили Элайджу произнести речь, нажав клавишу на клавиатуре. Затем Элайджа выполнил двигательный паттерн, который произвел звук, на который мог отреагировать его опекун. Элайджа слушал в течение 3 секунд после каждого выступления и записывал любой голосовой ответ, который выбирал опекун.Элайджа определил, отвечает ли опекун, с помощью простого механизма распознавания речи. Это включало определение того, превышает ли кратковременная мощность любого акустического отклика уровень фонового шума. Когда ответ был обнаружен, ответственный двигательный паттерн сохранялся, и была создана ассоциация между ответом и двигательным паттерном (рис. 2). Когда опекун игнорировал звук, основной двигательный паттерн исчезал из репертуара двигательных паттернов Элайджи. На рис. 6 показано, как этот процесс формирует ассоциации между моторной и слуховой памятью: сразу после выполнения моторного паттерна Элайджа фиксирует любой ответ от лица, осуществляющего уход, в слуховой памяти, сохраняет двигательный паттерн в моторной памяти и устанавливает связь между ними.
Рисунок 6. Формирование ассоциаций между моторной и слуховой памятью.
Элайджа генерирует акустический выход, используя ранее обнаруженный моторный паттерн. После производства Элайджа записывает любой возможный ответ опекуна. Если опекун отвечает, слуховая значимость этой реакции будет способствовать сигналу вознаграждения. Это заставит Элайджу запомнить ответ на ввод речи, усилить двигательный паттерн, а также установить связь между ними.
https: // doi.org / 10.1371 / journal.pone.0110334.g006
Отметим, что Элайджа не изменил свои двигательные паттерны в результате взаимодействия с опекунами (тот же подход, что и у Миуры и др. [25]). Они были оптимизированы только на начальном этапе самостоятельного обучения. В этом исследовании сравнивалось поведение разных лиц, осуществляющих уход, поэтому было важно, чтобы все лица, осуществляющие уход, слышали одни и те же звуки, чтобы можно было сравнить их ответы.
Эксперимент 3: Механизмы изучения слов в Elija
После того, как Элайджа узнал ассоциации между его произведениями и взрослыми формами, созданными в ответ, он мог попытаться имитировать новые высказывания, сделанные опекуном (рис.3). Он проанализировал их с точки зрения ранее услышанных ответов, и, поскольку эти звуки были связаны с его двигательными паттернами, этот процесс предоставил ему кандидатов для воспроизведения слов путем последовательного сопоставления составляющих их звуков.
Для реализации механизма распознавания Элайджа использовал основанный на шаблонах распознаватель динамической деформации времени (DTW) [54], работающий с внешним интерфейсом банка фильтров слухового гамматона [40]. Такие распознаватели DTW обычно работают путем сопоставления спектральных представлений входной речи с другим набором таких представлений, которые соответствуют словарю распознавателя.Последние являются просто «шаблонами» или хорошими примерами звуков в его словарном запасе. Шаблон, который дает наиболее близкое соответствие, затем принимается за классификацию входного звука. В модели Elija распознаватель DTW использовал ответы опекуна в качестве звуковых шаблонов. Однако, поскольку слова могут содержать несколько основных речевых звуков, соединенных вместе, был использован механизм сегментации, чтобы представить их индивидуально для распознавателя на основе шаблона. Это требовало, чтобы воспитатель говорил с паузами между слогами.Сегментация на отдельные высказывания была достигнута путем поиска областей, в которых кратковременная мощность сигнала превышала уровень фонового шума.
На практике для обеспечения работы в реальном времени использовалась двухпроходная схема распознавания [28]. На первом проходе распознаватель работал с использованием 100 шаблонов, выбранных в качестве центров кластеров всех ответов. Во втором проходе в качестве шаблонов использовались все члены 5 лучших кластеров. Здесь мы отмечаем, что, поскольку Элайджа сопоставлял только речь опекуна с речью опекуна, классификатор не мог решить проблему нормализации.
Во время этого эксперимента Элайджа разыграл двигательные паттерны, которые он идентифицировал в процессе распознавания. Элии была дана способность создавать интонационный контур на каждом слове, напоминающий интонационный контур человека, осуществляющего уход, что сделало его попытки подражания словам более естественными. Для этого был вычислен контур основной частоты для каждого отдельного звука речи и аппроксимирован к прямой линии с использованием линейной регрессии. Начальная и конечная частоты были извлечены и затем сопоставлены с диапазоном параметра F0 источника голоса синтезатора Maeda, предполагая линейное масштабирование между (-0.9, 0.9) и диапазон частот от 100 Гц до 300 Гц или от 150 до 400 Гц, для мужчин или женщин, осуществляющих уход, соответственно. Продолжительность речевых звуков в речи опекуна оценивалась, и значения были ограничены диапазоном от 250 мс до 600 мс. Затем значения параметров F0 и длительности использовались для установки параметров основной частоты и длительности в соответствующих моделях двигателя. Все взаимодействия, включая процесс внутреннего распознавания Элайджи, были записаны, чтобы задокументировать развитие его произношения.
Задание по изучению слов выполнялось на ПК, а графический интерфейс пользователя предоставлял опекуну слово из списка, составленного из слов, которые обычно произносятся маленькими детьми на языке опекуна. Воспитатель сначала нажал кнопку «Пуск» и произнес слово. Затем Элайджа повторил это, используя свой механизм последовательной имитации. У него могло быть до 4 попыток имитации, каждую из которых можно было выбрать в пользовательском интерфейсе. Воспитатель принял или отклонил ответы Элайджи, нажав соответствующие кнопки.Важным аспектом этого взаимодействия между младенцем и опекуном было то, что они могли участвовать в повторяющихся циклах (рис. 4). Слово, произнесенное опекуном, могло повторяться, что иногда провоцировало лучшую реакцию. Это могло продолжаться до тех пор, пока Элайджа не выполнил приемлемую постановку, или до тех пор, пока опекун не сдался и не попробовал другое слово.
Фонематическая транскрипция ответов лица, осуществляющего уход
Чтобы количественно оценить эффективность Элайджи и его опекунов, мы проанализировали их взаимодействие во время экспериментов с ответом и обучением словам.Младенческую речь проблематично интерпретировать и анализировать, но высказывания взрослых можно легко изучить.
Опытные фонетики создали широкую (фонематическую) транскрипцию ответов опекунов, используя символы из реестра SAMPA [55]. Это ограничило их классификацию с точки зрения фонем языка, на котором они транскрибировали или пометили высказывания как находящиеся за пределами L1. Для данного начального двигательного паттерна было выделено несколько случаев:
1. Ответ лица, осуществляющего уход, который может быть напрямую закодирован в рамках CVC или CVV, по крайней мере с одним V или C и пустыми ячейками, закодированными с помощью символа «,» (запятая).
2. Безмолвный ответ, закодированный с помощью символа «#».
3. Ответ, который невозможно переписать фонемно. (Обычно это была попытка подражания опекуном.) Это было закодировано как «ххх».
4. Ответ был длиннее, чем CVC или CVV. В результате обследования мы обнаружили, что это были случаи, когда опекун приписывал Элайдже некоторую преждевременную языковую способность, как если бы он создал прогрессивную фонологическую идиому. Например, один воспитатель трижды ответил на слова Элайджи «привет».Это было закодировано с использованием только первых 3 элементов ответа, как указано выше.
Во время анализа данных мы проанализировали ответы в пределах (1) и (4) с точки зрения их фонематической транскрипции.
Объединения архифонем
Невозможно провести значимое сравнение ответов лиц, осуществляющих уход, на фонематическом уровне у носителей разных языков, поскольку как природа сегментов, так и инвентарные количества сегментов на любом языке различаются. Еще одна аналитическая проблема заключается в том, что легко быть ошеломленным количеством фонематических категорий, которые влекут за собой сравнения между говорящими, даже в пределах одного языка.Поэтому мы сгруппировали фонемы в категории архифонем (обозначенные вертикальной чертой, например, | A |), чтобы можно было проводить межъязыковые сравнения и сравнения между лицами, осуществляющими уход, визуально. Отношения между категориями архифонем и включаемыми в них фонемами показаны в нотации SAMPA в таблице 1.
Транскрипции архифонемы были получены из фонематических транскрипций, а затем разделены на их гласные и согласные компоненты, чтобы их можно было анализировать отдельно.То есть были идентифицированы отдельные компоненты C 1 V 1 V 2 C 2, , любой из которых мог или не мог присутствовать.
Визуализация данных
После маркировки экспериментальные данные каждого субъекта состояли из наличия или отсутствия описания архифонемы для каждого из 927 высказываний Элайджи.
Был единый набор данных маркировки для каждого предмета, за исключением одного англоговорящего, для которого было четыре набора данных.Чтобы дать нам возможность количественно оценить, как вели себя разные субъекты, а также как один субъект вел себя в разных экспериментальных сессиях, мы сравнили маркировку в соответствующих наборах данных. Чтобы сравнить любые два набора данных, мы провели попарные сравнения между двумя потенциально разными ярлыками, присвоенными каждому из 927 высказываний Элайджи. Мы сделали это отдельно для C и V.
Чтобы упростить визуальную интерпретацию результатов сравнений, мы суммировали встречаемость каждой гласной и согласной архифонемы по всем ответам каждого испытуемого в парном сравнении, создав две гистограммы встречаемости архифонем.
Затем мы исследовали, как эти два испытуемых различались в их конкретных ответах. Если обоим ответам субъектов на данный токен была присвоена одна и та же метка архифонемы, счетчик частоты «одинаковой метки» увеличивался. Различия в маркировке регистрировали путем увеличения счетчика заболеваемости, присвоенного несовпадающей паре архифонем.
Одна из целей этого исследования заключалась в том, чтобы оценить, реагируют ли испытуемые с разным языковым образованием на Элайджу по-разному. Для этого нам нужно было сравнить ответы разных групп испытуемых, а не только отдельных испытуемых.Для этого мы распространили описанную выше процедуру суммирования на все пары исследуемых наборов данных. Такие индивидуальные результаты парного сравнения за два сеанса, а также результаты сравнения нескольких групп могут быть нанесены на график, чтобы визуализировать сходства и различия в ответах отдельных лиц, осуществляющих уход.
Чтобы создать более абстрактное описание сравнений групп, которое можно было бы использовать для статистического анализа, мы суммировали общие «одинаковые» и «разные» ответы архифонем.Это дало единую общую меру сходства между сравниваемыми группами наборов данных без ссылки на какие-либо конкретные детали относительно того, какие архифонемы были задействованы в сравнениях.
Доверительные интервалы гистограммы
Мы рассчитываем доверительные интервалы так, чтобы:
Нижняя граница:
Верхняя граница:
Мы вычислили нижнюю и верхнюю границы для значения достоверности 95% ()
Результаты
Эксперимент 1 — Изучение ответов воспитателя на 3 языках (n = 8)
Когда начинается лепет, взаимодействие с опекуном может формировать голосовое развитие младенца [56].Чтобы изучить поведение опекунов, когда младенец поет, были проведены эксперименты по взаимодействию с носителями английского, французского и немецкого языков, которые играли роль опекунов. Испытуемые состояли из 2 англичанок (E1, E2) и 2 англичан (E3, E4-1), франко-канадской женщины (F1), француженки (F2), немецкой женщины (G1) и немецкого мужчины (G2). ). Каждый воспитатель взаимодействовал с отдельным (но изначально идентичным) экземпляром Элайджи, так что во время их экспериментальной сессии только их собственные взаимодействия влияли на обучение Элии.
Моторные модели Элии и акустическая мощность исследуются в Приложении S2 в файле S1. В частности, высказывания, на которые ответили опекуны, сравниваются с теми, на которые не обращали внимания.
Базовая статистика ответов
Мы проанализировали взаимодействия между Элией и его опекунами с точки зрения архифонемных описаний согласных и гласных в ответах опекунов. Сначала была рассчитана статистика встречаемости гласных и согласных. Дальнейший анализ затем изучил сходства и различия компонентов архифонемы у субъектов, как описано ранее.
На рис. 7 показан анализ некоторых основных аспектов данных ответов в многоязычном наборе данных для 2 субъектов на каждом языке (E1, E2, F1, F2, G1, G2).
Рис. 7. Статистический анализ набора данных многоязычных ответов из 6 лиц, осуществляющих уход.
Процент двигательных паттернов Элайджи, на которые реагировал каждый человек, осуществляющий уход. B Процент двигательных паттернов, на которые отреагировали, по сравнению с количеством лиц, осуществляющих уход, которые на них отреагировали. C Распределение качеств гласных на четырехугольнике гласных IPA.Разброс данных показывает, что качество гласных в высказываниях Элайджи, как они воспринимаются и на которые реагируют опекуны, охватывает широкий диапазон. D Распределение согласных мест артикуляции. В высказываниях Элайджи присутствовал широкий диапазон предполагаемых мест артикуляции.
https://doi.org/10.1371/journal.pone.0110334.g007
На рис. 7A показан процент двигательных паттернов Элайджи, на которые реагирует каждый отдельный субъект. Значение варьировалось от 53% до 91%, в среднем 78%.Разброс ответов даже среди лиц, осуществляющих уход в одной языковой группе, указывает на то, что разные испытуемые использовали разные критерии ответа.
На рис. 7В показан процент двигательных паттернов Элайджи, на которые он ответил, в зависимости от количества говорящих, которые на них ответили. Обратите внимание, что общая сумма по всем предметам составляет 100%. Этот график показывает, что все 6 воспитателей не игнорировали ни одного двигательного паттерна.
Рис. 7C представляет собой гистограмму качеств гласных в ответах воспитателей, нанесенную на двумерный четырехугольник гласных IPA.Поскольку большинство ответов были переформулировками (см. Ниже), разброс данных показывает, что качество гласных в высказываниях Элайджи, как они воспринимаются и на которые реагируют лица, осуществляющие уход, охватывает широкий диапазон, что указывает на эффективность самоорганизующегося процесса обнаружения гласных. Рис. 7D представляет собой дополнительный анализ распределения согласных мест артикуляции. Опять же, воспринимаемые места артикуляции в высказываниях Элайджи охватывают весь доступный диапазон (от губ до велума).
Анализ ответа на основе транскрипции
Мы классифицировали ответы как переформулировки, имитирующие или идиоматические. Переформулировка была ответом воспитателя, соответствующим ее интерпретации L1 высказывания Элайджи. Имитация ответа заключалась в том, что опекун копировал звуковую форму высказывания Элайджи, а не интерпретировал ее в пределах L1. То есть ее ответ был акустическим воссозданием высказывания. Идиоматический ответ был, когда лицо, осуществляющее уход, приписывало Элии попытку сказать что-то значимое в L1 и отвечало словом L1 или цепочкой слов.Например, если она ответила на CVCV от Элайджи, сказав: «Доброе утро!»
На рис. 8 показано, как воспитатели отреагировали на репертуар двигательных паттернов Элайджи. Панель A отображает индивидуальные данные для всех лиц, осуществляющих уход, которые были наивны по отношению к цели эксперимента. Это показывает общие пропорции переформулировок в L1, имитированных ответов и идиоматических ответов. Панель B показывает среднее значение для пяти субъектов, которые вели себя одинаково. E3 рассматривается здесь как особняк, поскольку он имитировал гораздо больше ответов, чем другие воспитатели.Это рассматривается в Обсуждении ниже.
Рисунок 8. Статистика ответов воспитателя.
Ответы разных типов воспитателей на двигательные паттерны Элии показаны в виде доли от общего числа ответов. Панель A показывает общие пропорции переформулировок (желтые столбцы), имитированных ответов (зеленые столбцы) и идиоматических ответов (синие столбцы) для всех отдельных субъектов. Панель B показывает среднее значение для всех субъектов, за исключением E3, который рассматривался как выброс, поскольку он имитировал намного больше ответов, чем другие лица, осуществляющие уход.
https://doi.org/10.1371/journal.pone.0110334.g008
В среднем более 94% всех ответов были переформулированы, с почти равным разделением между имитируемыми и идиоматическими ответами, которые составили оставшуюся часть. Идиоматический ответ также является источником информации о соответствии двигательного паттерна / звуковой ценности ребенку или Элии в терминах парадигмы развития произношения, которую мы исследуем. Таким образом, можно видеть, что почти все ответы лиц, осуществляющих уход, имели потенциальную ценность для Элайджи в последующем эксперименте по изучению слов.
Визуализация ответа воспитателя на разных языках
Каждый ответ на произнесение Илии потенциально может содержать архифонемы согласных и гласных. Попарные сравнения категорий архифонемы первых гласных V 1 и согласных C 1 были выполнены между ответами в сессиях говорящих на английском и немецком языках. Затем англо-немецкие парные сравнения были объединены, чтобы дать единый набор данных, чтобы представить общее поведение англо-немецкой группы.Аналогичным образом были проведены англо-французские и немецко-французские сравнения. Эти сравнения показаны на рис. 9.
Рисунок 9. Соотношение между ответами на английском, немецком и французском языках.
Сравнение суммарных ответов лиц, осуществляющих уход, показано в терминах их архифонемных гласных и согласных компонентов. Один набор сеансов ответов представлен на LHS, а другой набор на RHS каждой панели. Область желтых узлов представляет вхождения данной фонематической категории.Ширина красной линии указывает на заболеваемость с одинаковой интерпретацией через сеансы; Ширина синей линии указывает на заболеваемость с разной интерпретацией в сеансах. 4 сеанса данных ответов на английском языке всегда представлены на LHS, а 2 сеанса данных для немецкого и 2 французского языков — на RHS каждой соответствующей панели. Сравнение английских и немецких гласных. B Сравнение согласных английского и немецкого языков. C Сравнение английских и французских гласных. D Сравнение согласных английского и французского языков. E Сравнение немецких и французских гласных.F Сравнение немецких и французских согласных.
https://doi.org/10.1371/journal.pone.0110334.g009
Панель A показывает сравнение английских и немецких гласных, а панель B показывает сравнение английских и немецких согласных. Панели C и D, E и F показывают те же сравнения для английского / французского и немецкого / французского языков соответственно.
Область желтых узлов представляет собой сумму вхождений для всех парных сравнений данной категории архифонем в ответах носителей данного языка. Можно видеть, что было разное количество вхождений в разные категории архифонем. Во всех языках частота встречаемости гласных звуков была довольно равномерной, за исключением более низкой частоты встречаемости | O | категория. Частота согласных также была распределена довольно равномерно, за исключением некоторых более низких категорий частоты, например | TD | и | tSdZ |. Символ «#» обозначает случаи, когда в конкретном ответе не было обнаружено архифонемы типа согласный или гласный.
Суммарная частота «одинаковой метки», в которой двигательные паттерны получили одинаковую интерпретацию в парных сеансах, нанесена красной линией.Суммарная частота «разных меток», в которой двигательные паттерны получили различную интерпретацию в парных сеансах, изображена синей линией. В обоих случаях ширина линии пропорциональна числам инцидентов.
Из рис. 9А видно, что для большей части гласных произведений Элии между английскими и немецкими опекунами существовала разумная договоренность в отношении маркировки. Суть разногласий заключалась в обозначении некоторых ответов как | & | англоговорящими, но как | A | и | O | немецкими.
Для согласных на рис. 9B толстая синяя линия показывает, что существует различие в интерпретации двигательных паттернов, результаты которых воспринимаются как | w | англоговорящими и | fv | немецкими. Этого следовало ожидать, учитывая отсутствие / w / на немецком языке.
Рис. 9C и 9D показывают сравнение интерпретаций, сделанных носителями английского и французского языков. Для гласных в 9C видно, что значительная часть звуков, обозначенных как | ie |, | A | и | УФ | английскими опекунами интерпретировались как | & | говорящими по-французски, предположительно отражая более широкий диапазон гласных, которые образуют эту категорию во французском языке.
Рис. 9E и 9F показывают сравнения между интерпретациями, сделанными немецкими и французскими говорящими. В гласных звуках, обозначенных как | A | говорящие на немецком языке часто обозначали как | & | говорящими на французском. Это говорит о том, что для низких и центральных звуков | A | и | & | категории соответственно, говорящие на французском и немецком языках имеют разные границы категориального восприятия.
Эксперимент 2 — Исследование вариабельности ответа одного лица, осуществляющего уход (n = 1)
Эксперимент 1 показал, что были некоторые различия в том, как лица, ухаживающие за детьми из английского, французского и немецкого языков, реагировали на одинаковые двигательные паттерны.В эксперименте 2 изучалась схожесть реакции воспитателя у одного и того же англоговорящего человека. Для сбора данных E4 выполнил задание ответа 4 раза, следуя процедуре, принятой в эксперименте 1. Между сеансами ответа оставались периоды в неделю, чтобы испытуемый не запомнил произведения Элайджи из предыдущего сеанса.
Визуализация ответа опекуна во время сеансов
Парные сравнения для категорий архифонемы первых гласных V 1 и согласных C 1 были проведены между всеми ответами для 4 сессий этого единственного носителя английского языка.Затем эти попарные сравнения были суммированы, чтобы дать единый набор данных, представляющий поведение одного говорящего в течение нескольких сеансов. Эти сравнения показаны на рис. 10. Сравнение гласных и согласных показано на панелях A и B соответственно.
Рисунок 10. Отношения в ответах на английском, немецком и французском языках.
Результаты представлены в виде графика на рис. 9. Сравнение гласных и согласных A и B для одного носителя английского языка в течение четырех отдельных занятий. C&D Сравнение гласных и согласных между четырьмя разными носителями английского языка.E & F Сравнение гласных и согласных между двумя разными говорящими на немецком языке. G & H Сравнение гласных и согласных между двумя разными говорящими на французском языке.
https://doi.org/10.1371/journal.pone.0110334.g010
Мы также исследовали, как 4 разных англоговорящих человека реагируют на одни и те же двигательные паттерны. Сравнение гласных и согласных нескольких говорящих на английском и английском языках показано на панелях C и D соответственно. Сходство между двумя носителями немецкого языка и двумя носителями французского языка показано на панелях E и F и G и H соответственно.
Высокая пропорция красного и синего цвета показывает, что один говорящий по-английски был постоянным на разных занятиях, тогда как разные говорящие на одном языке демонстрировали большее разнообразие в своей интерпретации высказываний Элайджи.
Общее сходство между группами
На рис. 11 показан график сравнения ответов лиц, осуществляющих уход, для семи различных экспериментальных групп, проведенных в терминах суммированных компонентов гласных и согласных звуков архифонемы. Эти значения представляют собой сумму отсчетов, соответствующих красным линиям, показанным на фиг.9 и 10. Обратите также внимание на то, что сумма синих линий соответствует различиям в интерпретациях (что определяется как [100% -% то же самое]). Поэтому мы воздерживаемся от дополнительного построения значений процентной разницы, чтобы избежать избыточности.
Рис. 11. Сравнение ответов лиц, осуществляющих уход.
Сравнения производятся с точки зрения их архифонемных гласных и согласных компонентов. Эти значения соответствуют красным линиям, показанным на рис. 9 и 10. Панели A и B показывают сравнение ответов гласных и согласных соответственно: сходство в пределах одного носителя английского языка показано синей полосой, различное сходство говорящего для одной и той же языковой группы показано зелеными полосами, а сходство между языками группы показано как желтые полосы.Планки погрешностей показывают 95% доверительный интервал.
https://doi.org/10.1371/journal.pone.0110334.g011
Полосы процентов на рис. 11 соответствуют сходству в маркировке в следующих группах:
- Тот же англоговорящий, 4 занятия (английский-тот же × 4)
- 4 носителя английского языка (англо-английский)
- 2 говорящих по-немецки (немецкий-немецкий)
- 2 говорящих по-французски (франко-французский)
- 4 говорящих по-английски и 2 по-немецки (английский-немецкий)
- 4 англоговорящих и 2 франкоговорящих (англо-французский)
- 2 говорящих по-немецки и 2 по-французски (немецкий-французский)
Отметим, что 95% доверительные интервалы на этих графиках, как правило, довольно малы из-за относительно большого количества подсчетов данных в каждом условии, за исключением сравнений между двумя говорящими на немецком языке и между двумя говорящими на французском языке. В этих сравнениях было только 2 говорящих в каждой группе, и, следовательно, было проведено только одно попарное сравнение. Из рисунка видно, что один-единственный говорящий по-английски очень согласован на всех сессиях с точки зрения как гласных, так и согласных. Сравнение гласных для разных носителей одной и той же языковой группы было более схожим, чем соответствующие сравнения для разных языковых групп.
Сравнение нескольких говорящих в языковых группах
Мы провели Z-тесты для сравнения различий в данных количества необработанных гласных и согласных между выбранными группами, показанными на рис.11.
Чтобы исследовать различия в маркировке носителей разных языков, мы сравнили сходство между носителями в пределах одной языковой группы со сходством между носителями в разных языковых группах.
Английские группы сравнения
«Одинаковое» соотношение гласных у разных носителей английского языка значительно отличается от соотношения между англо-французским и англо-немецким сравнениями, с p <0,001:
Англо-английский по сравнению с англо-немецким = 9.11787
Англо-английский по сравнению с англо-французским, = 17,3888
«Одинаковая» пропорция согласных у разных носителей английского языка значительно отличалась от таковых в сравнении англо-немецких говорящих с p <0,001
Англо-английский по сравнению с англо-немецким, = 8,8926
Однако согласные у разных носителей английского языка существенно не отличались от согласных при сравнении говорящих на французском, то есть p> 0,05
Согласных англо-английский по сравнению с англо-французским, = -0.189129
Сравнение немецких групп
«Одинаковая» пропорция гласных у разных носителей немецкого значительно отличается от соотношения между англо-немецкими и немецко-французскими говорящими, с p <0,001:
Немецко-немецкий по сравнению с англо-немецким, = 7,79693
Немецко-немецкий против немецко-французского = 9. 28878
Доля согласных у разных говорящих по-немецки значительно отличалась от соотношения в сравнении говорящих на английском и немецком языках и в сравнении говорящих на немецком и французском языках, с p <0.001
Немецко-немецкий по сравнению с англо-немецким = 3,9623
Немецко-немецкий по сравнению с немецко-французским, = 3,47732, p <0,001
Сравнение французских групп
«Одинаковая» пропорция гласных у разных носителей французского значительно отличалась от соотношения между немецко-французскими и англо-французскими языками, с p <0,001
Французско-французский по сравнению с англо-французским, = 12,4145
франко-французских и немецко-французских = 9.48962
Доля согласных у разных носителей французского значительно отличалась от соотношения в сравнении говорящих на немецком и французском языках с p <0,001
франко-французский по сравнению с немецко-французским, = 4,16795
Доля согласных у разных говорящих по-французски незначительно отличалась от соотношения в сравнении говорящих по-английски и по-французски
Французско-французский в сравнении с англо-французским, = -0,377895, p> 0,05
Выводы результатов кросс-языков
Сравнение гласных в ответах 4 разных англоговорящих людей значительно отличалось от сравнений между англо-немецкими и англо-французскими группами.То же самое было между двумя разными говорящими на немецком языке и англо-немецкой группой и немецко-французской группой. Два разных франкоговорящих пользователя и французско-немецкие сравнения и англо-французские сравнения также показали одинаковый эффект
Эти результаты показывают, что маркировка гласных была более похожа в пределах языковой группы, чем во всех языковых группах. Результаты по согласным звукам не были столь однозначными. Обозначение согласных было только более схожим внутри языковой группы, чем между языковыми группами для английского и немецкого сравнения, а также французского и немецкого сравнения. Маркировка согласных у носителей английского и французского языков не была более последовательной в каждой языковой группе, чем во всех остальных.
Разброс ответов среди 4 разных носителей английского языка, среди 2 разных носителей немецкого языка и среди 2 разных носителей французского языка показал, что собственная индивидуальная интерпретация воспитателя сыграла роль в этом процессе. Кажется вероятным, что такие различия в интерпретации возникли из-за того, что произведения Элайджи не были сосредоточены на фонематических категориях, и поэтому опекун должен был сделать интерпретацию, чтобы определить подходящую категорию.Этот процесс зависел от их личных предубеждений.
Таким образом, воспитатели продемонстрировали систематическую предвзятость в интерпретации выходных гласных Элия в рамках их родных языков, при этом маркировка внутри языковой группы была значительно более похожей, чем маркировка для разных языковых групп.
Оценка устойчивости говорящего по-английски
Чтобы исследовать непротиворечивость одного говорящего, мы сравнили сходство внутри одной группы говорящих по-английски с группой, говорящей на другом.
Анализ показал, что «одинаковая» пропорция гласных между 4 повторениями одного человека, говорящего по-английски, значительно отличается от такового в разных группах носителей английского языка, с p <0,001:
Английский-Samex4 по сравнению с англо-английским, = 26,2974
«Одинаковая» пропорция согласных между 4 повторениями одного англоговорящего человека также значительно различалась для другой группы носителей английского языка, с p <0,001:
Английский-Samex4 в сравнении с англо-английским = 24.8201
Статистика показывает, что один человек, говорящий по-английски, был очень последовательным в 4 разных сессиях, тогда как четыре разных англоговорящих участника показали значительно меньшее сходство. Поскольку многократные повторения одного носителя английского языка были значительно более последовательными, чем маркировка, сделанная разными носителями одного и того же языка, это указывает на то, что лица, осуществляющие уход, похоже, используют личные предубеждения во время процедуры маркировки.
Эксперимент 3 — Изучение слов на 3 языках путем последовательного подражания (n = 6)
Эксперимент 3 исследовал способность Элайджи учиться произносить слова.Используя его приобретенную способность анализировать входящие звуки речи в терминах эквивалентов его собственных жетонов, воспитатели научили Элайджу произносить несколько простых слов путем последовательной имитации. Элайджа сопоставил звуки в новых словах, которые были ему представлены, со звуками, которые он слышал в первом эксперименте по взаимодействию, и использовал свои моторные ассоциации с последним, чтобы произнести слово.
В отдельных экспериментах шесть (n = 6) субъектов, говорящих на трех языках (E1, E2, F1, F2, G1, G2), которые ранее участвовали в эксперименте 1 со звуковой реакцией, снова играли роль опекунов.Им было поручено научить Элайджу некоторым простым словам на их родных языках: 219 английских, 219 французских и 237 немецких слов. Списки слов показаны в Приложении S3 в файле S1. Каждый воспитатель решал для себя, считают ли они свою попытку научить Элайджу новым словом успешной или нет, то есть была ли его попытка приемлемой имитацией их слова. В целом каждому воспитателю удалось научить его произносить от 40 до 72 (в среднем 55) слов.
Опытные фонетики аннотировали данные о произнесенных словах каждого воспитателя.Чтобы проанализировать словообразование Элайджи, мы использовали ответы воспитателя, соответствующие двигательным паттернам, используемым Элайджей для имитации слова. Последний был аннотирован ранее для сравнения ответов. Затем, как и прежде, извлекались компоненты архифонемы согласных и гласных. Из наблюдения за процессом взаимодействия было очевидно, что, меняя манеру разговора, воспитатели иногда могут спровоцировать лучшую реакцию Элайджи.
На рис. 12 показаны слова, которые выучил Элия на трех языках.Результаты для лиц, осуществляющих уход, говорящих на английском, французском и немецком языках, показаны для субъектов E1 и E2, F1 и F2 и G1 и G2 соответственно. В левом столбце орфографически указано слово, в среднем столбце — фонематическая транскрипция окончательного произведения опекуна, а в правом столбце — фонематическая транскрипция тех ответов опекуна (переформулировок), которые Элия узнал в целевом слове и затем использовал двигательные паттерны для создания имитации. Конечно, высказывание Элайджи не походило на высказывание опытного оратора, поскольку звуки его речи не были так категорично определены, как звуки зрелого говорящего на L1.
Рис. 12. Примеры слов, которые выучил Элайджа.
Результаты для 2 предметов, говорящих на английском, французском и немецком языках, показаны для предметов E1 и E2, F1 и F2 и G1 и G2 соответственно. В левом столбце указывается целевое слово, а в среднем столбце — фонематическая транскрипция окончательной целевой продукции лица, осуществляющего уход. Правый столбец — фонематическая транскрипция переформулировок опекуна, соответствующих подражаниям Илии.
https: // doi.org / 10.1371 / journal.pone.0110334.g012
Чтобы сравнить целевые слова, созданные опекунами, со словами, созданными Элайджей в ответ, мы сравниваем архифонемное представление первого и второго. Мы напрямую расшифровали слова опекунов. Однако по причинам, описанным ранее, мы не транскрибируем вокализации Элайджи, а вместо этого используем транскрипцию звуков (переформулировок), сделанных опекунами, которые они считали эквивалентными.
На рис. 13 показаны эти сравнения (между звуками речи в словообразовании опекунов и интерпретацией опекунами звуков речи в имитациях Элии).Последние уже были помечены ранее, поскольку они были установлены во время первого эксперимента по взаимодействию. Звуки речи анализировались по первым гласным V 1 и согласным C 1 . Результаты представлены индивидуально для каждого из 6 лиц, осуществляющих уход. Эти данные анализируются далее в Приложении S4 в файле S1.
Рисунок 13. Сравнение отдельных предметных слов для английского, французского и немецкого языков.
Сравнение архифонемных представлений целевых слов воспитателя и имитаций Элайи.Отдельные динамики показаны на шести панелях E1 и E2, F1 и F2 и G1 и G2 соответственно. Транскрипции целевого слова лица, осуществляющего уход, преобразованные в категории архифонем, показаны на левой стороне каждой диаграммы. Подражания Элии были обозначены в терминах архифонемы компонентных ответов, из которых они построены. Они показаны справа на каждой диаграмме.
https://doi.org/10.1371/journal.pone.0110334.g013
Звуковые файлы текстовых произведений воспитателей и имитация продукции Эджиджи доступны в Интернете по адресу https: // github.ru / HowardLab / Elija-PlosOne-2014. Подробная информация об этом онлайн-хранилище данных описана в Приложении S5 в файле S1.
Обсуждение
Сводка
Используя компьютерную модель, которая начинает свое развитие без речевых навыков, но с общими способностями, аналогичными младенческим, мы показали, что для того, чтобы маленькие дети учились произносить слова, основным элементом изучения речевых звуковых соответствий не обязательно должен быть подражательный процесс со стороны ребенка.Вместо того, чтобы использовать акустическое сопоставление, как обычно предполагается, Элайджа связывает свои голосовые действия со звуками речи, которые он слышит в ответ на них. Это становится возможным благодаря отражению поведения опекуна, наблюдаемого в естественных ситуациях и отображаемого (без коучинга) в наших экспериментах. Взаимодействие выборочно усиливает диапазон возможных речевых звуков Элайджи, а ассоциации, которые он создает из ответов опекуна, позволяют ему разработать инвентарь моторных паттернов и соответствий звуков речи.Таким образом, поведение его опекунов позволяет ему разработать первую модель произношения L1.
Было обнаружено, что, когда опекун считал естественным отвечать, непредсказуемая форма реакции на звук, который обнаружил Элайджа, почти всегда была переформулировкой произнесения Элайджи в правильно сформированные звуки L1 (а иногда и попыткой имитировать его выход). Природа моторных / звуковых ассоциаций была определена на основе оценки звукового сходства (или эквивалентности), сделанной опекуном , а не Элайджей.Это основная разница между нашим изложением и теориями акустического соответствия развития звуков речи.
В нашем исследовании отдельные экземпляры Элия научились произносить простые слова на английском, французском и немецком языках. Наше описание этого аспекта овладения речью демонстрирует свою эффективность и независимость от языка. Элайджа — первая модель, которая достигла этого (1) с использованием естественных и хорошо подтвержденных социальных взаимодействий, (2) с учетом исходных перцептивных, продуктивных и ассоциативных механизмов, которые явно не лучше, чем у человеческого младенца, и (3) с учетом отсутствия преждевременных фонетических отношений. умение оценивать сходство своей речи и речи воспитателя.
Трехступенчатый режим
У настоящего младенца три стадии обучения, смоделированные отдельно в Элии, будут перекрываться. В этом исследовании этапы — обнаружение звука без присмотра, первые эксперименты со звуковой реакцией и эксперименты с имитацией последнего слова — были разделены по трем причинам. Во-первых, это позволило сохранить время взаимодействия с опекунами в практических пределах. Во-вторых, все лица, осуществляющие уход, слышали одни и те же звуки, чтобы можно было сравнить их ответы.В-третьих, на двух этапах взаимодействия он избегал необходимости интерпретировать природу данного взаимодействия обеим сторонам (Элайджа и опекун), поскольку это однозначно фиксировалось в контексте каждого из экспериментов: либо вовлечение опекуна в ответ на высказывание, либо в словесном обучении.
В принципе Elija можно запускать с перекрытием этапов и информированием друг друга. Это моделирует тот факт, что начальные двигательные паттерны могут формировать отправные точки для последующего открытия двигательных паттернов, и что двигательные паттерны могут изменяться со временем. Такая операция потребует дополнительных механизмов в модели Элайджи, чтобы обнаруживать и действовать в контексте данного взаимодействия. То есть Элайджа нужно будет интерпретировать намерения опекуна и, таким образом, использовать любое данное взаимодействие соответствующим образом.
Результаты ответа
Чтобы количественно оценить поведение опекуна во время экспериментов по взаимодействию, мы не пытались напрямую транскрибировать производственные данные Элайджи, поскольку хорошо известно, что это проблематично при изучении развития речи [30].Вместо этого мы проанализировали постановки Элайджи с точки зрения их соответствующих ответов воспитателей.
Наши результаты показывают, что испытуемые считали естественным реагировать на большинство двигательных паттернов, созданных Элайджей, и почти всегда делали это с ответами, которые были хорошо сформированы в L1 и поэтому представляли ценность для Элайджи в последующем эксперименте по изучению слов.
Можно спросить, почему изменение рецептуры является предпочтительной реакцией лиц, осуществляющих уход. Одна из причин может заключаться в том, что воспитатели приписывают младенцам «полностью человеческие способности к социальному реагированию: с желаниями, намерениями и чувствами, которые можно передать» [57].Таким образом, реакция L1 может казаться естественной, даже если стимул от младенца еще не является лингвистическим.
Кроме того, для высококвалифицированного говорящего на L1 практически не составляет труда воспроизводить звуки речи, так что всякий раз, когда это будет сочтено целесообразным, легко будет сделать переформулировку. Какими бы ни были причины, интересно отметить, что опекуны Элайджи действительно вели себя подобным образом по отношению к нему, несмотря на то, что Элайджа не был их собственным ребенком и даже не был настоящим ребенком. Мотивация взрослых к переформулировке продукции младенца кажется довольно сильной.
Сравнение наших результатов с исследованиями на людях
Исследования естественных диад воспитатель-младенец, имеющих отношение к этим экспериментам с Элайджей, охватывали возраст от 2 до 4 месяцев (17 пар) [58], от 2 до 6 месяцев (15 пар) [59], от 4 до 11 месяцев (8 пар). [60], от 9 до 19 месяцев (6 пар) [61] и от 12 до 21 месяца (3 пары) [62]. Поведение и воспитателей, и младенцев, о которых сообщается в этих исследованиях, согласуется с моделью Элайджи, согласно которой дети учатся решать проблему соответствия, имитируя детские вокализации опекуном.Сообщается, что такие имитации лиц, осуществляющих уход, распространены повсеместно, происходят с большой частотой и более распространены, чем имитации высказываний лиц, осуществляющих уход за младенцами. Мы отмечаем, что этому хорошо задокументированному и широко признанному явлению не отводится какая-либо роль в современной теории развития речи, в том числе в расчетах акустического соответствия, но он составляет основу модели Элайджи, полученной из наблюдений и теоретизирования Гаттеньо [27], а также работы группы Асада [24].
ДанныеPawlby [60] могут пролить свет на поведение субъекта E3 в нашем исследовании, который отличался от других наших субъектов, переформулировав около 60% двигательных паттернов, на которые он реагировал, и имитируя около 40%.Полби проанализировал имитационный обмен по пяти модальностям, включая ее группу III, звуки речи (гласные, ранние и поздние согласные) и группу IV, неречевые звуки (хныканье, смех, малина и т. Д.). В последовательностях «младенец-мать» Полби записал 625 случаев, когда матери имитировали звуки детской речи (Группа III) и 261 случай, когда матери имитировали неречевые звуки (Группа IV). (Было намного меньше последовательностей мать-младенец: младенцы имитировали 60 речевых звуков, издаваемых их матерями, и 16 неречевых звуков.)
Если мы приравняем переформулировку и имитацию ответов нашего субъекта E3 к группам III и IV Полби соответственно, его поведение находится в пределах диапазона, который она наблюдала в своих восьми диадах. Возможно, поэтому, он думал, что Элайджа находится примерно в том возрасте, в котором Элайджа тестировал Полби, и отреагировал соответствующим образом, в то время как другие субъекты считали Элайджу старше, что дало ему больше возможностей для языкового общения и адекватно реагировало на это.
Обширное исследование Полби позволяет провести сравнение имитации вокальных актов и других действий.Она обнаружила сходство между всеми формами имитации, вокальной и неголосовой, и, в соответствии со всеми другими исследованиями, упомянутыми выше, обнаружила, что «имитация действий ребенка матерью является гораздо более частым явлением, чем имитация младенцем своих действий». поступки его матери. Именно младенец с большей вероятностью инициирует последовательность, а его мать ответит имитацией. «В целом Полби интерпретировал ее результаты как указание на то, что» весь процесс, с помощью которого младенец приходит к явному намеренному подражанию своей матери, коренится в первоначальная готовность матери подражать собственному младенцу.«Модель Элайджи является примером этой парадигмы обучения.
Различия в поведении лиц, осуществляющих уход
Во время процесса зеркального отображения некоторые лица, осуществляющие уход, отвечали чаще, чем другие, что свидетельствует о различиях между людьми в их пороговом критерии ответа.
Компоненты гласных (архифонема) в ответах лиц, осуществляющих уход, чаще были похожи на компоненты других носителей данной языковой группы, чем на компоненты других языковых групп.Например, ответы английских опекунов на звуки Элии были более стабильно похожи на ответы других англоговорящих по качеству гласных, чем на ответы немецких и французских опекунов. Таким образом, по крайней мере в отношении качества гласных, воспитатели продемонстрировали значительную систематическую предвзятость при интерпретации результатов Элайджи в рамках их L1.
Качество гласных и согласных в ответах одного и того же англичанина, осуществляющего уход за 4 отдельными сессиями, было очень схожим, двигательный паттерн за двигательным паттерном.Тем не менее, было значительно больше интерпретаций данного двигательного паттерна среди разных лиц, ухаживающих за английским. Это говорит о том, что различия в ответах разных носителей одной и той же языковой группы могли возникнуть из-за разных систематических интерпретаций, а не из-за лежащего в основе шумного процесса. Объяснить это можно категоричным восприятием речи, поскольку постановки Элайджи никоим образом не ограничивались тем, что они были хорошими образцами L1. Следовательно, многие звуки опекун отнес бы к тому, что он или она считал «достаточно хорошей» категорией.Их суждения по этому поводу, безусловно, были бы разными.
Заучивание слов путем последовательного подражания
В последнем эксперименте изучение слов проводилось с использованием отдельной стадии имитации, предполагающей, что репертуар двигательных паттернов / звуковых реакций уже был установлен. Выполнение этого этапа отдельно от этапа реагирования было эффективным с экспериментальной точки зрения, поскольку это означало, что ни Элайджа, ни лицо, осуществляющее уход, не нуждались в интерпретации контекста взаимодействий.Шесть воспитателей смогли научить Элайджу произносить в среднем 55 типичных первых слов на их языках.
Процесс последовательной имитации основывался на том, что распознаватель Элайджи оценивал высказывания опекуна с точки зрения звуков, которые Элайджа слышал раньше. Это было реализовано с использованием динамического преобразования времени (DTW). Однако высокопроизводительного распознавания звука речи на основе ограниченных обучающих данных трудно достичь без знания априори . Таким образом, способность Элайджи распознавать была ниже, чем мы ожидали бы от человеческого младенца.Иногда это приводило к неправильной интерпретации речи опекуна. Однако, хотя Элайджа иногда допускал такие ошибки, опекун мог также исправить их, поскольку она могла побудить его к еще одной попытке узнавания или даже снова заговорить, пока он не сгенерировал соответствующий ответ (см. Рис. 4). Аналогичное поведение лиц, осуществляющих уход, наблюдается в естественных условиях.
Элайджа не всегда создавал формы подражания, которые точно соответствовали бы его опекуну, поскольку его репертуара двигательных паттернов было недостаточно для этого.Однако он достиг уровня успеваемости, сравнимого с показателями маленьких детей в возрасте от одного до двух лет.
Феномен переформулирования
Переформулировка была ключевым источником информации, которую использовал Элия, чтобы научиться произносить, а затем выучить произношение слов [28]. В нашем описании младенец узнает о лингвистическом значении своих высказываний (в первую очередь воспринимаемых им как двигательные паттерны) через их переформулирование своим опекуном. «Зеркальная» структура такого взаимодействия уже знакома ему по более раннему этапу развития, когда воспитатель, как полагают, служит аффективным зеркалом для маленького младенца [63].Иногда это подразумевает, что опекун отражает поверхностные характеристики своего поведения, но все чаще [64] то, что она отражает, является выражением ее интерпретации его внутреннего состояния (так называемая «аффективная настройка» [65]). В вокальном контексте имитация ответа аналогична первой и переформулировка второй. Когда они переформулировали его голосовые действия, опекуны Элайджи действовали как фонологическое зеркало, представляя ему то, что они сочли эквивалентами L1 определенных двигательных паттернов.Это решение проблемы соответствия затем позволило Элии учить слова путем последовательной имитации составляющих их речевых звуков.
Подтверждающие доказательства и более широкие последствия
Несколько сходящихся направлений исследований согласуются с моделью Элиджи. Гаттеньо сообщил о натуралистических наблюдениях за младенцами, которые учатся говорить, в поддержку своего предположения, что младенцы учатся произносить не путем имитации, а скорее посредством экспериментов, которые оцениваются и вознаграждаются их опекунами [27].Мессум [8] описал другие экспериментальные и теоретические подтверждения этой альтернативной парадигмы.
Совсем недавно исследования изменения речевой обратной связи предоставили экспериментальные доказательства отсутствия акустической саморегуляции речевого вывода у младенцев [9] и даже у некоторых взрослых [10]. Эти наблюдения явно противоречат нынешнему предположению о том, что имитация — это механизм, с помощью которого младенцы учатся произносить звуки речи, образующие элементы, из которых состоят слова [11]. Идея об отсутствии саморегуляции речевого образования у младенцев, однако, согласуется с хорошо известной аномалией детской речи, феноменом «рыба / рыба» [12], [13]. Здесь ребенок произносит «рыба» как «фис», и когда его спрашивают, почему он это сделал, он настаивает, во-первых, на том, что он может слышать различие между двумя формами, сделанными взрослым, и, во-вторых, что он сам не произносил неправильную форму. . Такое поведение не может быть удовлетворительно объяснено с помощью имитационных описаний овладения речью, которые требуют от младенца выполнения акустического согласования, но согласуется с моделью Элии и отсутствием саморегуляции, наблюдаемым у младенцев.Очевидно, что если младенец не саморегулируется или не может саморегулироваться на основе своей акустической мощности, он не будет знать о ее акустической форме и о том, что его произношение неверно. Вот что наблюдается.
Поддержка альтернативной парадигмы Гаттеньо в развитии речи также исходит из демонстрации неголосового обучения молодых самцов коровьих птиц, обучающихся пению не поющими самками [66]. Аналогичным образом, в исследованиях на людях, ряд экспериментов с младенцами показал, что поведение воспитателя воспринимается и используется молодыми учениками для создания более продвинутых форм вокализации [56].
Один из самых основных и давних вопросов о речи заключается в том, представлена ли она в мозге в первую очередь как мотор или как акустический феномен: это «жесты, которые становятся слышимыми» [67] или акустический код? Наше предложение выходит за рамки нынешних терминов, в которых сформулированы эти дебаты: вместо простого механизма (имитации), ведущего к сложной и противоречивой нейронной организации любого рода, мы предлагаем, чтобы механизм обучения, включающий зеркальное отображение со стороны социального партнера, приводил к прямому представлению это по своей сути моторно-перцептивное восприятие.В этом процессе ни производство, ни восприятие не более примитивны, чем другие. Это понимание разрешает ряд давних проблем речи [8].
Ассимиляция носового места сводит на нет выводимость как целевых, так и триггерных слов
Aylett, M., & Turk, A. E. 2004. Гипотеза гладкой избыточности сигнала: функциональное объяснение взаимосвязи между избыточностью, просодической заметностью и продолжительностью в спонтанной речи. Язык и речь , 47 (1), 31–56.DOI: https://doi.org/10.1177/0023830
70010201Aylett, M., & Turk, A. E. 2006. Избыточность языка предсказывает продолжительность слога и спектральные характеристики ядер вокального слога. Журнал Акустического общества Америки , 119, 3048–3058. DOI: https://doi.org/10.1121/1.2188331
Беддор, П. С. 2009. Коартикуляторный путь к изменению звука. Язык , 85 (4), 785–821.DOI: https://doi.org/10.1353/lan.0.0165
Беддор, П. С., Макгоуэн, К. Б., Боланд, Дж. Э., Кутзи, А. В., и Брашер, А. 2013. Временной ход восприятия коартикуляции. Журнал Акустического общества Америки , 133, 2350–2366. DOI: https://doi.org/10.1121/1.4794366
Белл, А., Бренье, Дж. М., Грегори, М., Жиран, К., и Джурафски, Д. 2009. Влияние предсказуемости на продолжительность содержания и функциональных слов в разговорном английском. Журнал памяти и языка , 60 (1), 92–111. DOI: https://doi.org/10.1016/j.jml.2008.06.003
Бренье, Дж. М., Ненкова, А., Котари, А., Уиттон, Л., Бивер, Д., и Джурафски, Д. 2006. (Не) полезность лингвистических характеристик для прогнозирования значимости спонтанной речи. В: Семинар по технологиям разговорной речи , 54–57.
Бреснан Дж. И Спенсер Дж. 2013. Частота и вариативность в сокращении подлежащего-глагола в английском языке. Неопубликованная рукопись .
Buz, E. , & Jaeger, T. F. 2016. (Не) зависимость артикуляции и лексического планирования во время производства отдельных слов. Язык, познание и неврология , 31 (3), 404–424. DOI: https://doi.org/10.1080/23273798.2015.1105984
Buz, E., Tanenhaus, M. K., & Jaeger, T. F. 2016. Динамически адаптированная контекстно-зависимая гиперартикуляция: обратная связь от собеседников влияет на последующее произношение говорящих. Журнал памяти и языка , 89, 68–86. DOI: https://doi.org/10.1016/j.jml.2015.12.009
Байби, Дж. 2001. Фонология и языковое использование . Кембридж: Издательство Кембриджского университета. DOI: https://doi.org/10.1017/CBO9780511612886
Байби, Дж. 2006. От использования к грамматике: реакция ума на повторение. Язык , 82 (4): 711–733. DOI: https://doi.org/10.1353/lan.2006.0186
Chang, S., Plauche, M., & Ohala, J. 2001 Асимметрия выраженности и спутанности согласных. В: Хьюм, Э. и Джонсон, К. (ред.), Роль восприятия речи в фонологии . Нью-Йорк: Academic Press.
Чен, С. & Гудман, Дж. 1998. Эмпирическое исследование методов сглаживания для языкового моделирования. Технический отчет TR-10-98 , Группа компьютерных наук, Гарвардский университет.
Сиери К., Графф Д., Кимбалл О., Миллер Д. и Уокер К. 2005. Fisher English Training Part 2 . Консорциум лингвистических данных, Филадельфия, Пенсильвания.
Клоппер, К. Г., & Тернбулл, Р. 2018. Изучение вариаций в фонетической редукции: лингвистические, социальные и когнитивные факторы. В: Cangemi, F., Clayards, M., Niebuhr, O., Schuppler, B., & Zellers, M. (eds.), Переосмысление редукции: междисциплинарные перспективы условий, механизмов и областей для фонетических вариаций . Берлин: де Грюйтер.
Coetzee, A. 2016. Комплексная модель фонологической вариации: грамматические и неграмматические факторы в вариативной ассимиляции места носа. Фонология , 33, 211–246. DOI: https://doi.org/10.1017/S0952675716000117
Коэн Прива, U. 2008. Использование информационного содержания для прогнозирования удаления телефона. В: Абнер, Н., и Бишоп, Дж. (Ред.), Труды 27-й конференции Западного побережья по формальной лингвистике, 90–98.Сомервилль, Массачусетс: Проект судебных разбирательств Cascadilla.
Cohen Priva, U. 2012. Знак и сигнал: получение лингвистических обобщений из информационной утилиты . Докторская диссертация, Стэнфордский университет.
Cohen Priva, U. 2015. Информативность влияет на продолжительность согласных и частоту удаления. Лабораторная фонология , 60 (2), 243–278. DOI: https://doi.org/10.1515/lp-2015-0008
Cohen Priva, U.2017a. Информативность и срабатывание лениции. Язык , 93 (3), 569–597. DOI: https://doi.org/10.1353/lan.2017.0037
Cohen Priva, U. 2017b. Не так быстро: быстрая речь коррелирует с более низкой лексической и структурной информацией. Познание , 160, 27–34. DOI: https://doi.org/10.1016/j.cognition.2016.12.002
Коэн Прива, У. & Джегер, Т. Ф. 2018. Взаимозависимость частоты, предсказуемости и информативности в сегментарной области. Лингвистика Авангард , 4 (S2). DOI: https://doi.org/10.1515/lingvan-2017-0028
Коул, Дж., Мо, Ю., и Бэк, С. 2010. Роль синтаксической структуры в управлении восприятием просодии обычными слушателями и повседневной речью. Язык и когнитивные процессы , 25, 1141–1177. DOI: https://doi.org/10. 1080/016
5507Коул, Дж., Мо, Ю., и Хасегава-Джонсон, М.2010. Факторы, основанные на сигналах и ожиданиях, в восприятии просодической известности. Лабораторная фонология , 1, 425–452. DOI: https://doi.org/10.1515/labphon.2010.022
Коулман Дж., Ренвик М. Э. и Темпл Р. А. 2016. Вероятностная недостаточная спецификация при ассимиляции места носа. Фонология , 33 (3), 425–458. DOI: https://doi.org/10.1017/S0952675716000208
Диссель, Х.2007. Частотные эффекты в овладении языком, использовании языка и диахронических изменениях. Новые идеи в психологии , 25 (2), 108–127. DOI: https://doi.org/10.1016/j.newideapsych.2007.02.002
Дилли, Л. С. и Питт, М. А. 2007. Исследование регрессивной ассимиляции места в спонтанной речи и ее последствий для распознавания устных слов. Журнал Акустического общества Америки , 122 (4), 2340–2353. DOI: https: // doi.org / 10.1121 / 1.2772226
Эллис, Л. и Хардкасл, У. Дж. 2002. Категориальные и градиентные свойства ассимиляции в альвеолярных и велярных последовательностях: данные EPG и EMA. Фонетический журнал , 30, 373–396. DOI: https://doi.org/10.1006/jpho.2001.0162
Эрнест, М. 2014. Акустическая редукция и роль абстракций и образцов в обработке речи. Lingua , 142, 27–41.DOI: https://doi.org/10.1016/j.lingua.2012.12.006
Эрнест, М., Баайен, Р. Х., & Шредер, Р. 2002. Распознавание сокращенных словоформ. Мозг и язык , 81, 162–173. DOI: https://doi.org/10.1006/brln.2001.2514
Эрнест, М., Ханик, И., и Вербум, Э. 2015. Влияние речевой ситуации на возникновение сокращенных вариантов произношения слов. Фонетический журнал , 48, 60–75. DOI: https://doi.org/10.1016/j.wocn.2014.08.001
Эрнест, М., Лэхи, М., Верхис, Ф. и Баайен, Р. Х. 2006. Лексическая частота и ассимиляция голоса. Журнал Акустического общества Америки , 120 (2), 1040–1051. DOI: https://doi.org/10.1121/1.2211548
Эванини, К. 2009. Проницаемость диалектных границ: тематическое исследование региона, окружающего Эри, штат Пенсильвания, .Докторская диссертация, Пенсильванский университет.
Эванини, К., Изард, С. & Либерман, М. 2009. Автоматическое извлечение формантов для социолингвистического анализа больших корпусов. Интерспич 2009 .
Федзечкина, М., Ньюпорт, Э. Л., и Джегер, Т. Ф. 2017. Уравновешивание усилий и передачи информации во время овладения языком: данные по порядку слов и разметке падежа. Когнитивные науки , 41 (2).DOI: https://doi.org/10.1111/cogs.12346
Flemming, E. 2010. Слушатели моделирования: комментарии к Pluymaekers et al. и Скарборо. В: Fougeron, C., Kühnert, B., D’Imperio, M., & Vallée, N. (eds.), Laboratory Phonology 10. Mouton de Gruyter, Berlin.
Fourtassi, A., Dunbar, E., & Dupoux, E. 2014. Самосогласованность как индуктивная предвзятость в раннем овладении языком. Материалы 36-го ежегодного собрания Общества когнитивных наук.
Фаулер, К. А. 1994. Инварианты, спецификаторы, подсказки: исследование уравнений локуса как информации о месте артикуляции. Восприятие и психофизика , 55, 597–610. DOI: https://doi.org/10.3758/BF03211675
Фокс, Р. А., & Яцевич, Е. 2009. Кросс-диалектные вариации в формантной динамике гласных американского английского. Журнал Акустического общества Америки , 126 (5), 2603–2618. DOI: https://doi.org/10.1121/1.3212921
Франк, А. Ф., и Джегер, Т. Ф. 2008. Говоря рационально: единообразная плотность информации как оптимальная стратегия языкового производства. В: Лав, Б. К., Макрей, К., и Слуцкий, В. М. (ред.), Труды 30-го ежегодного собрания Общества когнитивных наук (CogSci08), 939–944. Остин, Техас: Общество когнитивных наук.
Гал, С., и Гарнси, С.М. 2004. Знание грамматики, знание использования: Синтаксические вероятности влияют на вариацию произношения. Язык , 80 (4), 748–775. DOI: https://doi.org/10.1353/lan.2004.0185
Гал, С., Яо, Ю., и Джонсон, К. 2012. Зачем сокращать? Плотность фонологического соседства и фонетическая редукция спонтанной речи. Журнал памяти и языка , 66 (4), 789–806. DOI: https://doi.org/10.1016/j.jml.2011.11.006
Гаскелл, М.Г. и Марслен-Уилсон, В. Д. 2001. Разрешение лексической неоднозначности и распознавание устных слов: устранение разрыва. Журнал памяти и языка , 44 (3), 325–349. DOI: https://doi.org/10.1006/jmla.2000.2741
Холл, К. К., Хьюм, Э., Джегер, Т. Ф., и Ведель, А. 2016. Фонология форм сообщений. Неопубликованная рукопись.
Холл, К. К., Хьюм, Э., Джегер, Т. Ф., и Ведель, А. 2018.Роль предсказуемости в формировании фонологических паттернов. Лингвистика Авангард , 4 (S2).
Хура, С. Л., Линдблом, Б., и Диль, Р. Л. 1992. О роли восприятия в формировании правил фонологической ассимиляции. Язык и речь , 35, 59–72. DOI: https://doi.org/10.1177/002383099203500206
Jaeger, M., & Hoole, P. 2011. Артикуляционные факторы, влияющие на регрессивную ассимиляцию места через границы слов в немецком языке. Фонетический журнал , 39, 413–428. DOI: https://doi.org/10.1016/j.wocn.2011.03.002
Jaeger, T. F. 2010. Избыточность и сокращение: говорящие управляют плотностью синтаксической информации. Когнитивная психология , 61 (1), 23–62. DOI: https://doi.org/10.1016/j.cogpsych.2010.02.002
Jaeger, T. F. 2013. Производственные предпочтения нельзя понять без связи. Границы психологии 4. DOI: https://doi.org/10.3389/fpsyg.2013.00230
Jaeger, T. F. & Buz, E. 2017. Уменьшение сигнала и лингвистическое кодирование. В: Фернандес, Э. М. и Кэрнс, Х. С. (ред.), Справочник по психолингвистике , 38–81. Вили-Блэквелл. DOI: https://doi.org/10.1002/9781118829516.ch4
Jun, J. 1996. Ассимиляция места не является результатом наложения жестов: данные на корейском и английском языках. Фонология , 13 (3), 377–407. DOI: https://doi.org/10.1017/S0952675700002682
Июнь, Дж. 2004. Ассимиляция места. В: Hayes, B., Kirchner, R., & Steriade, D. (eds.), Фонетическая фонология , 58–86. Кембридж: Издательство Кембриджского университета. DOI: https://doi.org/10.1017/CBO9780511486401.003
Джун, Дж. 2011. Позиционные эффекты в группах согласных. В: Остендорп, М., Ван Эвен, К. Дж., Хьюм, Э. и Райс, К. (ред.), The Blackwell Companion to Phonology . Молден, Массачусетс: Wiley-Blackwell. DOI: https://doi.org/10.1002/9781444335262.wbctp0046
Джурафски, Д., Белл, А., Грегори, М., и Раймонд, В. 2001. Вероятностные отношения между словами: свидетельства сокращения лексического производства. В: Байби Дж. И Хоппер П. (ред.), Частота и появление языковой структуры . Джон Бенджаминс, Амстердам.DOI: https://doi.org/10.1075/tsl.45.13jur
Канвал, Дж. , Смит, К., Калбертсон, Дж., И Кирби, С. 2017. Закон аббревиатуры Ципфа и принцип наименьшего усилия: пользователи языка оптимизируют миниатюрную лексику для эффективного общения. Познание , 165, 45–52. DOI: https://doi.org/10.1016/j.cognition.2017.05.001
Кавахара, С. & Гарви, К. 2014. Ассимиляция места носа и восприятие контрастов мест. Открытая лингвистика , 1 (1), 17–36. DOI: https://doi.org/10.2478/opli-2014-0002
Кавасаки-Фукумори, Х. 1992. Акустическая основа универсальных фонотаксических ограничений. Язык и речь , 35, 73–86. DOI: https://doi.org/10.1177/002383099203500207
Колер, К. Дж. 1991. Проблема фонетики / фонологии в изучении артикуляционной редукции. Phonetica , 48, 180–192.DOI: https://doi.org/10.1159/000261883
Курумада, К. и Джегер, Т. Ф. 2015. Коммуникативная эффективность в языковом производстве: факультативная маркировка падежами на японском языке. Журнал памяти и языка , 83, 152–178. DOI: https://doi.org/10.1016/j.jml.2015.03.003
Кузла, К., Чо, Т., и Эрнест, М. 2007. Просодическое усиление немецких фрикативов по продолжительности и ассимиляционное посвящение. Фонетический журнал , 35 (3), 301–320. DOI: https://doi.org/10.1016/j.wocn.2006.11.001
Лабов В., Эш С. и Боберг С. 2005. Атлас североамериканского английского языка: фонетика, фонология и изменение звука . Вальтер де Грюйтер. DOI: https://doi.org/10.1515/9783110206838
Лабов В., Розенфельдер И. и Фрювальд Дж. 2013. Сто лет звуковых изменений в Филадельфии: линейное приращение, обращение и повторный анализ. Язык , 89 (1), 30–65. DOI: https://doi.org/10.1353/lan.2013.0015
Лехист И. и Петерсон Г. Э. 1961. Переходы, скольжения и дифтонги. Журнал Акустического общества Америки , 33 (3), 268–277. DOI: https://doi.org/10.1121/1.1
8Линдблом, Б. 1990. Объяснение фонетических вариаций: набросок теории H&H. В: Hardcastle, W. J., & Marchal, A.(ред.), Производство речи и моделирование речи . Kluwer, Дордрехт. DOI: https://doi.org/10.1007/978-94-009-2037-8_16
Маховальд, К., Федоренко, Э., Пиантадози, С. Т., и Гибсон, Э. 2013. Информация / теория информации: говорящие выбирают более короткие слова в контексте прогнозирования. Познание , 126 (2), 313–318. DOI: https://doi.org/10.1016/j.cognition.2012.09.010
Мори Р. Д., Хоэкстра Р., Роудер, Дж. Н., Ли, М. Д., и Вагенмакерс, Э. Дж., 2016 г. Ошибочность определения уверенности в доверительных интервалах. Психономический бюллетень и обзор , 23 (1), 103–123. DOI: https://doi.org/10.3758/s13423-015-0947-8
Mowrey, R. & Pagliuca, W. 1987. Артикуляционная эволюция. В: Рамат А.Г., Карруба О. и Бернини Г. (ред.), Материалы 7-й Международной конференции по исторической лингвистике. Издательство Джона Бенджамина.
Mowrey, R. & Pagliuca, W. 1995. Редукционный характер артикуляционной эволюции. Rivista di linguistica , 7, 37–124.
Мансон, Б. 2001. Частота фонологических паттернов и производство речи у взрослых и детей. Журнал исследований речи, языка и слуха , 44, 778–92. DOI: https://doi.org/10.1044/1092-4388(2001/061)
Охала, Дж.J. 1990. Фонетика и фонология аспектов ассимиляции. В: Кингстон, Дж. И Бекман, М. Э. (ред.), Статьи по лабораторной фонологии I: Между грамматикой и физикой речи , 258–275. Кембридж: КУБОК. DOI: https://doi.org/10.1017/CBO9780511627736. 014
Отаке, Т., Йонеяма, К., Катлер, А., и ван дер Лугт, А. 1996. Изображение японских моральных носов. Журнал Акустического общества Америки , 100 (6), 3831–3842.DOI: https://doi.org/10.1121/1.417239
Pierrehumbert, J. 2001. Динамика образцов: частота слов, четкость и контраст. В: Байби Дж. И Хоппер П. (ред.), Частота и появление языковой структуры , 137–158. Джон Бенджаминс, Амстердам. DOI: https://doi.org/10.1075/tsl.45.08pie
Pierrehumbert, J. 2002. Фонетика для отдельных слов. В: Gussenhoven, C., & Warner, N.(ред.), Лабораторная фонология VII . Мутон де Грюйтер, Берлин. DOI: https://doi.org/10.1515/9783110197105.101
Питт, Массачусетс, Дилли, Л., Джонсон, К., Кислинг, С., Раймон, В., Хьюм, Э., и Фослер-Люсье, Е. 2007. Корпус разговорной речи Buckeye (2-й выпуск) [www .buckeyecorpus.osu.edu]. Колумбус, Огайо: Департамент психологии Государственного университета Огайо (дистрибьютор).
Питт, М.А., Джонсон, К. 2003. Использование данных произношения в качестве отправной точки в моделировании распознавания слов. Материалы 15-го Международного конгресса фонетических наук.
Раймонд, В. Д., Даутрикур, Р. и Хьюм, Е. 2006. Внутреннее слово / t, d / удаление в спонтанной речи: моделирование эффектов экстралингвистических, лексических и фонологических факторов. Вариация и изменение языка , 18, 55–97. DOI: https://doi.org/10.1017/S0954394506060042
R Основная команда.2016. R: Язык и среда для статистических вычислений . R Фонд статистических вычислений, Вена, Австрия. URL: https://www.R-project.org/.
Рекасенс, Д. 2018. Коартикуляция. Оксфордская исследовательская энциклопедия лингвистики . Издательство Оксфордского университета.
Resnik, P. 1996. Ограничения выбора: теоретико-информационная модель и ее вычислительная реализация. Познание , 61 (1–2), 127–159. DOI: https://doi.org/10.1016/S0010-0277(96)00722-6
Розенфельдер, И., Фрювальд, Дж., Эванини, К., Сейфарт, С., Горман, К., Причард, Х., и Юань, Дж. 2014. Программный пакет FAVE (принудительное выравнивание и извлечение гласных) v1 .2.2 . DOI: https://doi.org/10.5281/zenodo.22281.
Rysling, A. 2017. Предпочтительная ранняя атрибуция при сегментарном анализе .Докторская диссертация, Массачусетский университет в Амхерсте.
Скарборо, Р. 2004. Коартикуляция и структура лексики . Докторская диссертация, Калифорнийский университет в Лос-Анджелесе.
Скарборо, Р. 2010. Лексическая и контекстная предсказуемость: эффекты слияния на производство гласных. В: Fougeron, C., Kühnert, B., D’Imperio, M., & Vallée, N. (eds.), Laboratory Phonology 10.Мутон де Грюйтер, Берлин.
Скарборо, Р. 2013. Образцы, обусловленные соседством, в фонетических деталях: Связь коартикуляции и гиперартикуляции. Фонетический журнал , 41 (6), 491–508. DOI: https://doi.org/10.1016/j.wocn.2013.09.004
Сейфарт, С. 2014. Информативность слова влияет на акустическую продолжительность: влияние контекстной предсказуемости на лексическое представление. Познание , 133, 140–155.DOI: https://doi.org/10.1016/j.cognition.2014.06.013
Sóskuthy, M., & Hay, J. 2017. Изменение словоупотребления предсказывает изменение продолжительности слов в новозеландском английском языке. Познание , 166, 298–313. DOI: https://doi.org/10.1016/j. cognition.2017.05.032
Команда разработчиков Stan. 2016a. rstanarm: прикладное байесовское регрессионное моделирование через Stan. Пакет R, версия 2.17.4 . http: // mc-stan.org /.
Команда разработчиков Stan. 2016b. RStan: R-интерфейс для Стэна. Пакет R, версия 2.16.2 . http://mc-stan.org/.
Стил Дж., Колантони Л. и Кочетов А. (в печати). Ассимиляция градиента во французских кроссвордах / n / велярных стоповых последовательностях. Журнал Международной фонетической ассоциации . DOI: https://doi.org/10.1017/S0025100317000573
Стериаде, Д.2001. Направленные асимметрии в ассимиляции места: перцепционный счет. В: Хьюм, Э. и Джонсон, К. (ред.), Роль восприятия речи в фонологии , 219–250. Нью-Йорк: Academic Press.
Stolcke, A. 2002. SRILM — расширяемый инструментарий языкового моделирования. Интерспич 2002 .
Stolcke, A., Zheng, J., Wang, W., & Abrash, V. 2011. SRILM в шестнадцать лет: обновление и перспективы.В: Proceedings of IEEE Automatic Speech Recognition and Understanding Workshop 5.
Тили, Х. и Куперман, В. 2012. Рациональное фонологическое удлинение в разговорном голландском языке. Журнал Акустического общества Америки , 132 (6), 3935–3940. DOI: https://doi.org/10.1121/1.4765071
Томашек, Ф., Такер, Б., Фазиоло, М., и Баайен, Х. 2018. Практика совершенствует: последствия владения лексикой для артикуляции. Лингвистика Авангард , 4 (S2).
Тернбулл, Р. 2017. Роль предсказуемости в интонационной изменчивости. Язык и речь , 60 (1), 123–153. DOI: https://doi.org/10.1177/0023830916647079
Тернбулл, Р. 2018. Паттерны вероятностного удаления / сокращения сегментов на английском и японском языках. Лингвистика Авангард , 4 (S2). DOI: https://doi.org/10.1515/lingvan-2017-0033
ван Сон, Р.J. J. H., & Pols, L. C. W. 2003. Насколько эффективна речь? Труды Института фонетических наук , 25, 171–184.
Vehtari, A., Gelman, A., & Gabry, J. 2017. Практическая оценка байесовской модели с использованием перекрестной проверки исключения по одному и WAIC. Статистика и вычисления , 27 (5), 1413–1432. DOI: https://doi.org/10.1007/s11222-016-9696-4
Вишванатан, Н., Магнусон, Дж. С. и Фаулер, К. А. 2010. Компенсация коартикуляции: разделение слуховых и жестовых теорий восприятия коартикуляционных эффектов в речи. Журнал экспериментальной психологии: человеческое восприятие и производительность , 36 (4), 1005–1015. DOI: https://doi.org/10.1037/a0018391
Wasow, T., Levy, R., Melnick, R., Zhu, H., & Juzek, T. 2015. Обработка, Просоды и необязательно. В: Фрейзер, Л., и Гибсон, Э.(ред.), Явная и неявная просодия в обработке предложений (Исследования по теоретической психолингвистике) , 133–158. Чам: Спрингер.
Ведель, А. 2006. Образцовые модели, эволюция и изменение языка. Лингвистический обзор , 23 (3), 247–274. DOI: https://doi.org/10.1515/TLR.2006.010
Ведель А., Нельсон Н. и Шарп Р. 2018. Фонетическая специфика контрастивной гиперартикуляции в естественной речи. Журнал памяти и языка , 100, 61–88. DOI: https://doi.org/10.1016/j.jml.2018.01.001
Weenink, D. J. 2015. Улучшенные измерения частоты формант коротких сегментов. Материалы 18-го Международного конгресса фонетических наук.
Wickham, H. 2009. ggplot2: Элегантная графика для анализа данных . Springer-Verlag New York. DOI: https://doi.org/10.1007/978-0-387-98141-3
Винтерс, С.2003. Эмпирические исследования перцептивного и артикуляционного происхождения кросс-лингвистической асимметрии при ассимиляции места . Докторская диссертация, Государственный университет Огайо.
% PDF-1.7 % 1098 0 объект > эндобдж xref 1098 172 0000000016 00000 н. 0000004865 00000 н. 0000005110 00000 н. 0000005139 00000 п. 0000005195 00000 н. 0000005232 00000 н. 0000005891 00000 н. 0000006017 00000 п. 0000006218 00000 н. 0000006343 00000 п. 0000006463 00000 н. 0000006583 00000 н. 0000006701 00000 п. 0000006817 00000 н. 0000006937 00000 п. 0000007054 00000 н. 0000007170 00000 н. 0000007290 00000 н. 0000007410 00000 н. 0000007530 00000 н. 0000007656 00000 н. 0000007782 00000 н. 0000007908 00000 н. 0000008034 00000 н. 0000008158 00000 п. 0000008285 00000 н. 0000008413 00000 н. 0000008537 00000 н. 0000008663 00000 н. 0000008782 00000 н. 0000008902 00000 н. 0000009022 00000 н. 0000009141 00000 п. 0000009260 00000 н. 0000009378 00000 п. 0000009508 00000 н. 0000009671 00000 п. 0000009820 00000 н. 0000009958 00000 н. 0000010094 00000 п. 0000010258 00000 п. 0000010428 00000 п. 0000010580 00000 п. 0000010665 00000 п. 0000010750 00000 п. 0000010834 00000 п. 0000010917 00000 п. 0000011001 00000 п. 0000011084 00000 п. 0000011168 00000 п. 0000011252 00000 п. 0000011336 00000 п. 0000011420 00000 н. 0000011503 00000 п. 0000011587 00000 п. 0000011670 00000 п. 0000011754 00000 п. 0000011838 00000 п. 0000011921 00000 п. 0000012005 00000 п. 0000012088 00000 п. 0000012172 00000 п. 0000012255 00000 п. 0000012338 00000 п. 0000012422 00000 п. 0000012505 00000 п. 0000012589 00000 п. 0000012672 00000 п. 0000012756 00000 п. 0000012840 00000 п. 0000012923 00000 п. 0000013007 00000 п. 0000013090 00000 н. 0000013174 00000 п. 0000013258 00000 п. 0000013342 00000 п. 0000013426 00000 п. 0000013509 00000 п. 0000013594 00000 п. 0000013677 00000 п. 0000013761 00000 п. 0000013844 00000 п. 0000013927 00000 п. 0000014011 00000 п. 0000014095 00000 п. 0000014178 00000 п. 0000014261 00000 п. 0000014344 00000 п. 0000014427 00000 п. 0000014510 00000 п. 0000014591 00000 п. 0000014676 00000 п. 0000014761 00000 п. 0000014846 00000 п. 0000014932 00000 п. 0000015017 00000 п. 0000015102 00000 п. 0000015188 00000 п. 0000015274 00000 п. 0000015573 00000 п. 0000016297 00000 п. 0000016377 00000 п. 0000016975 00000 п. 0000018109 00000 п. 0000018281 00000 п. 0000018442 00000 п. 0000019543 00000 п. 0000020250 00000 п. 0000020472 00000 п. 0000020645 00000 п. 0000021116 00000 п. 0000022194 00000 п. 0000022343 00000 п. 0000022749 00000 п. 0000023097 00000 п. 0000024427 00000 п. 0000025826 00000 п. 0000027151 00000 п. 0000027514 00000 п. 0000028921 00000 п. 0000030090 00000 п. 0000036655 00000 п. 0000043046 00000 п. 0000047134 00000 п. 0000051779 00000 п. 0000099036 00000 н. 0000126565 00000 н. 0000127024 00000 н. 0000127223 00000 н. 0000127508 00000 н. 0000127571 00000 н. 0000128009 00000 н. 0000128209 00000 н. 0000129428 00000 н. 0000129643 00000 н. 0000129941 00000 н. 0000130134 00000 п. 0000130191 00000 н. 0000131929 00000 н. 0000132195 00000 н. 0000132734 00000 н. 0000132858 00000 н. 0000156191 00000 н. 0000156232 00000 н. 0000156766 00000 н. 0000156885 00000 н. 0000209361 00000 н. 0000209402 00000 н. 0000209463 00000 н. 0000209700 00000 н. 0000209862 00000 н. 0000209978 00000 н. 0000210154 00000 п. 0000210296 00000 п. 0000210446 00000 н. 0000210718 00000 н. 0000210904 00000 н. 0000211038 00000 н. 0000211274 00000 н. 0000211405 00000 н. 0000211541 00000 н. 0000211704 00000 п. 0000211834 00000 н. 0000212068 00000 н. 0000212240 00000 н. 0000212415 00000 н. 0000212574 00000 н. 0000212816 00000 н. 0000212994 00000 н. 0000213151 00000 п. 0000004687 00000 н. 0000003818 00000 н. трейлер ] >> startxref 0 %% EOF 1269 0 объект > поток x ڤ SKLSQ = ђ — [TDcD ** Z0Jӈ.L) (? IRRZD + w & scDND6kYgr3sΜi {v! F,! ˖h ڕ @ v + {Kj $ ɲ ~
Грамматика | Britannica
Грамматика , правила языка, регулирующие звуки, слова, предложения и другие элементы, а также их сочетание и интерпретацию. Слово грамматика также означает изучение этих абстрактных функций или книгу, в которой представлены эти правила. В ограниченном смысле этот термин относится только к изучению структуры предложения и слова (синтаксиса и морфологии), исключая словарный запас и произношение.
Британская викторина
Тест по грамматике
Какой глагол содержится в предложении «Джон пнул футбольный мяч по двору»? От модификаторов до форм множественного числа — посмотрите, насколько хорошо вы набрали в этом исследовании грамматики английского языка.
Далее следует краткое описание грамматики. Для полного обращения, см. языкознание.
Понятия грамматики
Распространенное современное определение грамматики — это основная структура языка, которую любой носитель этого языка знает интуитивно. Систематическое описание особенностей языка также является грамматикой. Это фонология (звук), морфология (система словообразования), синтаксис (образцы расположения слов) и семантика (значение). В зависимости от подхода грамматика, грамматика может быть предписывающей ( т. Е. обеспечивает правила для правильного использования), описательной ( т.например, описывают, как на самом деле используется язык), или порождающие (, т.е. предоставляют инструкции для создания бесконечного числа предложений на языке). Традиционно основное внимание уделялось морфологии и синтаксису, и для некоторых современных лингвистов (и многих традиционных грамматиков) это единственная надлежащая область предмета.
Древние и средневековые грамматики
В Европе греки первыми написали грамматики. Для них грамматика была инструментом, который можно было использовать при изучении греческой литературы; отсюда их внимание к литературному языку.Александрийцы I века до нашей эры продолжили развитие греческой грамматики, чтобы сохранить чистоту языка. Дионис Тракс Александрийский позже написал влиятельный трактат под названием The Art of Grammar, , в котором он проанализировал литературные тексты с точки зрения букв, слогов и восьми частей речи.
Получите подписку Britannica Premium и получите доступ к эксклюзивному контенту. Подпишись сейчасРимляне переняли грамматическую систему греков и применили ее к латыни.За исключением Варрона, жившего в I веке до нашей эры, который считал, что грамматики должны открывать структуры, а не диктовать их, большинство латинских грамматиков не пытались изменить греческую систему, а также стремились защитить свой язык от разложения. В то время как образцом для греков и александрийцев был язык Гомера, труды Цицерона и Вергилия установили латинский стандарт. Работы Доната (4 век нашей эры) и Присциана (6 век нашей эры), наиболее важных латинских грамматиков, широко использовались для обучения латинской грамматике в средние века в Европе.В средневековой Европе обучение велось на латыни, и латинская грамматика стала основой учебной программы по гуманитарным наукам. За это время для студентов было написано много грамматик. Эльфрик, аббат Эйншема (11 век), который написал первую латинскую грамматику на англосаксонском языке, предложил, чтобы эта работа также служила введением в английскую грамматику. Так началась традиция анализа грамматики английского языка по латинскому образцу.
модистов, грамматиков середины 13 — середины 14 веков, которые рассматривали язык как отражение реальности, обращались к философии за объяснением грамматических правил. modistae искали одну «универсальную» грамматику, которая служила бы средством понимания природы бытия. Во Франции 17-го века группа грамматиков из Порт-Рояля также интересовалась идеей универсальной грамматики. Они утверждали, что общие элементы мышления можно различить в грамматических категориях всех языков. В отличие от своих греческих и латинских коллег, грамматики Порт-Рояля не изучали литературный язык, а вместо этого утверждали, что его использование должно диктоваться реальной речью живых языков.Отмечая их акцент на лингвистических универсалиях, современный лингвист Ноам Хомски назвал группу Порт-Ройял первыми трансформирующими грамматиками.
Современные и современные грамматики
К 1700 году были напечатаны грамматики 61 местного языка. Они были написаны в первую очередь с целью реформирования, очищения или стандартизации языка и использовались в педагогических целях. Правила грамматики обычно относились только к формальному, письменному, литературному языку и не применялись ко всем разновидностям реального устного языка.Этот предписывающий подход долгое время доминировал в школах, где изучение грамматики стало ассоциироваться с «синтаксическим анализом» и составлением диаграмм предложений. Оппозиция преподаванию исключительно с точки зрения предписывающих и предписывающих (, т.е. , то есть, что не должно быть) правил росла в середине десятилетия 20-го века.
Структурное описание предложения «Человек ударит мяч», заданное правилами простой грамматики фразеологической структуры.
Британская энциклопедия, Inc.Упрощение грамматики для использования в классе резко контрастировало со сложными исследованиями языков, проводимыми лингвистами. В течение 19 — начала 20 веков историческая точка зрения процветала. Ученые, осознавшие, что каждый живой язык находится в состоянии постоянного изменения, изучили все типы письменных источников современных европейских языков, чтобы определить пути их эволюции. Они не ограничивали свои исследования литературными языками, но также включали диалекты и современные разговорные языки.Историки-грамматики не следовали ранее предписывающим подходам, а вместо этого были заинтересованы в обнаружении происхождения изучаемого языка.
В результате работы историков-грамматиков ученые пришли к выводу, что изучение языка может быть либо диахроническим (его развитие во времени), либо синхронным (его состояние в определенное время). Швейцарский лингвист Фердинанд де Соссюр и другие описательные лингвисты начали изучать разговорный язык. Они собрали большую выборку предложений, составленных носителями языка, и классифицировали свой материал, начиная с фонологии и заканчивая синтаксисом.
Генеративные или трансформирующие грамматики второй половины 20 века, такие как Ноам Хомски, изучали знания носителей языка, которые позволяют им создавать и понимать бесконечное количество предложений. В то время как дескриптивисты, такие как Соссюр, исследовали образцы индивидуальной речи, чтобы прийти к описанию языка, трансформационисты сначала изучали основную структуру языка. Они попытались описать «правила», которые определяют «компетенцию» носителя языка (бессознательное знание языка) и учитывают все случаи «производительности» говорящего (стратегии, которые человек использует в реальном производстве предложений). См. Порождающую грамматику ; трансформационная грамматика.
Изучение грамматической теории веками интересовало философов, антропологов, психологов и литературных критиков. Сегодня грамматика существует как область лингвистики, но все еще сохраняет связь с другими дисциплинами. Для многих людей грамматика по-прежнему относится к совокупности правил, которые необходимо знать, чтобы говорить или писать «правильно». Однако с последней четверти 20-го века более сложное понимание грамматических вопросов укоренилось, особенно в школах.В некоторых странах, таких как Австралия и Соединенное Королевство, были разработаны новые учебные программы по английскому языку, в которых грамматика является центром исследования, избегая прескриптивизма прежних времен и используя методы, которые способствуют живому и вдумчивому духу исследования.
Эта статья была недавно отредактирована и обновлена старшим редактором Брайаном Дуиньяном.Подробнее читайте в связанных статьях Britannica:
Английский не фонетический | Английский Клуб
Йозеф Эссбергер
Некоторые языки являются «фонетическими».Это означает, что вы можете смотреть на написанное слово и знать, как его произносить. Или вы можете слышать слово и знать, как его написать. В фонетических языках существует прямая связь между написанием и звуком.
Важно понимать, что английский — это , а не фонетический язык. Поэтому мы часто говорим слово не так, как оно написано.
Некоторые слова могут иметь одинаковое написание , но различное произношение , например:
- Мне нравится читать [ri: d].
- Я прочитал [красный] эту книгу.
Некоторые слова имеют различное написание , но такое же произношение , например:
- Я прочитал [красный] эту книгу.
- Красный [красный] — мой любимый цвет.
(Вы также можете прослушать эти четыре предложения здесь.)
Студенты иногда спрашивают: «Почему английский так трудно произносить?» Это действительно неправильный вопрос.Правильный вопрос: «Почему по-английски так сложно писать по буквам?»
Сначала говорят на всех языках, а потом пишут. Если вы говорите только на английском языке, это очень легко произносится. Сложность возникает, когда вы пишете по-английски, а затем пытаетесь говорить на нем так же, как пишете. Когда вы тренируетесь в произношении, постарайтесь забыть о письменном английском. Подумайте только о звуке слов.
Чтобы проиллюстрировать этот момент, мы говорим, что написание «ough» может произноситься с помощью семи различных звуков.