Сбежал фонетический разбор слова: Фонетический разбор слова и звуко-буквеннный анализ

Содержание

Определение, фонетический (звуко-буквенный) разбор и разбор слова по составу

На данной странице представлено лексическое значение слова «сбежать», а также сделан звуко-буквенный разбор и разбор слова по составу с транскрипцией и ударениями.

Оглавление:

  1. Значение слова
  2. Звуко-буквенный разбор
  3. Разбор по составу

Значение слова

СБЕЖАТЬ, сбегу, сбежишь, сбегут; сов.

1. с чего. Бегом спуститься вниз, а также (перен.) быстро спуститься откудан. С. с лестницы. Потоки сбежали с гор.

2. Убежать тайком. С. от преследователей. С. из дома.

3. (1 и 2 л. не употр.), перен. Исчезнуть, удалиться. С лица сбежал румянец. Улыбка сбежала с губ. Со стен сбежала краска.

| несов. сбегать, аю, аешь.

Фонетический (звуко-буквенный) разбор

сбе́жать

сбежать — слово из 2 слогов: сбе-жать. Ударение падает на 1-й слог.

Транскрипция слова: [сб’эжат’]

с — [с] — согласный, глухой парный, твёрдый (парный)
б — [б’] — согласный, звонкий парный, мягкий (парный)
е — [э] — гласный, ударный
ж — [ж] — согласный, звонкий парный, твёрдый (непарный, всегда произноится твёрдо), шипящий
а — [а] — гласный, безударный
т — [т’] — согласный, глухой парный, мягкий (парный)
ь — не обозначает звука

В слове 7 букв и 6 звуков.

Цветовая схема: сбежать


Разбор слова «сбежать» по составу

сбежать (программа института)
сбежать (школьная программа)

Части слова «сбежать»: с/беж/а/ть
Часть речи: глагол
Состав слова:
с — приставка,
беж — корень,
а, ть — суффиксы,
нет окончания,
сбежа — основа слова.

Примечание: ть является формообразующим суффиксом и не входит в основу слова, но во многих школьных программах ть отмечается как окончание.



Конспект урока «Фонетика. Звуковая сторона слова».

Цель:

  • систематизация знаний и проверка уровня языковой компетенции учащихся в рамках темы «Фонетика», совершенствовать умения производить транскрипцию слова
  • показать роль правильного литературного произношения и ударения в устном общении;
  • провести тестирование по подготовке к экзамену и ЦТ;
  • развивать умственную деятельность учащихся; умения применения полученных знаний в нестандартных ситуациях.
  • воспитывать интерес, уважение к русскому языку; формировать навыки сотрудничества, воспитывать навыки самоконтроля, стремления к самосовершенствованию.

Оборудование:

1) карточки с заданиями;

 2) материалы презентации, выполненные в программе Power Point.

3) электронные тренажёры «Фраза», «1С: репетитор»

Методика урока: теоретическое повторение, тренировочные упражнения.

Форма урока: урок повторения с использованием ИКТ, элементов технологии сотрудничества.

Ход урока

Мотивационный момент

I. Сообщение темы, цели урока.

Орфографическая разминка / тренажёр «Фраза»/, онлайн — тест

II. Актуализация знаний по теме “Фонетика”.

  1. Беседа с учащимися
  • Какое княжество волшебной страны Русского языка является самым старинным? Почему?
  • Что изучает фонетика?
  • Как называется минимальная единица языка? (Фонема)
  • Звуки, при образовании которых воздушная струя проходит через рот без препятствий.
  • Сильная позиция для гласных звуков?

Охарактеризуйте согласные звуки

  • При образовании этих звуков воздушная струя проходит через рот, преодолевая различные препятствия.
  • Сильная позиция для согласных звуков?
  • Чем отличаются звуки и буквы?

III. Тренировочные упражнения.

  1. Работа с учебником    §  8-10,   упр. 69 устно

Назовите основные фонетические процессы, происходящие в словах:

сожалеть, укоризна (редукция — ослабление произношения гласных звуков),

сочувствовать, предерзостный (выпадение-процесс, при котором в сочетаниях согласных стн, здн, вст, дц, лнц и других происходит выпадение звука),

робкий, небоскрёб (оглушение-процесс, при котором звонкие согласные перед глухими и в конце слова произносятся как глухие звуки),

косьба, айсберг (озвончение — глухие в положении перед звонкими произносятся как звонкие),

счёт (стяжение- процесс, при котором сочетание нескольких согласных произносится как 1 долгий звук).

Упр. 70,71 – устно

  1. Запишите слова в тетради. Сверху укажите, какие звуки будут соответствовать выделенным  буквам.
  2. Устно охарактеризуйте звуки, соответствующие выделенным звукам.
  3. Какими звуками различаются следующие пары слов?

ВОЛ – ВЕЛ       ПЛОТЫ – ПЛОДЫ        СУПЫ- ЗУБЫ       ЛУК – ЛЮК       МОЛ — МЕЛЬ

  1. Запишите транскрипцию следующих слов, распределяя их по трём столбцам

Кость, въезд, ее, ежик, женитьба, есть, мозг, молоко, подружиться, подсчет, приют, сбежал, ферзь, рушится, шведский, ясно.

Количество букв и звуков в слове совпадает.

Звуков в слове больше, чем букв.

Звуков в слове меньше, чем букв.

  1. Определите, сколько раз встречается звук [Ы] в следующих строчках:

Аист жил у нас на крыше,

А в подвале жили мыши

Работа в парах

  1. Определите, какой согласный звук (глухой или звонкий) обозначен подчёркнутой буквой. Какие фонетические процессы наблюдаются в приведённых словах?

Забастовка, сдаться, от дома, любовь, что, указка, честный, рябь, мороз,  к берегу.

  1. Укажите слова, соответствующие описанию:
  1. Слово, в котором два мягких и два твёрдых согласных звука: полевые, описание, ответ;
  2. Слово, в котором все согласные звуки твердые: широта, желать, цивилизация;
  3. Слово, в котором все согласные звуки мягкие: чешуя, чаща, шикарный.
  1. Выполнить фонетический разбор слова дыхание

Работа с текстом.

Отрывок из романа А.С. Пушкина «Евгений Онегин». Определить, какие качества звуков придают поэтической речи особую мелодичность.

Гонимы вешними лучами,

С окрестных гор уже снега

Сбежали мутными ручьями

На потопленные луга.

IV Подготовка к экзамену и ЦТ тренажёр «1С: репетитор»

V  Рефлексия

О чем шла речь на уроке?

Какие задания показались наиболее сложными (вызвали затруднения)?

 Какие умения и навыки совершенствовали?

VI Домашнее задание

§  8-10,  подготовить устное сообщение «Фонетика – раздел науки о языке». Выполнить фонетический разбор слова ПОНЯТИЕ

VII  Итог  урока.  Собрать тетради на проверку.

Просмотр содержимого документа
«Конспект урока «Фонетика. Звуковая сторона слова».»

Фонетика. Звуковая сторона слова

Цель:

  • систематизация знаний и проверка уровня языковой компетенции учащихся в рамках темы «Фонетика», совершенствовать умения производить транскрипцию слова

  • показать роль правильного литературного произношения и ударения в устном общении;

  • провести тестирование по подготовке к экзамену и ЦТ;

  • развивать умственную деятельность учащихся; умения применения полученных знаний в нестандартных ситуациях.

  • воспитывать интерес, уважение к русскому языку; формировать навыки сотрудничества, воспитывать навыки самоконтроля, стремления к самосовершенствованию.

Оборудование:

1) карточки с заданиями;

2) материалы презентации, выполненные в программе Power Point.

3) электронные тренажёры «Фраза», «1С: репетитор»

Методика урока: теоретическое повторение, тренировочные упражнения.

Форма урока: урок повторения с использованием ИКТ, элементов технологии сотрудничества.

Ход урока

Мотивационный момент

I. Сообщение темы, цели урока.

Орфографическая разминка / тренажёр «Фраза»/, онлайн — тест

II. Актуализация знаний по теме “Фонетика”.

  1. Беседа с учащимися

  • Какое княжество волшебной страны Русского языка является самым старинным? Почему?

  • Что изучает фонетика?

  • Как называется минимальная единица языка? (Фонема)

  • Звуки, при образовании которых воздушная струя проходит через рот без препятствий.

  • Сильная позиция для гласных звуков?

Охарактеризуйте согласные звуки

  • При образовании этих звуков воздушная струя проходит через рот, преодолевая различные препятствия.

  • Сильная позиция для согласных звуков?

  • Чем отличаются звуки и буквы?

III. Тренировочные упражнения.

  1. Работа с учебником

§ 8-10, упр. 69 устно

Назовите основные фонетические процессы, происходящие в словах:

сожалеть, укоризна (редукция — ослабление произношения гласных звуков),

сочувствовать, предерзостный (выпадение—процесс, при котором в сочетаниях согласных стн, здн, вст, дц, лнц и других происходит выпадение звука),

робкий, небоскрёб (оглушение-процесс, при котором звонкие согласные перед глухими и в конце слова произносятся как глухие звуки),

косьба, айсберг (озвончение — глухие в положении перед звонкими произносятся как звонкие),

счёт (стяжение- процесс, при котором сочетание нескольких согласных произносится как 1 долгий звук).

упр. 70,71 – устно

  1. Запишите слова в тетради. Сверху укажите, какие звуки будут соответствовать выделенным буквам.

Клюшка , рябенький, сёстры, север, солянка, люкс

  1. Устно охарактеризуйте звуки, соответствующие выделенным звукам.

Столб, просьба, ножка, сделать, женитьба, мармелад.

  1. Какими звуками различаются следующие пары слов?

ВОЛ – ВЕЛ

ПЛОТЫ – ПЛОДЫ

СУПЫ- ЗУБЫ

ЛУК – ЛЮК

МОЛ — МЕЛЬ

  1. Запишите транскрипцию следующих слов, распределяя их по трём столбцам

Кость, въезд, ее, ежик, женитьба, есть, мозг, молоко, подружиться, подсчет, приют, сбежал, ферзь, рушится, шведский, ясно.

Количество букв и звуков в слове совпадает.

Звуков в слове больше, чем букв.

Звуков в слове меньше, чем букв.

  1. Определите, сколько раз встречается звук [Ы] в следующих строчках:

Аист жил у нас на крыше,

А в подвале жили мыши

Работа в парах

  1. Определите, какой согласный звук (глухой или звонкий) обозначен подчёркнутой буквой. Какие фонетические процессы наблюдаются в приведённых словах?

Забастовка, сдаться, от дома, любовь, что, указка, честный, рябь, мороз, к берегу.

  1. Укажите слова, соответствующие описанию:

  1. Слово, в котором два мягких и два твёрдых согласных звука: полевые, описание, ответ;

  2. Слово, в котором все согласные звуки твердые: широта, желать, цивилизация;

  3. Слово, в котором все согласные звуки мягкие: чешуя, чаща, шикарный.

  1. Выполнить фонетический разбор слова дыхание

Работа с текстом.

Отрывок из романа А.С. Пушкина «Евгений Онегин». Определить, какие качества звуков придают поэтической речи особую мелодичность.

Гонимы вешними лучами,

С окрестных гор уже снега

Сбежали мутными ручьями

На потопленные луга.

IV Подготовка к экзамену и ЦТ тренажёр «1С: репетитор»

V Рефлексия

О чем шла речь на уроке?

Какие задания показались наиболее сложными (вызвали затруднения)?

Какие умения и навыки совершенствовали?

VI Домашнее задание

§ 8-10, подготовить устное сообщение «Фонетика – раздел науки о языке». Выполнить фонетический разбор слова ПОНЯТИЕ

VII Итог урока. Собрать тетради на проверку.

Морфологический разбор глагола Сбежали. Начальная форма, часть речи, постоянные и непостоянные признаки

Выполним онлайн морфологический разбор слова «сбежали» (часть речи: глагол) в соответствии с правилами русского языка. Слово состоит из трех слогов. Ударение в слове «сбежАли» падает на букву «а».

Часть речи

глагол

Синтаксическая роль

В зависимости от контекста

Морфологические признаки

Постоянные признаки непереходный, совершенный вид, 1 спряжение
Непостоянные признаки прошедшее время, изъявительное наклонение, изъявительное, множественное число
Начальная формасбежать

Фонетический (звуко-буквенный) разбор слова

сб’иж`ал’и

Слово по слогам (3)

сбе-жа-ли

Перенос слова

сбе-жали, сбежа-ли

Данный разбор был сделан с помощью искусственного интеллекта и может быть не правильным. Результаты разбора могут быть использованы исключительно для самопроверки. Если вы нашли ошибку, оставьте комментарий в форме ниже.


Ещё никто не оставил комментария, вы будете первым.


Написать комментарий

Спасибо за комментарий, он будет опубликован после проверки

Конспект урока по русскому языку на тему «Фонетические единицы»

Раздел. Фонетика, орфоэпия, графика, орфография

Тема. Фонетические средства языка. Орфоэпические нормы.

Сопоставление устной и письменной речи

Цели урока (90 мин):

Образовательная: систематизировать основные знания, умения, навыки по фонетике; выработать четкое представление о системе гласных и согласных звуков, а также способах их обозначения на письме; показать соотношение звукового и буквенного облика слова; закрепить навыки произношения.

Воспитательная: воспитывать  интерес  к  изучению  русского  языка и самостоятельную  активность  учащихся, навыки самоконтроля и взаимоконтроля.

Развивающая: развивать умение оценивать свою и чужую речь с точки зрения соблюдения орфоэпических норм современного русского языка.

Ход урока.

I. Актуализация опорных знаний по фонетике и орфоэпии.

Повторение теории.

Фонетика — раздел языкознания, изучает звуки речи, ударение, слоги.

Звуки (фонема) –самая малая единица языка, выполняют смыслоразличительную функцию: запирать — забирать

Буква – это графическое обозначение звука на письме.

В русском алфавите 33 букв: 10 гласных, 21 согласных, 2 знака.

Все звуки речи делятся на две группы гласные [а], [о], [э], [и], [ы], [у], согласные — 36 Гласные образуются только голосом, согласные — шумом, или голосом и шумом.

Буквы е, ё, ю, я обозначают звуки е-[й’э], ё-[й’о], ю-[й’у], я-[й’а]

— в начале слова: яма — [й’а]ма; юла — [й’у]ла;

— после разделительных ъ, ь: вьюга — в[й’у]га; съезд — с[й’э]зд;

— после гласных букв: армия — арми[й’а]; знаем — зна[й’э]м.

Гласные звуки бывают ударные и безударные.

Согласные звуки бывают твёрдые, мягкие, звонкие, глухие.

Пары согласных по звонкости и глухости: [б-п], [г-к], [в-ф], [д-т], [з-с], [ж-ш].

Непарные звонкие (сонорные) согласные: [р], [л], [м], [н], [й’].

Непарные глухие: [ц], [ч’], [х].

Мягкость согласного обозначается буквами ь, е, ё, и, ю, я после согласного.

Всегда твёрдые согласные: [ж], [ш], [ц].

Всегда мягкие: [ч’], [й’], [щ’].

Шипящие: [ж], [ш] [щ’] [ч’].

Ударение – это выделение слога в слове большей силой голоса.

Ударение в русском языке:

1) разноместное – в разных словах оно падает на разные слоги: мИлый, кольцО.

2) подвижное – в разных формах одного слова оно может стоять на разных слогах: слОво -словА.

Большинство слов русского языка имеет одно ударение – основное. Сложные слова имеет добавочное ударение, которое стоит на первом месте: элЕктромонтЁр.

Есть слова с вариативным (двояким) ударением: твОрог – творОг.

Служебные части речи: частицы, союзы, предлоги – не имеют ударения: под горой, принеси-ка.

Ударение в слове может различать: Разные слова: мука – мука, замок – замок.

Некоторые формы разных слов: ношу – ношу, кружки – кружки.

Формы одного слова: снега – снега, носите – носите.

Ударение бывает словесное и логическое: Мы сегодня идем в кинотеатр.

Слог – это один или несколько звуков, произносимые одним толчком выдыхаемого воздуха: во-да, на-у-ка.

В слове столько слогов, сколько гласных звуков.

Если слог состоит из 2 или более звуков, то начинается он обязательно с согласного.

Слоги бывают:

открытыми: ра-ку-шка

закрытыми: жук, бол-тун.

В середине слова слог, как правило, оканчивается на гласный звук, а согласный или группа согласных, стоящих после гласного, обычно отходит к последующему слогу: но-чник, по-ддать, ди-ктор.

Дополнительно. Правила слогораздела:

  1. Сочетание сонорного согласного с шумным между гласными имеет слогораздел внутри: стен-ка, тор-чит, мол-ва, тол-стый;

  2. Сочетание шумного согласного с сонорным между гласными переходит к следующему слогу: ве-сна, кра-сный;

  3. Сочетание шумных согласных переходит к следующему слогу: ча-шка, ло-жка, бле-стит, кре-пкий;

  4. Сочетание сонорных согласных между гласными переходит к следующему слогу: ко-рма, о-фо-рми-тель, но-рма-льно;

  5. Буква й всегда остается с предшествующим гласным: чай-ка, май-ка.

Фонетический разбор слова.

  1. Слушаем слово и определяем ударный звук.

  2. Делим на слоги.

  3. Выписываем каждый звук и даем ему характеристику.

  4. Количество букв и звуков.

О б р а з е ц:

1. приятель – приЯтель

2. при-я-тель

3. [п] — согласный, глухой парный, твёрдый парный

[р’] — согласный, звонкий непарный, мягкий парный.

[и] — гласный, безударный.

[й’] — согласный, звонкий непарный, мягкий непарный.

[а] — гласный, ударный.

[т’] — согласный, глухой парный, мягкий парный.

[е] — гласный, безударный.

[л’] — согласный, звонкий непарный, мягкий парный.

4. 8 букв – 8 звуков. Буква я обозначает два звука – [jа́]. Буква ь не обозначает звука.

Рядом с фонетикой соседствует орфоэпия. Орфоэпия следит за тем, чтобы правильно произносили звуки в словах.

Орфоэпия – это совокупность правил литературного произношения.

Орфоэпические нормы — правила произношения отдельных звуков, их сочетаний, отдельных слов и грамматических форм. Орфоэпическая норма – это:

  1. норма ударения,

  2. норма произношения.

К основным фонетическим процессам, происходящим в слове, относятся:

1. Редукция – ослабления произношения гласных звуков в безударной позиции: дом – д[а]ма.

2. Оглушение – звонкие согласные перед глухими и на конце слова произносятся как глухие: дуб[п].

3. Озвончение – глухие перед звонкими произносятся как звонкие: сделать-[з]делать.

4. Смягчение – процесс, при котором твердые согласные становятся мягкими под влиянием последующих мягких: казнь.

5. Выпадение (упрощение) – в сочетаниях согласных стн, здн, вст, дц, лнц и других происходит выпадение cогласных: солнце. праздник, солнце, прелестный

6. Стяжение – процесс, при котором сочетание нескольких разнородных согласных произносятся как один долгий звук:

Сочетания

1. сш и зш

2. сж и зж

3. зж и жж

4. сч и зч

5. тч и дч

6. тц и дц

7. ться

Произносятся как

[ш]

[ж]

[ж’] или [ж]

[щ’]

[ч’]

[ц]

[ца]

Примеры

низший- ни[ш]ий, высший- вы[ш]ий

разжать -ра[ж]ать, сжарить -[ж]арить

позже- по[ж’]е и по[ж]е

дрожжи дро[ж’]и и дро[ж]и

счастье-[щ]астье, приказчик- прика[щ]ик

докладчик -докла[ч’]ик, летчик- ле[ч’]ик

двадцать- два[ц]ать, золотце- золо[ц]е

учиться— учи[ца], смеяться-смея[ца]

Запомните:

— Во многих иностранных словах после согласных пишется е, а произносятся согласные твёрдо:  кафе [фэ],  стенд [тэ], тест, пюре.

— На месте сочетания чн произносить [шн]: коне[шн]о, наро[шн]о, ску[шн]о.

— Вместо сочетания чт произносить [шт]: [шт]о, кое-[шт]о, [шт]обы, но нечто [чт].

Закрепление темы.

  1. Решение фонетических задач.

  1. Сделать фонетический разбор слов: счастье, дождь, чувство, сберечь.

  1. Образуйте новые слова, прочитав в обратном порядке звуки данных слов, сделаем предварительный фонетический разбор, затем произнесем звуки в обратном порядке: лед, торг, лес, лещ, куль. Получатся слова: толь, крот, сель, щель, люк.

  1. Сколько звуков «с» и сколько «з» в предложении: Позже раздался резкий звук, словно сделанный железкой по стеклу.

(в предложении 4 звука [c] в словах резкий, словно, железкой, по стеклу и 3 звука [з] в словах раздался, звук, сделанный. В слове позже нет этих звуков: [ж] уподобляет себе предыдущий звук и произносится как удвоенный [ж]).

  1. Объяснительный словарный диктант: Охарактеризуйте фонетические процессы, происходящие в словах, приведите свои примеры:

кружка, молотьба, зуб, обижаться, местный, песня.

Первичная проверка знаний. Тестовая работа.

Вариант 1

1. В каком слове звуков меньше, чем букв?

1) просвещение 2) обидеть 3) рейтинг 4) семена

2. В каком слове все согласные звуки звонкие?

1) праведник 2) бежевый 3) освятить 4) недуг

3. В каком слове все согласные звуки твёрдые?

1) наёмник 2) ориентир 3) приозерье 4) талант

4. В каком слове все согласные звуки глухие?

1) плавать 2) житейский 3) втекать 4) песня

5. В каком слове все согласные звуки мягкие?

1)семиклассник 2) резерв 3) принести 4) месить

6. В каком слове звуков больше, чем букв?

1) грамм 2) алюминий 3) ель 4) юла

Вариант 2
1. В каком слове звуков меньше, чем букв?

1) резкий 2) семья 3) праздник 4) ёжик

2. В каком слове все согласные звуки звонкие?

1) каприз 2) ориентир 3)лицензия 4)голуби

З.В каком слове все согласные звуки твёрдые?

1) государство 2) рассвет 3) лучший 4) партия

4. В каком слове все согласные звуки глухие?

1) провода 2) отсыпать 3) корова 4) паства

5. В каком слове все согласные звуки мягкие?

1) анемия 2) сеньор 3) репетитор 4) певунья

6. В каком слове звуков больше, чем букв?

1) яблоко 2) юность 3) гарант 4) великий

Вариант 3

1. В каком слове звуков меньше, чем букв?

1) ирландский 2) ясень 3) малярия 4)яхта

2. В каком слове все согласные звуки звонкие?

1) фракция 2)галерея 3)воздать 4)каталог

3. В каком слове все согласные звуки твёрдые?

1) индекс 2) жалеет 3) отцвести 4) весна

4. В каком слове все согласные звуки глухие?

1) темперамент 2) длительный 3) скаут 4) столяр

5. В каком слове все согласные звуки мягкие?

1) реакция 2)сорить 3) сельдерей 4)береста

6. В каком слове звуков больше, чем букв?

1) съехал 2) армия 3) клеймо 4) кедр

Вариант 4

1. В каком слове звуков меньше, чем букв?

1) стена 2) дельта 3) осветление 4) кровля

2. В каком слове все согласные звуки звонкие?

1)волк 2) флаг 3) дельфин 4) жёлуди

3. В каком слове все согласные звуки твёрдые?

1)должен 2) вырасти 3) верблюд 4) сосенка

4. В каком слове все согласные звуки глухие?

1)физкультура 2) истец 3) юмореска 4) эпический

5. В каком слове все согласные звуки мягкие?

1) эпидемия 2) резюме 3) сердце 4) гарантия

6. В каком слове звуков больше, чем букв?

1)колесо 2)аллея 3)здание 4) медицина

Вариант 5

1. В каком слове произносится звук [т].

а) медь б) отдых в) посадка г) надеяться

2. В каком слове количество букв и звуков совпадает?

а) смеюсь б) рыдать в) приют г) съесть

3. В каком слове букв больше, чем звуков?

а) подстричь б) нежное в) каюта г) еловый

4. В каком слове звуков больше, чем букв?

а) размечтаться б) алюминиевый в) раскрепоститься г) проглоченная

5. В каком слове все согласные глухие?

а) всходы б) колесо в) поход г) редкий

6. В каком слове все согласные звонкие?

а) разгневанный б) лошадь в) мягкость г) снег.

Вариант 6

1. В каком слове все согласные глухие?

а) всходы б) колесо в) поход г) редкий

2. В каком слове все согласные звонкие?

а) разгневанный б) лошадь в) мягкость г) снег.

3. В каком слове произносится звук [п’]?

а) используется б) голубь в) продавец г) попадья

4. В каком слове произносится звук [с]?

а) мороз б) сдоба в) сбить г) ошибиться

5. В каком слове произносится звук [ф]?

а) эффект б) завтрак в) бенефис г) дефект

6. В каком слове одинаковое количество букв и звуков?

а) свекров б) рассердиться в) вьюжная г) въедливый.

Домашнее задание

Подготовиться к связному ответу по теме урока.

Вариант 1

  1. Сделайте транскрипцию следующих слов и разделите их на слоги, расставьте ударения:

коробка, бесконечный, борется, водица, водиться, терраса, сладкозвучная.

  1. Сделайте фонетический разбор слов: дуб, ясный, маяк, группа, ненастная, колонна, садовод, льёт, окрестность.

Вариант 2

  1. Охарактеризуйте фонетические процессы, происходящие в словах, приведите свои примеры:

мужчина, жизнь, радостно, сбежать, дорожка,

  1. Сделайте транскрипцию следующих слов и разделите их на слоги, расставьте ударения:

отстаивать, выдвигаться, обоняние, приятный, подушка, убегать, аккордеон.

Тема. Фонетические средства языка. Орфоэпические нормы

Фонетика— раздел языкознания, который изучает звуки речи, ударение, слоги.

Звуки выполняют смыслоразличительную функцию: быть — бить

Буква — графическое обозначение звука на письме.

В русском алфавите 33 буквы: 10 гласных, 21 согласная, 2 знака.

Все звуки речи делятся на гласные и согласные.

Гласные образуются только голосом, согласные — шумом, либо голосом и шумом.

Буквы е, ё, ю, я обозначают звуки е-[й’э], ё-[й’о], ю-[й’у], я-[й’а]

— в начале слова: яма — [й’а]ма; юла — [й’у]ла;

— после разделительных ъ, ь: вьюга — в[й’у]га; съезд — с[й’э]зд;

— после гласных букв: армия — арми[й’а]; знаем — зна[й’э]м.

Гласные звуки бывают ударные и безударные.

Согласные звуки бывают твёрдые, мягкие, звонкие, глухие.

Пары согласных по звонкости и глухости: [б-п], [г-к], [в-ф], [д-т], [з-с], [ж-ш].

Непарные звонкие (сонорные) согласные: [р], [л], [м], [н], [й’].

Непарные глухие: [ц], [ч’], [х].

Мягкость согласного обозначается буквами ь, е, ё, и, ю, я после согласного.

Всегда твёрдые согласные: [ж], [ш], [ц].

Всегда мягкие: [ч’], [й’], [щ’].

Шипящие: [ж], [ш] [щ’] [ч’].

_________________________________________________________________________________

Ударение – это выделение слога в слове большей силой голоса.

Ударение в русском языке называется:

1) разноместным – в разных словах оно падает на разные слоги: мИлый, кольцО.

2) подвижным – в разных формах одного слова оно может стоять на разных слогах: слОво -словА.

Сложные, сложносокращенные слова помимо основного ударения имеют добавочное, которое стоит на первом месте: свЕрхдержАва, интЕрклУб.Есть слова с вариативным (двояким) ударением: твОрог – творОг. Слова могут быть безударными (служебные части речи): под нЕбом.

Ударение бывает словесное и логическое: Мы сегодня идем в кинотеатр. ________________________________________________________________________________

Слог – это часть слова, произносимая одним толчком выдыхаемого воздуха.

В слове столько слогов, сколько гласных. Слоги бывают: открытыми: но-чка, ра-ку-шка. и закрытыми: жук, бол-тун.

Орфоэпия – это совокупность правил литературного произношения.

Орфоэпические нормы — правила произношения отдельных звуков, их сочетаний, отдельных слов и грамматических форм. Орфоэпическая норма – это норма ударения и норма произношения.

Основные фонетические процессы, происходящие в слове:

1. Редукция – ослабление произношения гласных звуков в безударной позиции: дом – д[а]ма.

2. Оглушение – звон. согл. перед глухими и на конце слова произносятся как глухие: дуб[п].

3. Озвончение – глухие перед звонкими произносятся как звонкие: сделать-[з]делать.

4. Смягчение – процесс, при котором тв. согл. становятся мягкими под влиянием последующих мягких: казнь, смирно.

5. Выпадение – в сочетаниях согласных стн, здн, вст, дц, лнц и других происходит выпадение согласных: праздник, солнце, прелестный.

6. Стяжение (уподобление) – процесс, при котором сочетание нескольких разнородных согласных произносятся как один долгий звук: низший- ни[ш]ий, разжать -ра[ж]ать.

Тема. Фонетические средства языка.

2. В каком слове неверно выделена буква,

3. В каком слове неверно выделена буква,

4. В каком слове неверно выделена буква,

5. В каком слове верно выделена буква,

6. В каком слове верно выделена буква,

7. В каком слове неверно выделена буква,

8. В каком слове неверно выделена буква,

9. В каком слове верно выделена буква,

10. В каком слове неверно выделена буква,

2. В каком слове неверно выделена буква,

3. В каком слове неверно выделена буква,

4. В каком слове неверно выделена буква,

5. В каком слове верно выделена буква,

6. В каком слове верно выделена буква,

7. В каком слове неверно выделена буква,

8. В каком слове неверно выделена буква,

9. В каком слове верно выделена буква,

10. В каком слове неверно выделена буква,

Ключ к тесту: 1) г; 2) г; 3) б; 4) а; 5) в; 6) а; 7) б; 8) а; 9) в; 10) б.

Вариант 6 1) в; 2) а; 3) б; 4) а; 5) б; 6) г.

“Совсем” фонетический разбор | Грамота

Фонетическим анализом слова “совсем” называют характеристику звуковых и буквенных составляющих.

Помимо этого, он включает в себя транскрипцию анализируемого слова, определение правильного местоположения ударного слога, сравнение буквенного и звукового анализа, дробление на слоги, возможные варианты переноса слова через строку.

Что нужно делать, чтобы не допускать ошибок? Просто следует придерживаться плана, которые прослеживает логическую связь между пунктами разбора. В качестве примера проделаем фонетический разбор языковой единицы “совсем”.

Фонетический разбор

  1. Начнём с самой трудной задачи в этом этапе разбора слова “совсем” определим звуковой и буквенный состав по количеству: 6 букв (2 гласных и 4 согласных), 6 звуков.
  2. Далее проанализируем место ударения: совсЕм. Ударность акцентирует второй слог.
  3. Всего в слове “совсем” два слога по количеству слогообразующих гласных. Произведём дробление на слоги: сов/сем.
  4. Способы переноса через строку соответствуют слоговому делению.

Транскрипция слова

Можно сказать, это самый сложный этап всего разбора, потому что имеет больше всего нюансов, на которые в дальнейшем делает упор звуко-буквенный анализ.

Повторим анализируемое слово несколько раз вслух, после запишем все звуки в квадратных скобках: [сафс’эм].

Звуко-буквенный разбор

  • с — [с] — принято считать согласным, здесь представлен в глухой твёрдой форме
  • о — [а] — имеет признаки гласного, ударность не делает акцент
  • в — [ф] — принято считать согласным, здесь представлен в глухой твёрдой форме
  • с — [с’] — принято определять как согласный, здесь представлен в глухой мягкой форме
  • е — [э] — имеет признаки гласного, ударность делает акцент
  • м — [м] — принято считать согласным, здесь представлен в звонкой твёрдой форме

Проверь себя: “Выход” фонетический разбор слова

Если на букве “о” не присутствует ударение, то она обозначает звук [а].

Звук [с] смягчается последующим гласным “е”, который, имея ударность, представляется звуком [э].

Буква “в” оглушается до звука [ф], так как стоит перед буквой “с”.

Фонетический разбор имен и фамилий: %d0%a5%d0%b5%d0%bb%d0%b5%d0%bd%d0%b5/


Фонетический разбор имени или фамилии %d0%a5%d0%b5%d0%bb%d0%b5%d0%bd%d0%b5/

Имя или фамилия %d0%a5%d0%b5%d0%bb%d0%b5%d0%bd%d0%b5/ состоит из 37 букв и 1 слога: %d0%a5%d0%b5%d0%bb%d0%b5%d0%bd%d0%b5/.

% — без звука буква
D — без звука буква
0 — без звука буква
% — без звука буква
A — без звука буква
5 — без звука буква
% — без звука буква
D — без звука буква
0 — без звука буква
% — без звука буква
B — без звука буква
5 — без звука буква
% — без звука буква
D — без звука буква
0 — без звука буква
% — без звука буква
B — без звука буква
B — без звука буква
% — без звука буква
D — без звука буква
0 — без звука буква
% — без звука буква
B — без звука буква
5 — без звука буква
% — без звука буква
D — без звука буква
0 — без звука буква
% — без звука буква
B — без звука буква
D — без звука буква
% — без звука буква
D — без звука буква
0 — без звука буква
% — без звука буква
B — без звука буква
5 — без звука буква
/ — без звука буква

Прокомментируйте или поделитесь с друзьями:

Фонетический разбор слова — буквенно-звуковой анализ, то есть определение количества букв, звуков, слогов, выделение гласных и согласных звуков и т.п. В данном случае предлагаем фонетический анализ любого имени или фамилии. Хотя с тем же успехом Вы можете провести буквенно-звуковой анализ любого слова, а не только имени или фамилии.

Правила для фонетического разбора слов

Гласные буквы: А, Е, Ё, И, О, У, Ы, Э, Ю, Я.
Гласные буквы А, О, У, Ы, Э — обозначают твёрдость предыдущих согласных звуков, Е, Ё, И, Ю, Я — обозначают мягкость предыдущих согласных звуков.
В русском языке всего 6 гласных звуков: [а], [о], [у], [и], [ы], [э].
Гласный звук может быть ударным (на который падает ударение) и безударным.
Гласные буквы Е, Ё, Ю, Я обозначают 2 звука (согласный звук [й’] + гласный звук) в следующих случаях: в начале слова, после разделительных мягкого и твёрдого знаков Ь и Ъ, а также после гласной.

Согласные буквы: Б, В, Г, Д, Ж, З, Й, К, Л, М, Н, П, Р, С, Т, Ф, Х, Ц, Ч, Ш, Щ.
Согласные звуки делятся на звонкие и глухие.
Звонкие: [б], [в], [г], [д], [ж], [з], [й], [л], [м], [н], [р].
Глухие: [к], [п], [с], [т], [ф], [х], [ц], [ч], [ш], [щ].
Большинство согласных звуков образуют пары по твёрдости-мягкости: [б] — [б’], [в] — [в’], [г] — [г’], [д] — [д’], [з] — [з’], [к] — [к’], [л] — [л’], [м] — [м’], [н] — [н’], [п] — [п’], [р] — [р’], [с] — [с’], [т] — [т’], [ф] — [ф’], [х] — [х’].
Не образуют пар по твёрдости-мягкости: твёрдые [ж], [ш], [ц] и мягкие [ч’], [щ’], [й’].
Непарные звонкие звуки [й’], [л], [л’], [м], [м’] [н], [н’] [р], [р’] называют сонорными.
Некоторые согласные звуки образуют пары по звонкости-глухости: [б]—[п], [в]—[ф], [г]—[к], [д]—[т], [з]—[с], [ж]—[ш].

Слова делятся на слоги (один звук или несколько звуков, произносимых одним выдыхательным толчком воздуха). Гласные звуки образуют слоги, поэтому в слове столько слогов, сколько в нём гласных звуков.

Комментарии

Не отображается форма? Обновить комментарии.

Как сделать фонетический разбор слова?

Задания на фонетический разбор слова встречаются очень часто, включаются они и в билеты ЕГЭ по русскому языку.

Что нужно для того, чтобы правильно делать фонетический разбор?

Развивать фонетический слух (способность различать звуки речи, разграничивать их, выделять фонемы).

Знать, какие звуки присутствуют в русском языке, уметь обозначать их специальными символами.

Уметь анализировать фонетическую структуру слова, проговаривая его вслух.

В русском языке слова пишутся не так, как говорятся – с этим фактом дети сталкиваются, когда учатся писать и читать. Позже они начинают изучать фонетику и учатся делать фонетический разбор. В учебных текстах слова, которые нужно проанализировать с фонетической точки зрения, помечаются цифрой 1.

Цель фонетического разбора – выделить слоги, определить звуковой состав слова, выполнить элементы графического анализа. Делая фонетический разбор, нужно обязательно произнести слово вслух, вслушаться в каждый звук. Когда вы продвинетесь в данном виде анализа, то сможете произносить слово про себя, приобретете автоматический навык.

Буквенное написание слова, к которому мы привыкли с момента изучения азбуки, оказывает на нас серьезное влияние. Важно научиться абстрагироваться от него, вслушиваться в звучание. Многие школьники именно по этой причине испытывают серьезные затруднения с выполнением фонетического анализа. Чтобы преодолеть эту проблему, нужно постоянно тренироваться, делать разборы слов регулярно.

План фонетического анализа:

1. Выписать слово.

2. Произнести слово вслух несколько раз.

3. Разбить слово на слоги, поставить ударение.

4. Записать слово в транскрипции, то есть так, как оно звучит. Записав транскрипцию, вы, может быть, удивитесь необычному виду знакомого слова (помним, что буквы и звуки – не одно и то же, орфография и фонетика – разные дисциплины.). Нельзя вносить изменения в транскрипцию только из-за того, что слово стало «странным».

5. Выписать буквы в столбик и напротив каждой указать звук, который она обозначает. Охарактеризовать каждый звук с фонетической точки зрения. Гласные – ударные, безударные. Согласные – твердые-мягкие (парные, непарные), звонкие – глухие (парные, непарные).

6. Подсчитать количество букв и звуков.

Делая фонетический разбор, нужно помнить некоторые важные закономерности русской фонетики, например:

– буквы я, ё, е, ю обозначают два звука (й-а, й-э, й-о, й-у), если находятся в начале слова, после гласной, ь и ъ;

– мягкость согласных обозначают последующие буквы и, е, я, ё, ю, ь. Но также присутствует смягчение последующей мягкой согласной, как в слове впереди [ф` п` и р` и д` и];

– согласные имеют сложную характеристику, существуют парные и непарные согласные по мягкости-твердости и глухости-звонкости. Есть только мягкие (ч, щ, й) и только твердые согласные (ш, ж, ц) – эти звуки непарные по мягоксти-твердости. Только глухие (х, ц, ш, щ) и только звонкие (й, л, р, н, м) – непарные по глухости-звонкости;

– ь и ъ обозначают «ноль звука»;

– в некоторых позициях согласные оглушаются или озвончаются. Как в словах – пруд [п р у т], сбежать [з б` и ж а т`];

– безударные гласные звучат не так, как ударные. Вместо о слышится а, вместо е – и, вместо я – и;

– в некоторых словах может слышаться звук й, который на письме отсутствует. Как в слове соловьиный – [с а л а в` й и н ы й]

– количество букв и звуков может не совпадать.

Пример фонетического разбора.

Разберем слово отбелить.

От-бѐ-лить – 3 слога

[адб`ил`ит`]
о – [а] гласный, безударный

т – [д] согласный, твердый (парный), звонкий (парный)

б – [б`] согласный, мягкий (парный), звонкий (парный)

е – [и] гласный, безударный

л – [л`] согласный, мягкий (парный), звонкий (непарный)

и – [и] гласный, ударный

т – [т`] согласный, мягкий (парный), глухой (парный)

ь – [-]

8 букв, 7 звуков

Сделав фонетический разбор, произнесите слово еще раз, повторите его. Это поможет выявить и исправить возможные ошибки.

случаев префиксов в польском языке.

7

Это особенно верно в случае производных, которые не являются морфологически прозрачными5.

Следующее определение прозрачности предложено в Bauer (1988):

(12) Прозрачность — это степень, в которой существует четкое соответствие между смыслом и формой. До

степень, в которой связь между ними скрыта, конструкция называется непрозрачной

. (Bauer 1988: 189)

Морфологически сложные слова могут демонстрировать семантическую и / или фонологическую прозрачность.

Семантически прозрачные сложные слова являются семантически композиционными, т.е. их значение

может быть определено композиционно из значения составляющих6. Производное

yellowish является семантически композиционным, так как его значение происходит от комбинации значения

желтого основного и ослабляющего значения суффикса. Отклонение от семантической композиционности

приводит к семантической лексикализации (ср. Bauer 1988, Spencer 1991),

, что может быть показано для английских слов «шкаф», «шантаж» или «трансляция».

Как было замечено Дресслером (1985), фонологическая прозрачность сложного слова

уменьшается из-за вокальной и / или согласной алломорфии, например электричество (ср.

электрическое), здравомыслие (ср. вменяемый).

Морфологическая и фонологическая прозрачность — это градиентные явления (см. Дресслер 1985,

Спенсер 1991, Байби 1985, Бауэр 1988).

Слова, получившие наименьшие баллы за слоговость (Префикс) (Основа) — во время эксперимента

, описанного в разделе 2, — обычно демонстрируют низкую морфологическую прозрачность

.Это может быть связано либо с отсутствием семантической композиционности, как в (13),

, либо с их фонологической непрозрачностью, например наличие корневой алломорфии в (14). В эту группу

входят также стимулы, проявляющие префиксную алломорфность, поскольку они содержат двусложные

алломорфа префиксов (см. 15). Мимолетные гласные (yers), которые могут появляться как –e- или –i — / — y-,

постулировались в корнях и / или в префиксах в (14) и (15) (ср. Rowicka 1999). .

(13) а. ulżyć ‘приносить облегчение’ (приставка u- и lżyć ‘проклинать’)

b. przyjmować ‘принимать’ (префикс przy- и imać (się) ‘принимать к sth’)

c. odemknąć ‘открывать’ (префикс od- и mknąć ‘скорость’)

d. wyłgać się ‘избежать наказания (например, ложью)’ (префикс wy и łgać ‘лгать’)

(14) a. przyjmować ‘принять, impf.’ (связанный корень –jm-, ср. корневые алломорфы в jąć

‘начинать’ и imać się ‘принимать в sth’)

b.przełknąć ‘проглотить, pf’ (связанный корень -łk-, ср. łykać ‘проглотить, impf.)

(15) a. ode + rwać ‘отрывать’ (приставка allomorphy od- / ode-)

б. ode + mknąć ‘открывать’ (приставка allomorphy od- / ode-)

Настоящее исследование подтверждает наблюдение Рубаха и Буйя (1990) о том, что видимость внутренней морфологической структуры

более важна, чем ограничение на отсутствие

. слоги на польском языке. Когда информанты используют слоговые производные, которые содержат префикс

в конце согласного и основу для начала гласного, e.г. pod + upadać ‘впадать в распад’, они обозначают его как

pod.u.pa.dać, а не po.du.pa.dać.

5 Rubach и Booij (1990) и Szpyra-Kozłowska (1998a) предполагают, что фонологические ограничения

могут быть нарушены только тогда, когда говорящие произносят слоги в словах, которые демонстрируют высокую морфологическую прозрачность и которые

содержат продуктивные аффиксы.

6 Есть некоторые разногласия относительно понимания термина «семантическая прозрачность». Для экземпляра

, согласно Ronneberger-Sibold (2001), производные и соединения прозрачны, когда некоторые прогнозы

относительно их значения могут быть сделаны на основе их внутренней структуры, даже если есть непредсказуемый остаток

.Следовательно, она считает прозрачным английское сложное существительное blueberry.

Экспериментальные и теоретические достижения в просодии: обзор

Устранение двусмысленностей

В литературе есть много работ, демонстрирующих, что слушатели могут воспользоваться преимуществом тесного сопоставления синтаксиса и просодических границ для разрешения неоднозначности в языковой обработке. Есть отличный обзор Cutler et al. (1997), в котором исследуется использование слушателями просодии в синтаксическом синтаксическом анализе до того времени.

Одним из главных вопросов 1990-х годов было понимание того, можно ли использовать интонационные границы для разрешения синтаксических двусмысленностей в онлайн-обработке. Этот вопрос был задан в контексте более широкой дискуссии о модульности обработки предложений: синтаксическая информация — единственный источник информации, используемый на начальных этапах обработки (например, Frazier & Clifton, 1996), или информация из других областей, используемая в этих также на ранних стадиях (например, Tanenhaus et al., 1995)? Исследования показывают, что несинтаксическая информация используется очень быстро при обработке, хотя исследователи расходятся во мнениях относительно того, возникают ли эффекты сразу же или после повторного анализа или повторной обработки.Исследования последних двадцати лет убедительно показывают, что просодия является одним из многих факторов, которые быстро интегрируются в языковую репрезентацию (Marslen-Wilson et al., 1992; Grabe, Warren, & Nolan, 1994; Kjelgaard & Speer, 1999; Watson & Gibson, 2005; Snedeker & Trueswell, 2003 и это лишь некоторые из них).

Учитывая, что границы явно играют роль в обработке предложений, исследователи сосредоточили свое внимание на двух вопросах: 1) какую информацию предоставляют интонационные границы и 2) последовательно ли говорящие создают границы для слушателя? Мы обсудим второй вопрос в следующем разделе и исследуем первый вопрос здесь.

Литература недвусмысленно демонстрирует, что границы могут устранять неоднозначность определенных типов синтаксических структур. Интересно, что некоторые типы неоднозначности устраняются гораздо легче, чем другие. Например, просодия, по-видимому, играет более сильную роль в устранении неоднозначности предложений, в которых разница между интерпретациями заключается в том, как эти два значения сгруппированы. Рассмотрим примеры из (4) ниже.

Работа Спеера и его коллег (Kjelgaard & Speer, 1999; Speer, Kjelgaard & Dobroth, 1996) и других (Warren et al., 1995) предполагает, что границы могут помочь разрешить локальные неоднозначности в предложениях типа (4). Хотя слушатели обычно интерпретируют существительное, следующее за глаголом в придаточном предложении, как прямой объект (вместо подлежащего в главном предложении), размещение границы между существительным и глаголом таким образом, чтобы существительное было сгруппировано с основным предложением, уменьшает это предубеждение. .

  • (5a)

    Пэт // или Джей и Ли убедили президента банка продлить ипотеку. (из Clifton, Frazier, & Carlson, 2006)

  • (5b)

    Пэт или Джей // и Ли убедили президента банка продлить ипотеку.

Аналогичным образом, союзы, подобные тем, что в (5), были устранены просодической формулировкой (Lehiste, 1973; Streeter, 1978; Wagner, 2005; Clifton, Frazier, & Carlson, 2006). Ранняя граница в (5) объединяет Джея и Ли вместе, а более поздняя граница объединяет Пэт и Джея.

  • (6a)

    Мэри утверждала, // что генеральный директор солгал, когда началось расследование. (Карлсон и др., 2001)

  • (6b)

    Мэри утверждала, что генеральный директор солгал // когда началось расследование.

Наконец, границы могут играть роль в сигнализации наличия зависимостей на больших расстояниях (Snedeker & Trueswell, 2003; Kraljic & Brennan, 2005; Schafer et al., 2005). Граница в (6a) смещает слушателей в сторону присоединения наречной фразы к местному глаголу «lied», тогда как граница в (6b) создает тенденцию к привязке к матричному глаголу «supported».

Границы также могут облегчить обработку однозначных структур, подобных приведенной в (7).Слушатели оценили предложения с границей между «ромбиком» и «для клиента» как более понятные, чем предложения без этой границы (Watson & Gibson, 2005). Они также обнаружили, что граница между главой и местным иждивенцем в недвусмысленном предложении нарушает обработку.

Когда интонационные границы не помогают? Различные исследователи сделали одно и то же общее утверждение: границы могут разрешить неоднозначности, при которых поверхностные скобки в предложении различаются в разных интерпретациях, но не могут разрешить неоднозначности, в которых они не совпадают (Lieberman, 1967; Lehiste, 1973; Shattuck-Hufnagel & Turk, 1996 ).Например, (8) ниже глобально неоднозначно. «Летающий» можно интерпретировать как герундий или прилагательное. Либерман (1967) указывает, что просодическая формулировка этого предложения не может устранить неоднозначность.

Либерман приписывает это наблюдение схожей структуре поверхности, но различной глубокой структуре двух интерпретаций, утверждая, что границы могут играть роль в устранении неоднозначности только тогда, когда структура поверхности отличается. Основные синтаксические разрывы в предложении в разных интерпретациях находятся в одном и том же месте, даже если значения предложений различаются.Это обобщение также объясняет, почему предложения, подобные (9), дали противоречивые результаты в литературе.

Структуры в (9) содержат локальную двусмысленность в словосочетании «мальчик». Его можно интерпретировать либо как подлежащее сентенциального дополнения (9b), либо как прямой объект глагола (9a), и слушатели отдают предпочтение последней интерпретации. Большое количество исследователей исследовали, может ли просодия повлиять на разрешение этой неоднозначности, но результаты из литературы неоднозначны.Некоторые исследования показали, что говорящие с большей вероятностью создают границу (или, по крайней мере, акустические корреляты границ) после глагола в продолжении сентенциального дополнения (Warren, 1985; Nagel et al., 1996). Недавняя работа Андерсона и Карлсона (2004) предполагает, что говорящие воспроизводят реплики в этой структуре менее последовательно, чем при неоднозначности раннего / более позднего закрытия, как в (4). Beach (1991) и Marslen-Wilson et al. (1992) обнаружили, что слушатели интерпретируют границу после глагола как указывающую на продолжение SC.Однако Стирлинг и Уэльс (1996) и Ватт и Мюррей (1996) не обнаружили такой разницы. Чтобы усложнить картину, Гал и Гарнси (2004) обнаружили, что удлинение глагола зависит от смещения глагола. Некоторые глаголы, такие как «верить», чаще встречаются с дополнительными предложениями, чем с прямыми объектами. И наоборот, такие глаголы, как «подтвержденный», чаще встречаются с прямыми объектами, чем с предложениями-дополнениями. Гал и Гарнси (2004) обнаружили, что глаголы удлиняются и предшествуют более длительной паузе, когда они встречаются с неприемлемой интерпретацией глагола.

Если просодическое разрешение неоднозначности структуры в (10) происходит реже, чем другие структуры, одной из возможных причин является отсутствие различий в структуре поверхности двух интерпретаций. И сентенциальное дополнение, и прямое продолжение объекта имеют одинаковые отношения с глаголом. Как и двусмысленность в (8), разница между интерпретациями заключается в их синтаксических категориях, а не в их синтаксических отношениях. Точно так же классические предложения, такие как (10), которые являются локально неоднозначными и содержат глагол («гонка»), который может интерпретироваться либо как главный глагол предложения, либо как глагол в сокращенном относительном придаточном предложении, не могут быть устранены просодически (Fodor, 2002).

  • (10a) Лошадь проехала мимо сарая и упала
  • (10b) Лошадь промчалась мимо сарая и упала

Опять же, хотя обозначения структуры поверхности различаются между этими интерпретациями, синтаксические отношения между составляющими не отличаются.

Существует два типа объяснения того, почему границы могут устранять неоднозначность только в неоднозначных предложениях, интерпретация которых различается по структуре поверхности. Во-первых, связь между синтаксической структурой и просодическими перерывами формализована в грамматике как просодическая структура (напр.г. Селкирк, 2000; Truckenbrodt, 1999), а просодическая структура дает подсказки к синтаксической структуре через знание грамматики. Во-вторых, просодические границы служат средством, с помощью которого слушатель организует входящий лингвистический сигнал для языковой обработки. Последний обсуждается ниже, и, конечно, эти две возможности не исключают друг друга.

Психологи предложили два типа учетных записей обработки, но обе версии предполагают, что центральная роль границ в обработке заключается в предоставлении информации о том, как организован лингвистический сигнал.Один класс теорий утверждает, что границы группируют слова в единицы обработки (Schafer, 1997; Frazier & Clifton, 1998), в то время как другой утверждает, что границы отмечают точки дизъюнкции в предложении (Watson & Gibson, 2005; Pynte & Prieur, 1996; Маркус и Хиндл, 1990). На первый взгляд может показаться, что эти теории делают аналогичные предсказания, однако, если мы рассмотрим предложения, подобные (6) выше, различия станут более ясными.

Теории, основанные на группировке, утверждают, что слова, которые встречаются в одной интонационной фразе, обрабатываются вместе на одном этапе обработки (например,г. Шафер, 1997). Влияние границ на разрешение неоднозначности определяется тем, появляются ли неоднозначно присоединенные составляющие в той же просодической фразе, что и место присоединения. Таким образом, в (6) граница после матричного глагола «поддерживается» приводит к тому, что глагол во вложенном предложении «лгал» и наречивая фраза «когда началось расследование» обрабатываются вместе в одном и том же блоке обработки. Эта временная близость в системе обработки создает предпочтение низкой привязанности. Когда граница появляется после встроенного глагола «lied», наречная фраза не обрабатывается в той же единице, что и любой глагол.Согласно группировочным теориям, вторая граница не должна влиять на предпочтения привязанности. Однако это противоречит имеющимся в литературе выводам о том, что граница перед двусмысленно присоединенной составляющей смещает слушателей в сторону высокой привязанности (например, Snedeker & Trueswell, 2003; Schafer et al., 2005; Carlson et al., 2001)

Теории, основанные на дизъюнктура, как и гипотеза антипривязанности Уотсона и Гибсона (2004a, 2005), утверждает, что границы в первую очередь служат сигналом нелокальной привязанности.Граница после слова «поддерживается» в (6) сигнализирует о том, что глагол вряд ли получит в будущем прикрепление, таким образом облегчая низкую привязанность к встроенному глаголу. Граница после встроенного глагола «lied» указывает на то, что наречная фраза не прикрепляется локально. Один из недостатков этой теории заключается в объяснении низкой привязанности. Граница после слова «поддерживается» сигнализирует о том, что основной глагол вряд ли получит дальнейшее вложение, но на самом деле он локально присоединяется к вложенному предложению, хотя в нисходящем потоке не получает вложения.Это предсказывает, что эта граница должна увеличить сложность предложения, потому что она предоставляет неверную информацию о нелокальной привязанности, но при этом помогает разрешить двусмысленность. Так ли это на самом деле, неясно.

Ни одна из теорий не дает адекватного объяснения данных, и вполне вероятно, что гибрид этих двух подходов даст более полное объяснение. То есть наличие границы действует как сигнал о том, что два элемента не связаны, в то время как отсутствие границы может сигнализировать о том, что два элемента сгруппированы вместе.Слушатели вполне могут использовать оба типа информации в синтаксической структуре синтаксического анализа.

Другой вопрос — понять, предоставляют ли границы информацию о локальном синтаксическом контексте, в котором они появляются, или они могут предоставить информацию о других местах в предложении. Карлсон и его коллеги (2001) утверждали, что слушатели используют глобальную просодическую структуру при обработке синтаксической информации. Они обнаружили, что в предложениях типа (6) ранняя граница после глагола «поддерживает» снижает предпочтение высокой привязанности, обусловленное границей после встроенного глагола «лгал».Точно так же граница после слова «солгал» уменьшала влияние ранней границы на низкую привязанность. Кроме того, величина границы (т.е. была ли граница промежуточной или полной интонационной фразой) модулировала эффект. Снедекер и Кассерли (этот том) также обнаруживают влияние глобальной просодической структуры на разрешение неоднозначности, хотя они обнаруживают влияние как глобальной просодической структуры, так и абсолютного размера границ на привязанность.

Frazier et al. (2006) утверждают, что это свидетельство против подходов, которые утверждают, что границы предоставляют информацию о локальном синтаксическом контексте (например,г. Watson & Gibson, 2004a, 2005). Однако эта аргументация объединяет два определения местоположения. С одной стороны, локальность может описывать, предоставляет ли граница информацию о своем локальном синтаксическом контексте. В другом смысле, локальность может описывать, интерпретирует ли слушатель границу только в том месте, где она встречается. Это два независимых эмпирических вопроса. Уотсон и Гибсон (2004a, 2005) утверждают, что границы предоставляют локальную информацию в первом смысле, тогда как Frazier et al.(2006) доказывают, что во втором случае границы не являются локальными. Например, свидетельства Карлсона и др. (2001) согласуются с тем, что ранняя и поздняя граница дает локальную информацию об их синтаксическом контексте, а слушатель интегрируется через эти границы в предложении, делая предпочтение привязанности.

Дизайн аудитории

Недавние работы по пониманию интонационных границ и синтаксическому анализу сосредоточились на роли границ в интерфейсе понимания языка и языкового производства.Традиционно психолингвисты использовали разрешение неоднозначности как инструмент для понимания механизмов, лежащих в основе системы понимания языка. Естественный вопрос, вытекающий из этой исследовательской традиции, заключается в том, чтобы понять, постоянно ли говорящие предоставляют слушателям просодию, устраняющую неоднозначность предложения.

Свидетельства до сих пор были неоднозначными. Allbritton et al. (1996) обнаружили, что наивные говорящие ненадежно устраняют просодическую неоднозначность предложений для слушателей, в отличие от опытных говорящих.Результаты Snedeker и Trueswell (2003) согласуются с выводами Allbritton et al., Сделанными наивными ораторами. В задаче референтной коммуникации говорящие проинструктировали своих партнеров касаться объектов в реальном мире, используя такие высказывания, как (11)

Здесь предложная фраза «с цветком» может интерпретироваться либо как инструмент глагола, либо как модификатор глагола. «лягушка». Глагольное присоединение связано с границей после слова «лягушка», в то время как приложение NP связано с границей после глагола «Tap».Снедекер и Трюсвелл (2003) обнаружили, что говорящие устраняли неоднозначность предложения для слушателей только в том случае, если они знали о двусмысленности. На основании этих результатов некоторые пришли к выводу, что говорящие обычно не устраняют неоднозначность синтаксической структуры для слушателей в ходе обычного разговора.

Приведенные выше результаты противоречат другим работам в литературе. Шафер и его коллеги (2005) обнаружили, что говорящие постоянно устраняют неоднозначность предложений, подобных (11), для слушателей в задаче референтной коммуникации.Точно так же Кральич и Бреннан (2005) обнаружили, что говорящие последовательно устраняют неоднозначность структур, подобных (12) ниже.

В (12) слушатель получает указание от другого субъекта переместить либо собаку, которая находится в корзине, на звезду, либо переместить собаку в корзину, которая находится на звезде. Кралич и Бреннан (2005) обнаружили, что говорящие постоянно устраняют неоднозначность предложения, помещая границу интонационной фразы на правой составляющей границе прямого объекта в зависимости от предполагаемой интерпретации, независимо от того, осознавали ли они двусмысленность или нет, и независимо от был ли контекст действительно неоднозначным.Они приходят к выводу, что создание просодической структуры сдерживается процессами, ориентированными на говорящего, а не на слушателя.

Объяснение, ориентированное на говорящего, может объяснить кажущиеся противоречивыми результаты Snedeker and Trueswell (2003). Предложения, полученные в эксперименте Снедекера и Трюсвелла, были короче, чем те, которые использовались в Kraljic и Brennan (2005) или Schafer et al (2005). Если создание говорящими интонационных границ в значительной степени определяется длиной синтаксических составляющих (Watson & Gibson, 2004b), то говорящие вряд ли будут создавать интонационные границы в коротких предложениях, независимо от того, неоднозначны они или нет.Таким образом, эффект осведомленности говорящего, обнаруженный Снедекером и Трюсвеллом, может быть в значительной степени обусловлен длиной предложения. Осведомленность ораторов о двусмысленности, возможно, подтолкнула к более частому использованию границ, чем обычно, в коротких предложениях.

Если взгляд Кралича и Бреннана (Kraljic and Brennan, 2005), ориентированный на говорящего, верен, говорящие могут создавать интонационные границы по причинам, связанным с планированием, а не для слушателя. Слушатели могут быть чувствительны к распределению этих границ, определяя синтаксическую и семантическую структуру из размещения границ.Макдональд (1999) предложил этот тип модели для обеспечения общего описания взаимодействия между производством и пониманием, утверждая, что распределение синтаксических структур ограничивает предпочтения слушателей в синтаксическом анализе.

Клифтон и его коллеги (2006) предлагают аналогичную модель специально для просодической структуры. Согласно гипотезе рационального говорящего, говорящие создают интонационные границы на основе таких факторов, как синтаксическая структура, составная длина и прагматика. Клифтон и его коллеги утверждают, что слушатели чувствительны к вероятным причинам, лежащим в основе размещения границ, и соответственно оценивают эти границы.Рассмотрим (13):

  • (13a) Пэт // или Джей и Ли убедили президента банка продлить ипотеку.
  • (13b) Пэт или Джей // и Ли убедили президента банка продлить ипотеку.
  • (13c) Патрисия Джонс // или Жаклин Фрейзер и Летиция Коннолли убедили президента банка продлить ипотеку.
  • (13d) Патрисия Джонс или Жаклин Фрейзер // и Летиция Коннолли убедили президента банка продлить ипотеку.

Граница в (13) может сказать слушателю, как сгруппировать три референта в теме.Клифтон и его коллеги (2006) обнаружили, что слушатели с меньшей вероятностью использовали границы для группировки существительных, когда существительные были фонологически длиннее (как в 13c и 13d), и с большей вероятностью использовали границы для группировки, когда референты были короче. Клифтон и др. (2006) утверждают, что в (13c) и (13d) слушатели приписывают границы составной длине, а не устранению неоднозначности группировки субъекта.

Неявная просодия

В последнее время возник большой интерес к тому, как просодическая структура языка потенциально влияет на понимание языка при чтении.За исключением знаков препинания, читателям не доступна явная просодия. Исследователи предложили слушателям конструировать просодическое представление на лету при чтении, которое называется имплицитной просодией (Bader, 1998; Fodor, 2002).

Бейдер (1998) был первым, кто предположил, что неявная просодия может быть чем-то большим, чем эпифеномен чтения и может влиять на решения по синтаксическому анализу. Он утверждал, что степень трудности восстановления после садовой дорожки частично объясняется необходимостью повторного анализа как просодической структуры предложения, так и синтаксической структуры предложения.Читатели сталкиваются с большими трудностями, когда и синтаксис, и просодическая структура должны быть повторно обработаны или проанализированы повторно, чем когда один только синтаксис должен быть переработан или повторно проанализирован. Например, Бадер утверждает, что неоднозначности NP / S, такие как (9), приводят к менее серьезным садовым дорожкам, чем неоднозначности раннего / позднего закрытия, такие как (4). Согласно формулировке просодической структуры Неспора и Фогеля (1986), две интерпретации в (9) имеют одну и ту же просодическую структуру, в то время как две интерпретации в (4) имеют разные просодические структуры.Поскольку повторный анализ в последней интерпретации требует дополнительного изменения просодической репрезентации, садовая дорожка является более суровой.

Фодор (1998, 2002) предложил более прямую роль неявной просодии в анализе решений и утверждал, что она может обеспечить широкое объяснение нерешенной проблемы в этой области: понимание межъязыковых различий в предпочтениях привязанности. Хотя кажется, что существует общее кросс-языковое предпочтение, чтобы составляющие были присоединены к более свежему материалу (Gibson, 2000; Frazier & Clifton, 1998), глобально неоднозначные предложения, подобные приведенному ниже, приводят к различным предпочтениям на разных языках.

Относительное предложение «кто уволился с работы» может изменять слова «секретарь» или «лингвист». В английском языке предпочтение отдается присоединению к самому последнему или самому низкому узлу в предложении (низкое прикрепление), в данном случае «лингвист». Однако в испанском языке предпочтение отдается самому высокому узлу, «секретарю». Хотя было множество предложений, не было удовлетворительного объяснения того, почему носители разных языков имеют разные предпочтения привязанности (обзор см. В Fodor, 1998).Фодор и его коллеги утверждали, что неявная просодия играет роль. Утверждается, что читатели создают просодическую структуру, которая соответствует просодическим ограничениям их языка, и что это представление, в свою очередь, может влиять на предпочтения привязанности. Например, более короткие относительные придаточные предложения кросс-лингвистически связаны с низкой привязкой. Фодор утверждает, что более коротким относительным придаточным предложениям с меньшей вероятностью будет предшествовать интонационная граница, потому что слушатели не предпочитают помещать короткое относительное придаточное предложение в интонационную фразу отдельно (см. Selkirk, 2000).Отсутствие границы в этом месте создает склонность к низкой привязанности. Напротив, более длинному относительному предложению с большей вероятностью будет предшествовать граница в неявном просодическом представлении, и эта граница создает склонность к высокой привязанности. Фодор (1998, 2002) утверждает, что языки, в которых видны высокие предпочтения привязанности, — это языки, в которых просодические ограничения требуют просодических разрывов в начале составляющих (английский не является одним из этих языков). Границы строятся перед относительными придаточными предложениями, потому что эти разрывы требуются грамматикой (в теории Фодора), и эти границы вызывают сильную привязанность.Фодор и его коллеги (например, Lovric, 2003; Hirose, 1999) проверяют эти гипотезы на широком классе языков.

Хотя неявная просодия дает интересные потенциальные объяснения множеству явлений, этот тип подхода сталкивается с большим набором проблем. Поскольку имплицитная просодия не может быть измерена напрямую, манипулирование имплицитной просодией при чтении обязательно требует манипулирования другим лингвистическим фактором, который, как предполагается, влияет на просодию в устной речи.Таким образом, трудно понять, является ли имплицитная просодия или другой лингвистический фактор основным источником любого обнаруженного эффекта. Кросс-лингвистический подход, подобный предложенному Фодором, в котором изучаются связи между различными распределениями просодической структуры и синтаксиса между языками, а не манипулирование лингвистическими переменными внутри языка, может предложить лучший подход.

Исследование поведения опекунов и младенцев с использованием компьютерной модели

Образец цитирования: Ховард И.С., Messum P (2014) Обучение произношению первых слов на трех языках: исследование поведения опекунов и младенцев с использованием вычислительной модели младенца.PLoS ONE 9 (10): e110334. https://doi.org/10.1371/journal.pone.0110334

Редактор: Йохан Болхуис, Утрехтский университет, Нидерланды

Поступила: 25 апреля 2014 г .; Одобрена: 12 сентября 2014 г .; Опубликовано: 21 октября 2014 г.

Авторские права: © 2014 Howard, Messum. Это статья в открытом доступе, распространяемая в соответствии с условиями лицензии Creative Commons Attribution License, которая разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии указания автора и источника.

Финансирование: Эта работа изначально была выполнена авторами в их собственное время, а позже была поддержана Плимутским университетом. Спонсор не имел никакого отношения к дизайну исследования, сбору и анализу данных, принятию решения о публикации или подготовке рукописи.

Конкурирующие интересы: Пирс Мессум — директор и акционер коммерческой компании Pronuction Science Ltd., которая производит материалы для обучения языкам. Это не меняет приверженности авторов политике PLOS ONE в отношении обмена данными и материалами.

Введение

Фон

В развитии произношения слов и фраз, несомненно, задействован ряд механизмов обучения, включая некоторые формы имитации. Например, когда маленькие дети перенимают свои первые окружающие словоформы, они могут воссоздать их с помощью мимикрии «целого слова» [1]. Точно так же «прогрессивные фонологические идиомы» [2], высказывания, произношение которых заметно опережает или отстает от общей производительности ребенка, могут быть воссозданы как не проанализированные целые.Но считается, что в какой-то момент произношение слов изучается путем (1) их анализа для определения составляющих их речевых звуков (которые обычно представляют собой фрагменты размером со слог, а не отдельные фонемы) и (2) воспроизведения этих элементов в их правильном порядок. Эта форма имитации, копирование звуков речи в последовательном порядке, требует, чтобы младенец уже решил «проблему соответствия» [3] для звуков речи. То есть, он разработал соответствия между его вокально-моторными схемами (VMS) [4] и звуками речи, которые он слышит, так что результат первого воспринимается его слушателями как эквивалентный (но не обязательно похожий) на второй. .

Принято считать, что дети решают эту задачу соответствия с помощью слухового сопоставления под самоконтролем. В таком описании младенец сравнивает издаваемый им речевой звук с тем, что он слышит, издаваемым другими [5], или с тем, что он слышал в прошлом [6]. Затем он полагается на собственное суждение об их сходстве, чтобы улучшить свои последующие результаты. В другом сообщении предполагается, что после того, как младенец открыл для себя звуковые произведения, они делают аналогичные акустические последовательности в окружающей среде особенно заметными с помощью «артикуляционного фильтра».Это облегчает ему сопоставление и соотнесение некоторых своих произведений с произведениями в его лингвистической среде [7]. Однако эти описания требуют, чтобы младенец был в состоянии сравнивать акустические качества своих звуков и звуков речи других людей. Эта предполагаемая способность проблематична по ряду причин [8]. Действительно, очевидное отсутствие акустической саморегуляции речевого вывода у младенцев [9] и даже у некоторых взрослых [10] также говорит против такого механизма акустического согласования. Более того, в рамках парадигмы акустического соответствия нет объяснения хорошо известному феномену «рыба / рыба» в детской речи, при котором речь ребенка воспроизводится (например,г. «Fis») и правильная форма L1, которую он слышит («рыба»), различаются акустически. Загадка состоит в том, что неправильные постановки ребенка остаются стабильными дольше, чем можно было бы ожидать, несмотря на очевидные акустические свидетельства несоответствия; несоответствие, которое он может различать в речи других и которое часто явно привлекается его вниманием опекуном [11] — [13].

Было много предыдущих вычислительных моделей развития речи; см. [14] для подробного обзора.Они, как правило, касались других вопросов, нежели те, что были в нашей работе здесь. В частности, они предположили, что слуховое согласование — беспроблемный механизм для обучения произношению звуков речи. Некоторые также игнорировали или преуменьшали значение проблемы нормализации, которая возникает из-за разных размеров речевых трактов взрослых и младенцев и неизбежных различий в звуковых качествах, которые возникают в результате [15] — [22].

Тем не менее, группа Asada определила проблемы с традиционным подходом и смоделировала решения для обучения гласным, которые используют аналогичную парадигму подкрепления и имитации опекуна, что и наша [23] — [26].В целом, основное различие между их набором исследований и нашим состоит в том, что их внимание было сосредоточено на начальном обучении и последующем развитии качеств гласных у младенца, моделировании различных структурных аспектов взаимодействия младенца и опекуна. Elija, с другой стороны, представляет собой продольную модель, начинающуюся от обнаружения звуков речи (как гласных, так и согласных) и заканчивающуюся имитацией слов. Мы разделяем то же убеждение, что младенцы недостаточно хорошо подготовлены для решения проблемы соответствия сами посредством слухового сопоставления и что решение может быть найдено в рамках динамики взаимодействия воспитателя и младенца.

В этой статье мы рассматриваем альтернативу общепринятому представлению о слуховом сопоставлении о том, как младенец учится произносить L1. Альтернативный подход включает в себя основной механизм, предложенный Гаттегно [27] и разработанный Мессумом [8]. Мы тестируем это с помощью вычислительной модели под названием Elija [28], и, в частности, мы сосредотачиваемся на роли, которую играют воспитатели во взаимоотношениях между младенцами и воспитателями. (Мы отмечаем, что она хотела бы назвать нашу младенческую Элизу в честь женского персонажа в пьесе Шоу Pygmalion и мюзикле My Fair Lady , которая выучила «Полученное произношение» у профессора фонетики.Однако Элиза — это имя знаменитой новаторской системы искусственного интеллекта [29]. Кроме того, мы можем использовать местоимения более эффективно, когда полагаем, что младенец мужского пола и женщина, ухаживающая за ним.)

Элайджа начинает с «открытия» двигательных паттернов своего голосового аппарата, который производит звуки. Это сформулировано как задача обучения без учителя.

Затем Элия взаимодействует с опекуном с двумя эффектами. Во-первых, он сохраняет те двигательные паттерны, которые генерировали звуки, на которые отвечал опекун, и отбрасывает те, которые игнорировались.Таким образом, ответ опекуна используется как простой механизм выбора.

Во-вторых, он решает проблему двунаправленного соответствия между звуками, которые он слышит, и теми, которые он производит. Он делает это, используя естественное, хорошо подтвержденное взаимодействие, в котором опекун голосом реагирует на продукцию младенца; взаимодействие, в котором имитация обычно задействована и считается вовлеченной обеими сторонами, но в большей степени осуществляется опекуном, чем ребенком. Важно отметить, что в этом взаимодействии любое суждение о звуковом сходстве (или эквивалентности), которое имеет место, делается лицом , осуществляющим уход, , а не Элайджей.Наконец, используя способность Элайджи анализировать вводимые речевые высказывания с точки зрения недавно приобретенного набора эквивалентов его собственных токенов, каждый воспитатель может научить Элайджу произносить несколько простых слов путем последовательного подражания на ее родном языке (одном из трех европейских языков). .

Основная цель настоящего исследования заключалась в том, чтобы продемонстрировать, что Элайю можно научить говорить первые слова на трех языках, и изучить поведение опекуна, которое возникает во время голосового взаимодействия младенца с опекуном.Хотя известно, что в реальной жизни лепет младенцев (обнаружение двигательных паттернов) и взаимодействие с опекунами пересекаются во времени, это не было смоделировано в этой версии Elija, которая вместо этого выполнялась в три отдельных этапа по нескольким причинам. К ним относятся необходимость ограничения времени взаимодействия с опекунами в практических пределах и требование, чтобы все опекуны слышали одни и те же звуки, чтобы можно было сравнивать их ответы.

Неконтролируемое обнаружение звука Элайджей

В процессе речевого развития младенцы проходят несколько идентифицируемых стадий [30].В течение нескольких месяцев после рождения они начинают издавать квазигласные звуки и ворковать. В течение следующих нескольких месяцев они начинают маргинальный лепет; производя гласные, малиновые и визжащие. Канонический лепет можно начинать с 5 месяцев. Это начальное развитие, по-видимому, является результатом бесконтрольных экспериментов младенца со своим речевым аппаратом.

Чтобы смоделировать это естественное развитие, Элайджа начинает с исследования своего голосового аппарата. Он создает двигательную активность, которая перемещает его голосовые артикуляторы из состояния покоя, и он оценивает сенсорные последствия [31]: иногда это приводит к генерации акустического выхода, а иногда к сомато-сенсорным эффектам, таким как прикосновение, возникающее из-за закрытия речевого тракта.Действуя на эту обратную связь, он пытается улучшить свои двигательные действия в соответствии со схемой вознаграждения, включающей несколько терминов, выбранных так, чтобы они были правдоподобными для развития. Таким образом, его исследования приводят к развитию двигательных паттернов для производства звуков, которые впоследствии могут оказаться полезными в качестве звуков речи. (Примечание: у настоящих младенцев двигательные паттерны, которые производят звуки и стабилизируются, описываются как вокально-двигательные схемы (VMS) [4].) Процесс обнаружения двигательных паттернов, используемый в Elija, проиллюстрирован на рис.1.

Рис. 1. Элайджа учится на лепете.

Панель A: (виртуальная) двигательная активность Элайджи приводит в движение его голосовой аппарат, и он может исследовать сенсорные последствия этой активности (1). Иногда это приводит к появлению акустического сигнала (2). Присутствие акустического выхода может быть замечено Elija (3a), как и другие сомато-сенсорные последствия движения речевого тракта, такие как прикосновение, возникающее в результате закрытия речевого тракта (3b). Исследование может привести к открытию двигательного паттерна (4).Панель B: Обнаруженный моторный паттерн сохраняется в моторной памяти (5).

https://doi.org/10.1371/journal.pone.0110334.g001

Элайджа использует ответы опекунов

Знакомство с языком необходимо для развития произношения у ребенка, и ясно, что во время усвоения слова L1 всегда происходит взаимодействие с выученными носителями. По нашему мнению, взаимодействие необходимо перед этим, чтобы развить способность выполнять имитацию слов.(Отметим, что в реальной жизни процессы, поддерживающие развитие речи, перекрываются. Многие вещи происходят параллельно. Для ясности изложения здесь мы описываем события так, как если бы они происходили последовательно). Процесс начинается с того, что воспроизведение звука младенцем начинает привлекать внимание его опекуна. Его развитие на этом этапе зависит от готовности опекуна вокально «подражать» ему, как это естественно наблюдается [32], [33]. Во время этих взаимодействий обе стороны понимают, что она имитирует его [33], [34], поэтому он осознает, что его опекун должен рассматривать его и ее высказывания как в некотором роде.

Хотя это не было явным образом проинструктировано, в наших более ранних экспериментах мы обнаружили, что один (мужчина) экспериментальный опекун счел естественным отвечать на те высказывания Элайджи, которые, по его мнению, были похожи на звуки, которые он мог легко издать сам [28] . В подавляющем большинстве случаев он переформулировал высказывания Элайджи в правильно сформированные звуки речи L1. Здесь мы дополнительно исследуем это наблюдение на восьми носителях трех языков.

Ответ воспитателя влияет на Элайджу двояко.Во-первых, ответ усиливает выработку двигательного паттерна, который его спровоцировал, тогда как его отсутствие препятствует дальнейшему использованию этого двигательного паттерна. Во-вторых, Элайджа позволяет связать свои двигательные паттерны с реакциями опекуна. Мы утверждаем, что оба эффекта отражают вероятную реальность речевого развития. О первом сообщили, например, Pelaez et al. [35]. Второй вариант разумен, поскольку предъявление ответа сразу после голосового действия младенца создает благоприятные условия для ассоциативного обучения [36].Такой ответ дает реальному ребенку интерпретацию своего произведения; учитывая имитационный контекст, в котором это происходит, ему сообщают, что, по мнению его опекуна, результат его двигательного паттерна и ее реакция в некотором смысле эквивалентны. Важно отметить, что это не требует, чтобы младенец (или Элия) делал суждение о сходстве между его и ее результатами. Следовательно, на данном этапе его развития не требуется никаких сложных перцептивных навыков со стороны младенца (или Элайджи).(Такой опыт, необходимый для решения проблемы нормализации, должен предполагаться традиционными имитационными теориями).

На рис. 2 показано, как работает эта парадигма эквивалентности с обучением. Элайджа сначала вспоминает двигательный паттерн, который он ранее обнаружил путем исследования. Затем он использует его, чтобы управлять своим голосовым аппаратом и генерировать высказывания в присутствии опекуна. Воспитатель слышит звуки, и если он считает, что это естественно, он может это сделать. В течение этого периода Элайджа ухаживает за опекуном, слышит любой ответ, который она делает, и связывает их.Если на двигательный паттерн не реагировать, он будет отменен, и связь со слуховой памятью не будет создана.

Рисунок 2. Эквивалентность с обучением.

Элайджа учится произносить слова, используя ответы воспитателя, которые усиливают некоторые высказывания и позволяют ему связывать свои двигательные паттерны с речевым выходом L1 взрослого. Панель A: Элайджа сначала вспоминает двигательный паттерн, например двигательный паттерн 3, (1) и использует его для произнесения высказывания (2). Воспитатель слышит звуки (3). Панель B: Воспитатель может переформулировать его, используя свою интерпретацию L1 звуковоспроизведения Элии (4).Элайджа слышит ответ воспитателя (5). Зная, что ему подражают, Элайджа воспринимает высказывание опекуна как эквивалент выхода его двигательного паттерна, который усиливает двигательный паттерн 3 и связывает его с реакцией (6). Если на двигательный паттерн не реагировать, он будет отключен и не будет связан со слуховой памятью (например, двигательный паттерн 2).

https://doi.org/10.1371/journal.pone.0110334.g002

Последовательная имитация звуков речи

После того, как Элайджа связал некоторые из своих двигательных паттернов с ответами своего опекуна (которые, как мы покажем, обычно являются переформулировками его вывода в L1), у него есть информация, необходимая для синтаксического анализа строк входных звуков с точки зрения звуков, которые он слышал. прежде и реагировать, используя связанные с ним двигательные паттерны.Таким образом, после первого этапа взаимодействия опекун может научить Элайджу произносить слова путем последовательной имитации составляющих их речевых звуков. Конечно, способность Элайджи хорошо выполнять имитацию слов зависит от того, в какой степени его репертуар соответствий двигательных паттернов / переформулировок охватывает звуки, составляющие слова, которым его опекун пытается научить его, и от качества выходных данных его двигательных паттернов. внутри этих пар.

Рис. 3 дает обзор того, как этот механизм реализован в модели Элайи.Сначала воспитатель произносит слово, которое она выбрала, чтобы научить Элайджу. Он слышит высказывание опекуна и разбивает его на составляющие речи звуки размером со слог. Затем он выполняет слуховое сопоставление между этими входящими звуками и всеми реакциями опекуна, которые он ранее связывал со своими двигательными паттернами. Когда обнаруживаются совпадения со слуховыми воспоминаниями, активируются соответствующие двигательные паттерны в моторной памяти. Эти двигательные паттерны вызываются последовательно и используются для управления его речевым аппаратом, что приводит к генерации выходной речи.Это представляет собой его имитацию слова опекуна, и опекун может его услышать.

Рис. 3. Обучение произношению слова с помощью последовательного имитации составляющих его звуков речи.

Панель A: Опекун произносит слово, в данном случае состоящее из двух различных звуков речи (1). Элайджа слышит высказывание опекуна (2) и начинает его обрабатывать (3). Это включает выполнение слухового сопоставления с ранее услышанными ответами (4). Затем последовательно активируются соответствующие слуховые воспоминания (5,6).Панель B: Активированные слуховые воспоминания, в свою очередь, активируют двигательный паттерн 3 и двигательный паттерн 1 в моторной памяти (7,8). Затем они вызываются в последовательности (9), что приводит к генерации выходной речи (10), которая представляет собой имитацию Элайджей высказываний опекуна. Наконец, воспитатель слышит и может оценить ответ Элайджи (11).

https://doi.org/10.1371/journal.pone.0110334.g003

Однако это не обязательно конец процесса. Элайджа и его опекун могут повторять повторяющиеся циклы, как показано на рис.4. Когда опекун слышит ответ Элайджи, она может быть не удовлетворена его попыткой. Затем она сможет сказать это слово еще раз, возможно, более четко и так, как, по ее мнению, Элайджа сможет легче понять. Это дает Элии еще одну возможность выучить слово, что он снова и делает, пытаясь распознавать ее звуки и генерируя ответ. Эта процедура продолжается до тех пор, пока опекун не решит, что работа удовлетворительная, или, если его попытки не увенчались успехом, не сдастся и не попытается научить Элайджу другому слову.

Рис. 4. Повторяющиеся циклы взаимодействия при изучении слов.

Воспитатель сначала говорит слово (1). Элайджа распознает составляющие его звуки в терминах звуков, которые он слышал раньше (2). Затем, используя ассоциированные двигательные паттерны, он генерирует речевой вывод (3). Воспитатель оценивает ответ Элайджи и, если он не удовлетворен, может повторить это слово еще раз, возможно, более четко (4). Элайджа снова выполняет распознавание (5) и генерирует другой ответ (6). Этот процесс может продолжаться (7–9) до тех пор, пока (как в этом случае) лицо, осуществляющее уход, не решит, что его работа удовлетворительна.В качестве альтернативы, если задача не продуктивна, воспитатель может сдаться и попытаться научить Элайджу новому слову.

https://doi.org/10.1371/journal.pone.0110334.g004

Материалы и методы

Мы моделируем младенца как вычислительного агента, Элайю, у которого нет a priori артикуляционных или перцептивных знаний речи [28]. Более подробная информация о его работе представлена ​​в разделе расширенных методов в Приложении S1 в файле S1.

Основные характеристики двигательной системы Элайджи показаны на рис.5А. Элия ​​обладает способностью воспроизводить речь на основе модифицированного артикуляционного синтезатора Maeda [37], [38]. Это обеспечивается двигательной системой, в которой представления двигательных действий сродни жестам, используемым в модели динамики задачи [39]. Моторный паттерн — это последовательность артикуляционных целей для управляющих параметров синтезатора. Контроллер предполагает, что движения артикулятора следуют 2 траекториям с критическим затуханием порядка и , и выполняет интерполяцию между этими целями.Результирующие последовательности изменяющихся во времени векторов параметров приводят в действие синтезатор. Это может привести к акустическому выходу, воспроизводимому через громкоговоритель.

Рис. 5. Двигательная система и система восприятия Элайджи.

Панель A: Система управления двигателем Элайджи включает синтезатор артикуляционной речи Maeda. Моторный паттерн — это последовательность артикуляционных целей для управляющих параметров синтезатора. Они интерполируются контроллером, который предполагает, что движения артикулятора следуют 2 траекториям с критическим затуханием порядка и .Результирующие последовательности изменяющихся во времени векторов параметров приводят в действие синтезатор. Это потенциально генерирует акустический выход, который воспроизводится через громкоговоритель. Кроме того, оцениваются усилия при постановке и сообщается о любом закрытии речевого тракта. Панель B: Система восприятия Элайджи. USB-микрофон сначала оцифровывает акустический вход. Автокорреляционный анализ применяется непосредственно к форме сигнала для оценки его основной частоты F0. Банк слуховых фильтров обеспечивает предварительную обработку входных данных.Дальнейшая обработка оценивает значимость сигнала, который используется механизмом вознаграждения. Предварительно обработанный ввод можно записать в слуховую память, а также сравнить с прошлыми воспоминаниями с помощью распознавателя звуков речи, основанного на DTW.

https://doi.org/10.1371/journal.pone.0110334.g005

Схема системы восприятия Элайджи показана на рис. 5B. Слуховой аппарат Элайджи получает сигнал от USB-микрофона Rode Podcaster. Автокорреляционный анализ применяется непосредственно к входному сигналу для оценки основной частоты F0.Банк слуховых фильтров обеспечивает первоначальную предварительную обработку входных данных [40]. Наша реализация основана на гамматоноподобных спектрограммах, реализованных Эллисом [41].

Анализ собственного акустического сигнала Элайджи выполняется непосредственно на оцифрованном сигнале синтезатора, хотя в принципе это также может быть достигнуто путем передачи акустического сигнала обратно из громкоговорителя через микрофон. Дальнейшая обработка оценивает значимость сигнала, который используется как компонент в механизме вознаграждения Элайджи.Предварительно обработанный ввод можно записать в слуховую память, а также сравнить с прошлыми воспоминаниями с помощью распознавателя звуков речи, основанного на динамическом искажении времени (DTW) [42]. Это позволяет Элии различать звуки речи.

Артикуляционный синтезатор Maeda

В нашей реализации артикуляционного синтезатора Maeda [37], [38] для управления голосовым аппаратом используются десять параметров, первые семь из которых являются артикуляционными: P1 положение челюсти, P2 положение тыльной стороны языка, P3 форма тыльной части языка, P4 вершина языка положение, P5 Высота губ (апертура), P6 Выступ губ, P7 Высота гортани.Кроме того, была добавлена ​​модель источника низкочастотного голоса для управления моделью вокализованного возбуждения [43]. (LF, названная в честь авторов Liljencrants и Fant, представляет собой четырехпараметрическую модель голосового потока.) При этом используются два дополнительных параметра: глоттальная площадь P8 и основная частота P9. В исходной реализации VTCALCS к базовой модели был добавлен вело-глоточный порт, и его открытие регулируется с помощью параметра P10 Nasality. Таким образом, синтезатор Maeda позволил Элии издавать как оральные, так и носовые звуки.После того, как профиль речевого тракта определен параметрами элементарного артикулятора, вычисляется эквивалентный цифровой фильтр, который используется для фильтрации возбуждения от источника голоса и других источников шума. Фрикативы моделируются в модели путем введения шума в те места в речевом тракте, где прогнозируется турбулентный поток воздуха.

В наших экспериментах синтезатор работал с частотой дискретизации выходного сигнала 24 кГц. Чтобы аппроксимировать речевой тракт младенца адекватно для целей этих экспериментов, физические размеры модели по умолчанию, которые первоначально отражали размер речевого тракта взрослой женщины, были уменьшены в 0 раз.8.

Аналогичным образом средний диапазон основной частоты был сдвинут с 210 Гц на 400 Гц. Мы добавили проприоцептивную обратную связь при контакте губ и языка, которая генерировалась временами, когда площадь поперечного сечения трубки голосового тракта достигала нуля. Elija был реализован на C ++, а все остальные анализы были написаны в Matlab (Mathworks Inc, Натик, Массачусетс, США), работающем на ПК. Акустический выход воспроизводился на человека, осуществляющего уход, через выход ЦАП на плате ПК через пару активных динамиков.

Моделирование двигательных паттернов и динамики артикулятора

Как и в предыдущей реализации Elija [28], двигательные действия моделировались способом, аналогичным жестовой оценке, используемой в модели Task Dynamics [39], а перемещение артикуляторов Элайджи между целями было реализовано с использованием предположения 2 и порядка динамики которые следуют по критически затухающим траекториям [15].В этой работе мы расширяем наш прежний подход, и теперь динамические свойства различных артикуляторов речевого тракта больше не группируются вместе. Скорее им даются индивидуальные свойства (см. Ниже). Отметим, что другие приближения к движениям артикулятора также могут быть сделаны, например, с использованием траектории минимального рывка, которая часто используется для описания движений рук человека [44].

В Elija двигательный паттерн может быть последовательностью до трех различных суб-паттернов. Каждый подшаблон определяет параметры, необходимые для управления речевым аппаратом, и содержит целевой вектор из 10 элементов, вектор времени начала из 10 элементов и вектор времени длительности из 10 элементов, определяющий, как долго поддерживается цель.Существует также один общий параметр масштабирования скорости перехода. Таким образом, каждый подшаблон состоит из 31 элемента.

Каждый компонентный целевой вектор вызывает движение артикуляторов от их текущего состояния к новым целевым значениям. Как указано выше, такое движение артикулятора следует по критически затухающей траектории, что приводит к движению артикулятора к своей цели без перескока [15]. Мы вычисляем траекторию каждого регулирующего параметра, используя уравнение: где — значение параметра во время, — это начальная точка, — это конечная точка (целевое значение), константа задается соотношением, где — жесткость пружины, а — ассоциированная масса динамической системы.

Значение, связанное с различными параметрами артикулятора речевого тракта, соответствует их динамическим свойствам. Для движений артикуляторов во время генерации вокальных, сонорных и фрикционных звуков используется значение, поскольку оно хорошо соответствует типичной скорости артикуляции человека. Однако во время взрывного звукоизвлечения переходы происходят намного быстрее из-за быстрого сброса давления воздуха в точке закрытия речевого тракта. Чтобы учесть это явление, связанное с ними значение переходов после закрытия увеличивается до 160.Это приводит к созданию более реалистичных взрывных звуков.

Неконтролируемое обнаружение звука

Открытие Элайджей двигательных паттернов, генерирующих звук при вероятных с точки зрения развития влияний, сформулировано как задача оптимизации, которая работает без участия опекуна, и является продолжением предыдущей работы [31]. Моделирование автономных исследований в последнее время стало областью интереса для нескольких исследователей, в том числе тех, кто работает в области развивающей робототехники [45] — [50].Мы отмечаем, что Элайджа использует как внутреннее, так и внешнее подкрепление, как описано Варлаумонтом [51], во время своего процесса открытия и уточнения звука.

Как и раньше, наша целевая функция для оптимизации двигательных паттернов включает в себя термины, которые поощряют заметность и разнообразие и препятствуют двигательным усилиям. Кроме того, теперь мы включаем термин, который препятствует обнаружению «чувствительных» двигательных паттернов, как описано ниже. Значение непрерывного скалярного вознаграждения, вычисляемое в целевой функции алгоритма, определяется следующим образом: Термин значимости побуждает Элайджу находить двигательные паттерны, которые вызывают сенсорные последствия.Сенсорная значимость оценивалась путем объединения нескольких компонентов: средней взвешенной низкой и взвешенной высокочастотной мощности по продолжительности двигательного паттерна и среднего сигнала прикосновения.

Мы предполагаем, что человеческий младенец может избирательно фокусировать свое внимание на этих различных аспектах сенсорной обратной связи. Элайджа делает это, изменяя относительный вклад компонентов заметности. Обращение к акустической мощности на более низких частотах будет способствовать обнаружению конфигураций, которые приводят к образованию гласных, в то время как внимание к акустическому выходу с доминирующим высокочастотным компонентом будет способствовать открытию фрикативных звуков.Внимание к прикосновениям будет благоприятствовать конфигурациям, используемым в согласных звуках, например, когда губы сомкнуты или язык соприкасается с зубами или небом рта.

Термин разнообразия включен в целевую функцию, чтобы способствовать открытию ряда двигательных паттернов, которые приводят к различным сенсорным последствиям. То есть он поощряет открытие новых закономерностей, которые отличаются от ранее обнаруженных. Разнообразие вычислялось как взвешенная сумма трех компонентов в пространстве акустических, тактильных и моторных паттернов.В каждом из этих пространств вычислялось минимальное расстояние, возникающее из текущего двигательного паттерна до всех предыдущих двигательных паттернов. Взвешивание повлияло на класс обнаруженных двигательных паттернов. Сильный тактильный вес смещал оптимизацию к обнаружению отчетливых взрывных артикуляций, тогда как сильный акустический вес смещал оптимизацию к обнаружению акустически различных вокальных и фрикционных звуков. Мы отмечаем, что такое явное взвешивание не является строго необходимым, поскольку термин разнообразия по самой своей природе приводит к активному исследованию.Однако его включение действительно ускоряет вычислительный процесс.

Усилия, необходимые для выполнения двигательного паттерна, вносят отрицательный вклад в целевую функцию. Усилие определялось сочетанием стоимости движения и громкости озвученного возбуждения. Стоимость движения рассчитывалась как взвешенная сумма скоростей артикулятора на протяжении двигательного паттерна. Громкость вокализованного возбуждения оценивалась суммированием голосового вклада в параметр P8 Маэда в течение продолжительности двигательного паттерна.Срок действия важен, потому что, если не включены штрафы за громкость голоса, оптимизация обычно находит решение с параметром голоса, установленным на максимум, потому что это всегда максимизирует сенсорную значимость. Мы отмечаем, что термин «усилие» может быть усилен, например, путем включения «тяжелого труда» (относящегося к деформации речевого тракта), как определено Йошикавой и др. [24].

В целевую функцию включен термин чувствительности для наказания за обнаружение двигательных паттернов, которые создают звуки, которые могут быть произведены только при очень точной артикуляции.В частности, чувствительность двигательного паттерна связана с тем, насколько изменяется акустический выход данной артикуляции, когда двигательный паттерн подвержен локальным возмущениям: проблемы с чувствительностью влияют на обнаружение гласных. Учитывая некоторую вариабельность речи, которая является особенностью процесса обучения, нечувствительные артикуляции с большей надежностью приведут к приемлемому заданному акустическому выходу, чем чувствительные. Есть основания полагать, что очень чувствительные конфигурации артикуляторов не используются при воспроизведении речи, как это указано в квантовой теории Стивена [52] и теории локальной линейности Ганнилстама [53].Обе гипотезы предполагают, что существуют предпочтительные области артикуляции в производстве речи и что существуют, например, области артикуляторного пространства, которые обеспечивают естественное расположение гласных звуков. Чувствительность акустической реализации данного двигательного паттерна вычислялась путем индивидуального положительного возмущения параметров от P1 до P5. Было использовано возмущение, соответствующее 5% от полного диапазона параметров (т. Е. Значение 0,1 было добавлено к каждому параметру Маэда). Все остальные параметры были установлены на постоянные значения по всем векторам двигательных паттернов, чтобы избежать дополнительной изменчивости акустической мощности.Формы выходных сигналов во времени для невозмущенного двигательного паттерна и для каждого из 5 возмущенных двигательных паттернов были сгенерированы с использованием синтезатора Maeda, а затем проанализированы с использованием банка слуховых фильтров. Было вычислено расстояние между слуховым представлением каждого нарушенного двигательного паттерна и невозмущенного паттерна. Затем общая чувствительность для данного двигательного паттерна была принята как квадратный корень из суммы квадратов 5 компонентов. Возмущенные паттерны использовались только для оценки чувствительности исследуемого паттерна и не сохранялись в памяти.

Обнаружение схемы работающего двигателя

В модели Элайджи обнаружение двигательного паттерна начинается с установки для элементов двигательного паттерна случайных значений, взятых из равномерного распределения в их допустимом диапазоне (от -1 до 1). Затем находят решения моторного паттерна с использованием 3 итераций алгоритма квазиньютоновского градиентного спуска, реализованного функцией Matlab fmincon (которая находит ограниченный минимум).

Поскольку в этом исследовании изучались звук и последующее заучивание слов, было предпринято несколько шагов, чтобы Элайджа обнаружил широкий спектр подходящих двигательных паттернов в разумные сроки.Используя двигательные паттерны с единственной целью, были использованы отдельные прогоны оптимизации с упором на низкочастотную мощность (для гласных), высокочастотную мощность (для фрикативных) и прикосновение (для взрывных). Чтобы увеличить разнообразие звуков, озвучивание было явно включено или отключено для каждой взрывной и фрикативной артикуляции (то есть эта операция не выполнялась автоматически процедурой оптимизации). Точно так же закрытие было произведено с открытием вело-глоточного порта или без него, создавая носовые или взрывные устройства соответственно.Отметим, что во время открытия двигательных паттернов активное обучение всегда присутствовало. Следовательно, хотя априорное смещение использовалось для сокращения времени исследования, если бы процессу обнаружения двигательных паттернов дать возможность работать достаточно долго, он бы нашел сопоставимый окончательный набор согласных и гласных автономно, без таких вмешательств, как была достигнута в нашем предыдущем исследовании [28].

Чтобы ограничить общее количество двигательных паттернов, использовалась кластеризация, чтобы уменьшить возникновение сходных артикуляций.Такая кластеризация сохраняла разнообразие, но ограничивала избыточность и гарантировала отсутствие последующего комбинаторного взрыва конфигураций C и V при генерации последовательностей (см. Ниже). Кластеризация взрывных конфигураций выполнялась непосредственно на двигательных паттернах с использованием стандартного алгоритма K-средних. Вокальные и фрикативные звуки были сгруппированы акустически с использованием модифицированной версии того же алгоритма с использованием динамического преобразования времени (DTW) в качестве метрики сходства [28]. Общее количество кластеров и категорий двигательных паттернов было установлено вручную, чтобы ограничить их количество.Еще раз отметим, что кластеризация была бы ненужной, если бы длительное время взаимодействия с лицами, осуществляющими уход, было приемлемым. В идеале все исходные двигательные паттерны, обнаруженные при поиске оптимизации, использовались бы и оценивались лицом, осуществляющим уход, но это потребовало бы гораздо более длительных периодов взаимодействия.

Количество обнаруженных вокальных звуков было ограничено до 15, количество взрывных звуков — до 15, а количество фрикативных — до 10. В результате последующие эксперименты по взаимодействию можно было проводить в течение 2–3 часов для каждого воспитателя.

Расширение разнообразия моделей двигателей

Объединяя простые двигательные паттерны, обнаруженные процедурой оптимизации, Элайджа может генерировать более сложные высказывания, которые являются потенциальными звуками речи. Отдельные сочленения были объединены для создания VV (звучание похоже на настоящие дифтонги), CV, CVV и VC. Более конкретно, Elija сгенерировал CV (C v V, C u V, F v V, F u V, NV), VC (VC v , VC u , VF v , VF u , VN) и токены VV, где N = звонкий носовой согласный, C v = звонкий согласный, C u = глухой согласный, F v = звонкий фрикативный, F u = глухой фрикативный .В принципе, были возможны более длинные последовательности, но в данном исследовании они не использовались. Снова отметим, что объединение простых двигательных паттернов в сложные двигательные паттерны было выполнено только для сокращения времени, необходимого для обнаружения двигательных паттернов. Если бы процессу обнаружения двигательных паттернов было позволено длиться дольше и найти несколько целевых двигательных паттернов, процесс обнаружения сложных двигательных паттернов мог бы работать полностью автономно, как в нашем предыдущем исследовании [28].

После того, как авторы вручную удалили неправдоподобные звуки (например, артефакты синтезатора, такие как щелчки), Элия обнаружил 927 двигательных паттернов, которые можно было использовать для экспериментов по первому отклику.

Заявление об этике

После предоставления письменного информированного согласия 8 субъектов (3 мужчины, 5 женщин) играли роль опекунов Элайджи в отдельных экспериментах. Все испытуемые были взрослыми носителями языков, на которых они общались с Элайджей. Отметим, что в этом исследовании не участвовали дети. Кембриджский комитет по этике психологических исследований Кембриджского университета одобрил протокол эксперимента.

Эксперименты

В первом эксперименте изучались ответы лиц, осуществляющих уход, на трех разных языках с использованием всех 8 субъектов.Мы исследовали вариативность ответов у носителей одного языка. Во втором эксперименте изучалась вариативность ответов одного англоговорящего за 4 сеанса. В третьем эксперименте изучалось изучение слов Элайджей посредством последовательного подражания с использованием 6 испытуемых (по 2 на каждом языке), каждый из которых ранее отвечал на результат Элайджи в эксперименте 1.

Эксперименты 1 и 2: Взаимодействие первого лица, осуществляющего уход, с Элией

В первых экспериментах изучалась реакция воспитателя на 927 двигательных паттернов Элии.Воспитателям было приказано закрыть глаза и представить, что они взаимодействуют с человеческим младенцем. Им не дали никакой информации о возрасте ребенка и не показали фотографию младенца. Их просили либо отвечать, либо не отвечать «естественно» на то, что они слышали.

Воспитатели побудили Элайджу произнести речь, нажав клавишу на клавиатуре. Затем Элайджа выполнил двигательный паттерн, который произвел звук, на который мог отреагировать его опекун. Элайджа слушал в течение 3 секунд после каждого выступления и записывал любой голосовой ответ, который выбирал опекун.Элайджа определил, отвечает ли опекун, с помощью простого механизма распознавания речи. Это включало определение того, превышает ли кратковременная мощность любого акустического отклика уровень фонового шума. Когда ответ был обнаружен, ответственный двигательный паттерн сохранялся, и была создана ассоциация между ответом и двигательным паттерном (рис. 2). Когда опекун игнорировал звук, основной двигательный паттерн исчезал из репертуара двигательных паттернов Элайджи. На рис. 6 показано, как этот процесс формирует ассоциации между моторной и слуховой памятью: сразу после выполнения моторного паттерна Элайджа фиксирует любой ответ от лица, осуществляющего уход, в слуховой памяти, сохраняет двигательный паттерн в моторной памяти и устанавливает связь между ними.

Рисунок 6. Формирование ассоциаций между моторной и слуховой памятью.

Элайджа генерирует акустический выход, используя ранее обнаруженный моторный паттерн. После производства Элайджа записывает любой возможный ответ опекуна. Если опекун отвечает, слуховая значимость этой реакции будет способствовать сигналу вознаграждения. Это заставит Элайджу запомнить ответ на ввод речи, усилить двигательный паттерн, а также установить связь между ними.

https: // doi.org / 10.1371 / journal.pone.0110334.g006

Отметим, что Элайджа не изменил свои двигательные паттерны в результате взаимодействия с опекунами (тот же подход, что и у Миуры и др. [25]). Они были оптимизированы только на начальном этапе самостоятельного обучения. В этом исследовании сравнивалось поведение разных лиц, осуществляющих уход, поэтому было важно, чтобы все лица, осуществляющие уход, слышали одни и те же звуки, чтобы можно было сравнить их ответы.

Эксперимент 3: Механизмы изучения слов в Elija

После того, как Элайджа узнал ассоциации между его произведениями и взрослыми формами, созданными в ответ, он мог попытаться имитировать новые высказывания, сделанные опекуном (рис.3). Он проанализировал их с точки зрения ранее услышанных ответов, и, поскольку эти звуки были связаны с его двигательными паттернами, этот процесс предоставил ему кандидатов для воспроизведения слов путем последовательного сопоставления составляющих их звуков.

Для реализации механизма распознавания Элайджа использовал основанный на шаблонах распознаватель динамической деформации времени (DTW) [54], работающий с внешним интерфейсом банка фильтров слухового гамматона [40]. Такие распознаватели DTW обычно работают путем сопоставления спектральных представлений входной речи с другим набором таких представлений, которые соответствуют словарю распознавателя.Последние являются просто «шаблонами» или хорошими примерами звуков в его словарном запасе. Шаблон, который дает наиболее близкое соответствие, затем принимается за классификацию входного звука. В модели Elija распознаватель DTW использовал ответы опекуна в качестве звуковых шаблонов. Однако, поскольку слова могут содержать несколько основных речевых звуков, соединенных вместе, был использован механизм сегментации, чтобы представить их индивидуально для распознавателя на основе шаблона. Это требовало, чтобы воспитатель говорил с паузами между слогами.Сегментация на отдельные высказывания была достигнута путем поиска областей, в которых кратковременная мощность сигнала превышала уровень фонового шума.

На практике для обеспечения работы в реальном времени использовалась двухпроходная схема распознавания [28]. На первом проходе распознаватель работал с использованием 100 шаблонов, выбранных в качестве центров кластеров всех ответов. Во втором проходе в качестве шаблонов использовались все члены 5 лучших кластеров. Здесь мы отмечаем, что, поскольку Элайджа сопоставлял только речь опекуна с речью опекуна, классификатор не мог решить проблему нормализации.

Во время этого эксперимента Элайджа разыграл двигательные паттерны, которые он идентифицировал в процессе распознавания. Элии была дана способность создавать интонационный контур на каждом слове, напоминающий интонационный контур человека, осуществляющего уход, что сделало его попытки подражания словам более естественными. Для этого был вычислен контур основной частоты для каждого отдельного звука речи и аппроксимирован к прямой линии с использованием линейной регрессии. Начальная и конечная частоты были извлечены и затем сопоставлены с диапазоном параметра F0 источника голоса синтезатора Maeda, предполагая линейное масштабирование между (-0.9, 0.9) и диапазон частот от 100 Гц до 300 Гц или от 150 до 400 Гц, для мужчин или женщин, осуществляющих уход, соответственно. Продолжительность речевых звуков в речи опекуна оценивалась, и значения были ограничены диапазоном от 250 мс до 600 мс. Значения параметров F0 и длительности затем использовались для установки параметров основной частоты и длительности в соответствующих моделях двигателя. Все взаимодействия, включая процесс внутреннего распознавания Элайджи, были записаны, чтобы задокументировать развитие его произношения.

Задание по изучению слов выполнялось на ПК, а графический пользовательский интерфейс предоставлял опекуну слово из списка, составленного из слов, которые обычно произносятся маленькими детьми на языке опекуна. Воспитатель сначала нажал кнопку «Пуск» и произнес слово. Затем Элайджа повторил это, используя свой механизм последовательной имитации. У него могло быть до 4 попыток имитации, каждую из которых можно было выбрать в пользовательском интерфейсе. Воспитатель принял или отклонил ответы Элайджи, нажав соответствующие кнопки.Важным аспектом этого взаимодействия между младенцем и опекуном было то, что они могли участвовать в повторяющихся циклах (рис. 4). Слово, произнесенное опекуном, могло повторяться, что иногда провоцировало лучшую реакцию. Это могло продолжаться до тех пор, пока Элайджа не выполнил приемлемую постановку, или до тех пор, пока опекун не сдался и не попробовал другое слово.

Фонематическая транскрипция ответов лица, осуществляющего уход

Чтобы количественно оценить эффективность Элайджи и его опекунов, мы проанализировали их взаимодействие во время экспериментов с ответом и обучением словам.Младенческую речь проблематично интерпретировать и анализировать, но взрослые речи можно легко изучить.

Опытные фонетики создали широкую (фонематическую) транскрипцию ответов опекунов, используя символы из реестра SAMPA [55]. Это ограничивало их классификацию с точки зрения фонем языка, на котором они транскрибировали или помечали высказывания как находящиеся за пределами L1. Для данного начального двигательного паттерна было выделено несколько случаев:

1. Ответ лица, осуществляющего уход, который может быть напрямую закодирован в рамках CVC или CVV, по крайней мере с одним V или C и пустыми слотами, закодированными с помощью символа «,» (запятая).

2. Безмолвный ответ, закодированный с помощью символа «#».

3. Ответ, который невозможно переписать фонематически. (Обычно это была попытка подражания опекуном.) Это было закодировано как «ххх».

4. Ответ был длиннее, чем CVC или CVV. В результате обследования мы обнаружили, что это были случаи, когда опекун приписывал Элайдже некоторую раннюю языковую способность, как если бы он создал прогрессивную фонологическую идиому. Например, один воспитатель трижды ответил на слова Элайджи «привет».Это было закодировано с использованием только первых 3 элементов ответа, как указано выше.

Во время анализа данных мы проанализировали ответы в пределах (1) и (4) с точки зрения их фонематической транскрипции.

Архифонемные объединения

Невозможно провести значимое сравнение ответов лиц, осуществляющих уход, на фонематическом уровне среди носителей разных языков, поскольку как природа сегментов, так и инвентарные количества сегментов на любом языке различаются. Еще одна аналитическая проблема заключается в том, что легко быть ошеломленным количеством фонематических категорий, которые влекут за собой сравнения между говорящими, даже в пределах одного языка.Поэтому мы сгруппировали фонемы в категории архифонем (обозначенные вертикальной чертой, например, | A |), чтобы можно было проводить межъязыковые сравнения и сравнения между лицами, осуществляющими уход, визуально. Отношения между категориями архифонем и включаемыми в них фонемами показаны в нотации SAMPA в таблице 1.

Транскрипции архифонемы были получены из фонематических транскрипций, а затем разделены на их гласные и согласные компоненты, чтобы их можно было анализировать отдельно.То есть были идентифицированы отдельные компоненты C 1 V 1 V 2 C 2, , любой из которых мог или не мог присутствовать.

Визуализация данных

После маркировки экспериментальные данные каждого субъекта состояли из наличия или отсутствия описания архифонемы для каждого из 927 высказываний Элайджи.

Был единый набор данных маркировки для каждого предмета, за исключением одного англоговорящего, для которого было четыре набора данных.Чтобы дать нам возможность количественно оценить, как вели себя разные субъекты, а также как один субъект вел себя в разных экспериментальных сессиях, мы сравнили маркировку в соответствующих наборах данных. Чтобы сравнить любые два набора данных, мы провели попарные сравнения двух потенциально разных меток, присвоенных каждому из 927 высказываний Элайджи. Мы сделали это отдельно для C и V.

Чтобы упростить визуальную интерпретацию результатов сравнений, мы просуммировали встречаемость каждой гласной и согласной архифонемы по всем ответам каждого испытуемого в парном сравнении, создав две гистограммы встречаемости архифонем.

Затем мы исследовали, как эти два испытуемых различались в их конкретных ответах. Если обоим ответам субъектов на данный токен была присвоена одна и та же метка архифонемы, счетчик частоты «одинаковой метки» увеличивался. Различия в маркировке регистрировали путем увеличения счетчика заболеваемости, присвоенного несовпадающей паре архифонем.

Одна из целей этого исследования заключалась в том, чтобы оценить, реагируют ли испытуемые с разным языковым образованием на Элайджу по-разному. Для этого нам нужно было сравнить ответы разных групп испытуемых, а не только отдельных испытуемых.Для этого мы расширили процедуру суммирования, описанную выше, на все множественные пары исследуемых наборов данных. Такие индивидуальные результаты парного сравнения за два сеанса, а также результаты сравнения нескольких групп могут быть нанесены на график для визуализации сходства и различия в ответах отдельных лиц, осуществляющих уход.

Чтобы создать более абстрактное описание сравнений групп, которое можно было бы использовать для статистического анализа, мы суммировали общие «одинаковые» и «разные» ответы архифонем.Это дало единую общую меру сходства между сравниваемыми группами наборов данных без ссылки на какие-либо конкретные детали относительно того, какие архифонемы были задействованы в сравнениях.

Доверительные интервалы гистограммы

Мы рассчитываем доверительные интервалы так, чтобы:

Нижняя граница:

Верхняя граница:

Мы вычислили нижнюю и верхнюю границы для значения достоверности 95% ()

Результаты

Эксперимент 1. Изучение ответов лиц, осуществляющих уход, на 3 языках (n = 8)

Когда начинается лепет, взаимодействие с опекуном может формировать голосовое развитие младенца [56].Чтобы изучить поведение опекунов, когда младенец поет, были проведены эксперименты по взаимодействию с носителями английского, французского и немецкого языков, которые играли роль опекунов. Испытуемые включали 2 англичанки (E1, E2) и 2 англичанки (E3, E4-1), франко-канадскую женщину (F1), француженку (F2), немецкую женщину (G1) и немецкого мужчину (G2). ). Каждый воспитатель взаимодействовал с отдельным (но изначально идентичным) экземпляром Элии, так что во время их экспериментальной сессии только их собственные взаимодействия влияли на обучение Элии.

Моторные паттерны и акустическая мощность Элии исследуются в Приложении S2 в файле S1. В частности, высказывания, на которые ответили опекуны, сравниваются с теми, на которые не обращали внимания.

Базовая статистика ответов

Мы проанализировали взаимодействия между Элией и его опекунами с точки зрения архифонемных описаний согласных и гласных в ответах опекунов. Сначала была рассчитана статистика встречаемости гласных и согласных. Дальнейший анализ затем изучил сходства и различия в компонентах архифонемы у субъектов, как описано ранее.

На рис. 7 показан анализ некоторых основных аспектов данных ответов в многоязычном наборе данных для 2 субъектов на каждом языке (E1, E2, F1, F2, G1, G2).

Рис. 7. Статистический анализ набора данных многоязычных ответов из 6 лиц, осуществляющих уход.

Процент двигательных паттернов Элайджи, на которые реагировал каждый человек, осуществляющий уход. B Процент двигательных паттернов, на которые отреагировали, по отношению к количеству ответивших на них лиц, осуществляющих уход. C Распределение качеств гласных на четырехугольнике гласных IPA.Разброс данных показывает, что качество гласных в высказываниях Элайджи, как они воспринимаются и на которые реагируют опекуны, охватывает широкий диапазон. D Распределение согласных мест артикуляции. В высказываниях Элайджи присутствовал широкий диапазон предполагаемых мест артикуляции.

https://doi.org/10.1371/journal.pone.0110334.g007

На рис. 7А показан процент двигательных паттернов Элайджи, на которые реагирует каждый отдельный субъект. Значение варьировалось от 53% до 91%, в среднем 78%.Разброс ответов даже среди лиц, осуществляющих уход в одной языковой группе, указывает на то, что разные испытуемые использовали разные критерии ответа.

На рис. 7В показан процент двигательных паттернов Элайджи, на которые он отреагировал, в зависимости от количества говорящих, которые на них ответили. Обратите внимание, что общая сумма по всем предметам составляет 100%. Этот график показывает, что все 6 воспитателей не игнорировали ни одного двигательного паттерна.

Рис. 7C представляет собой гистограмму качеств гласных в ответах воспитателей, нанесенную на двумерный четырехугольник гласных IPA.Поскольку большинство ответов были переформулированы (см. Ниже), разброс данных показывает, что качество гласных в высказываниях Элайджи, как они воспринимаются и на которые реагируют лица, осуществляющие уход, охватывает широкий диапазон, что указывает на эффективность самоорганизующегося процесса обнаружения гласных. Рис. 7D представляет собой дополнительный анализ распределения согласных мест артикуляции. Опять же, воспринимаемые места артикуляции в высказываниях Элайджи охватывают весь доступный диапазон (от губ до велума).

Анализ ответа на основе транскрипции

Мы классифицировали ответы как переформулировки, имитирующие или идиоматические. Переформулировка была ответом воспитателя, соответствующим ее интерпретации L1 высказывания Элайджи. Имитация ответа заключалась в том, что опекун копировал звуковую форму высказывания Элайджи, а не интерпретировал ее в пределах L1. То есть ее ответ был акустическим воссозданием высказывания. Идиоматический ответ был, когда опекун приписывал Элии попытку сказать что-то значимое в L1 и отвечал словом L1 или цепочкой слов.Например, если она ответила на CVCV от Элайджи, сказав: «Доброе утро!»

На рис. 8 показано, как воспитатели отреагировали на репертуар двигательных паттернов Элиджи. Панель A отображает индивидуальные данные для всех лиц, осуществляющих уход, которые были наивны по отношению к цели эксперимента. Это показывает общие пропорции переформулировок в L1, имитированных ответов и идиоматических ответов. Панель B показывает среднее значение для пяти субъектов, которые вели себя одинаково. E3 рассматривается здесь как особняк, поскольку он имитировал гораздо больше ответов, чем другие воспитатели.Это рассматривается в Обсуждении ниже.

Рисунок 8. Статистика ответов воспитателя.

Ответы разных типов лиц, осуществляющих уход, на двигательные паттерны Элии показаны как доля от общего числа ответов. Панель A показывает общие пропорции переформулировок (желтые столбцы), имитированных ответов (зеленые столбцы) и идиоматических ответов (синие столбцы) для всех отдельных субъектов. Панель B показывает среднее значение для всех субъектов, за исключением E3, который рассматривался как выброс, поскольку он имитировал намного больше ответов, чем другие лица, осуществляющие уход.

https://doi.org/10.1371/journal.pone.0110334.g008

В среднем более 94% всех ответов были переформулированы, с почти равным разделением между имитируемыми и идиоматическими ответами, которые составили оставшуюся часть. Идиоматический ответ также является источником информации о соответствии двигательного паттерна / звуковой ценности ребенку или Элии в терминах парадигмы развития произношения, которую мы исследуем. Таким образом, можно видеть, что почти все ответы лиц, осуществляющих уход, имели потенциальную ценность для Элайджи для последующего эксперимента по изучению слов.

Визуализация ответа воспитателя на разных языках

Каждый ответ на произнесение Илии потенциально может содержать архифонемы согласных и гласных. Попарные сравнения категорий архифонемы первых гласных V 1 и согласных C 1 были выполнены между ответами в сессиях говорящих на английском и немецком языках. Затем англо-немецкие парные сравнения были объединены, чтобы дать единый набор данных, чтобы представить общее поведение англо-немецкой группы.Аналогичным образом были проведены англо-французские и немецко-французские сравнения. Эти сравнения показаны на рис. 9.

Рисунок 9. Соотношение между ответами на английском, немецком и французском языках.

Сравнение суммарных ответов лиц, осуществляющих уход, показано в терминах их архифонемных гласных и согласных компонентов. Один набор сеансов ответов представлен на LHS, а другой набор на RHS каждой панели. Область желтых узлов представляет вхождения данной фонематической категории.Ширина красной линии указывает на заболеваемость с одинаковой интерпретацией через сеансы; Ширина синей линии указывает на заболеваемость с разной интерпретацией в сеансах. 4 сеанса данных ответов на английском языке всегда представлены на LHS, а 2 сеанса данных для немецкого и 2 французского языков — на RHS каждой соответствующей панели. Сравнение английских и немецких гласных. B Сравнение согласных английского и немецкого языков. C Сравнение английских и французских гласных. D Сравнение согласных между английским и французским языками. E Сравнение немецких и французских гласных.F Сравнение немецких и французских согласных.

https://doi.org/10.1371/journal.pone.0110334.g009

Панель A показывает сравнение английских и немецких гласных, а панель B показывает сравнение английских и немецких согласных. Панели C и D, E и F показывают те же сравнения для английского / французского и немецкого / французского языков соответственно.

Область желтых узлов представляет собой сумму вхождений для всех парных сравнений данной категории архифонем в ответах носителей данного языка.Можно видеть, что было разное количество вхождений в разные категории архифонем. Во всех языках частота встречаемости гласных звуков была довольно равномерной, за исключением более низкой частоты встречаемости | O | категория. Частота согласных также была распределена довольно равномерно, за исключением некоторых более низких категорий частоты, например | TD | и | tSdZ |. Символ «#» обозначает частоту случаев, когда в конкретном ответе не было обнаружено архифонемы типа согласный или гласный.

Суммарная частота «одинаковой метки», в которой двигательные паттерны получили одинаковую интерпретацию в парных сеансах, нанесена красной линией.Суммарная частота возникновения «разных меток», в которой двигательные паттерны получили различную интерпретацию в парных сеансах, изображена синей линией. В обоих случаях ширина линии пропорциональна числам инцидентов.

Из рис. 9A видно, что для большинства произведений гласных Элии между английскими и немецкими опекунами существовала разумная договоренность в отношении маркировки. Суть разногласий заключалась в обозначении некоторых ответов как | & | англоговорящими, но как | A | и | O | немецкими.

Для согласных на рис. 9B толстая синяя линия показывает, что существует различие в интерпретации двигательных паттернов, результаты которых воспринимаются как | w | англоговорящими и | fv | немецкими. Этого следовало ожидать, учитывая отсутствие / w / на немецком языке.

Рис. 9C и 9D показывают сравнение интерпретаций, сделанных носителями английского и французского языков. Для гласных в 9C видно, что значительная часть звуков, обозначенных как | ie |, | A | и | УФ | английскими опекунами интерпретировались как | & | говорящими по-французски, предположительно отражая более широкий диапазон гласных, которые образуют эту категорию во французском языке.

Рис. 9E и 9F показывают сравнения между интерпретациями, сделанными немецкими и французскими говорящими. В гласных звуках, обозначенных как | A | говорящие на немецком языке часто обозначали как | & | говорящими на французском. Это говорит о том, что для низких и центральных звуков | A | и | & | категории соответственно, говорящие на французском и немецком языках имеют разные границы категориального восприятия.

Эксперимент 2 — Исследование вариабельности ответа одного лица, осуществляющего уход (n = 1)

Эксперимент 1 показал, что были некоторые различия в том, как лица, осуществляющие уход за детьми из английского, французского и немецкого языков, реагировали на одни и те же двигательные паттерны.В эксперименте 2 изучалась схожесть реакции воспитателя у одного и того же англоговорящего человека. Для сбора данных E4 выполнил задание ответа 4 раза в соответствии с процедурой, принятой в эксперименте 1. Между сеансами ответа оставались периоды в неделю, чтобы испытуемый не запомнил произведения Элии из предыдущего сеанса.

Визуализация ответа опекуна во время сеансов

Попарные сравнения категорий архифонемы первых гласных V 1 и согласных C 1 были проведены между всеми ответами для 4 сеансов этого единственного носителя английского языка.Затем эти попарные сравнения были суммированы, чтобы дать единый набор данных, чтобы представить поведение одного говорящего в течение нескольких сеансов. Эти сравнения показаны на рис. 10. Сравнение гласных и согласных показано на панелях A и B соответственно.

Рисунок 10. Отношения в ответах на английском, немецком и французском языках.

Результаты представлены в виде графика на рис. 9. Сравнение гласных и согласных A и B для одного носителя английского языка в течение четырех отдельных занятий. C&D Сравнение гласных и согласных между четырьмя разными носителями английского языка.E & F Сравнение гласных и согласных между двумя разными говорящими на немецком языке. G & H Сравнение гласных и согласных между двумя разными говорящими на французском языке.

https://doi.org/10.1371/journal.pone.0110334.g010

Мы также исследовали, как 4 разных англоговорящих человека реагируют на одни и те же двигательные паттерны. Сравнение гласных и согласных нескольких говорящих на английском и английском языках показано на панелях C и D соответственно. Сходство между двумя говорящими по-немецки и двумя говорящими по-французски показано на панелях E и F и G и H соответственно.

Высокая пропорция красного и синего цвета показывает, что один говорящий по-английски был постоянным на разных занятиях, тогда как разные говорящие на одном языке демонстрировали большее разнообразие в интерпретации высказываний Элайджи.

Общее сходство в группах

На рис. 11 показан график сравнения ответов лиц, осуществляющих уход, для семи различных экспериментальных групп, проведенных в терминах суммы составляющих гласных и согласных звуков архифонемы. Эти значения представляют собой сумму отсчетов, соответствующих красным линиям, показанным на фиг.9 и 10. Обратите также внимание на то, что сумма синих линий соответствует различиям в интерпретациях (что определяется как [100% -% то же самое]). Поэтому мы воздерживаемся от дополнительного построения значений процентной разницы, чтобы избежать избыточности.

Рис. 11. Сравнение ответов лиц, осуществляющих уход.

Сравнения производятся с точки зрения их архифонемных гласных и согласных компонентов. Эти значения соответствуют красным линиям, показанным на рис. 9 и 10. Панели A и B показывают сравнение ответов гласных и согласных соответственно: сходство в пределах одного носителя английского языка показано синей полосой, различное сходство говорящего для одних и тех же языковых групп показано зелеными полосами, а сходство между языковыми группами показано как желтые полосы.Планки погрешностей показывают 95% доверительный интервал.

https://doi.org/10.1371/journal.pone.0110334.g011

Полоски процентов на рис. 11 соответствуют сходству в маркировке в следующих группах:

  • Тот же англоговорящий, 4 занятия (английский-тот же × 4)
  • 4 англоговорящих (англо-английский)
  • 2 говорящих по-немецки (немецкий-немецкий)
  • 2 говорящих по-французски (франко-французский)
  • 4 говорящих по-английски и 2 по-немецки (английский-немецкий)
  • 4 англоговорящих и 2 франкоговорящих (англо-французский)
  • 2 говорящих по-немецки и 2 по-французски (немецкий-французский)

Отметим, что 95% доверительные интервалы на этих графиках, как правило, довольно малы из-за относительно большого количества подсчетов данных в каждом условии, за исключением сравнений между двумя говорящими на немецком языке и между двумя говорящими на французском языке.В этих сравнениях было только 2 говорящих в каждой группе, и, следовательно, было проведено только одно попарное сравнение. Из рисунка видно, что один-единственный говорящий по-английски очень согласован на всех сессиях с точки зрения как гласных, так и согласных. Сравнение гласных для разных носителей одной и той же языковой группы было более схожим, чем соответствующие сравнения для разных языковых групп.

Сравнение нескольких говорящих в языковых группах

Мы провели Z-тесты для сравнения различий в данных количества необработанных гласных и согласных между выбранными группами, показанными на рис.11.

Чтобы исследовать различия в маркировке носителей разных языков, мы сравнили сходство между носителями в пределах одной языковой группы со сходством между носителями в разных языковых группах.

Английские группы сравнения

«Одинаковая» пропорция гласных у разных носителей английского языка значительно отличалась от соотношения между англо-французским и англо-немецким сравнениями, с p <0,001:

Англо-английский по сравнению с англо-немецким = 9.11787

Англо-английский по сравнению с англо-французским, = 17,3888

«Одинаковая» пропорция согласных у разных носителей английского языка значительно отличалась от таковых в сравнении англо-немецких говорящих с p <0,001

Англо-английский по сравнению с англо-немецким, = 8,8926

Однако согласные у разных носителей английского языка существенно не отличались от согласных при сравнении говорящих на французском, то есть p> 0,05

Согласных англо-английский по сравнению с англо-французским, = -0.189129

Сравнение немецких групп

«Одинаковая» пропорция гласных у разных носителей немецкого значительно отличалась от соотношения между англо-немецкими и немецко-французскими говорящими, с p <0,001:

Немецко-немецкий по сравнению с англо-немецким, = 7,79693

Немецко-немецкий против немецко-французского = 9.28878

Доля согласных у разных говорящих по-немецки значительно отличалась от соотношения говорящих по-английски и по-немецки и по сравнению с говорящими по-немецки и по-французски, с p <0.001

Немецко-немецкий по сравнению с англо-немецким, = 3,9623

Немецко-немецкий по сравнению с немецко-французским, = 3,47732, p <0,001

Сравнение французских групп

«Одинаковая» пропорция гласных у разных франкоговорящих значительно отличается от соотношения между немецко-французскими и англо-французскими говорящими, с p <0,001

Французско-французский по сравнению с англо-французским, = 12,4145

франко-французских и немецко-французских = 9.48962

Доля согласных у разных носителей французского значительно отличалась от соотношения в сравнении говорящих на немецком и французском языках с p <0,001

франко-французских против немецко-французских = 4,16795

Доля согласных у разных носителей французского языка незначительно отличалась от соотношения в сравнении говорящих на английском и французском

Французско-французский в сравнении с англо-французским, = -0,377895, p> 0,05

Выводы результатов на разных языках

Сравнение гласных в ответах 4 разных англоговорящих людей значительно отличалось от сравнений между англо-немецкими и англо-французскими группами.То же самое было между двумя разными говорящими на немецком языке и англо-немецкой группой и немецко-французской группой. Два разных франкоговорящих пользователя и французско-немецкие сравнения и англо-французские сравнения также показали одинаковый эффект

Эти результаты показывают, что маркировка гласных была более похожей в пределах языковой группы, чем во всех языковых группах. Результаты по согласным звукам не были столь однозначными. Обозначение согласных было только более схожим внутри языковой группы, чем между языковыми группами при сравнении английского и немецкого, а также французского и немецкого.Маркировка согласных у носителей английского и французского языков не была более последовательной в каждой языковой группе, чем во всех остальных.

Разброс ответов в пределах 4 разных носителей английского языка, 2 разных носителей немецкого языка и 2 разных носителей французского языка показал, что собственная индивидуальная интерпретация воспитателя сыграла роль в этом процессе. Кажется вероятным, что такие различия в интерпретации возникли из-за того, что произведения Элайджи не были сосредоточены на фонематических категориях, и поэтому опекун должен был сделать интерпретацию, чтобы определить подходящую категорию.Этот процесс зависел от их личных предубеждений.

Таким образом, воспитатели продемонстрировали систематическую предвзятость в интерпретации выходных гласных Элайджи в рамках их родных языков, причем маркировка внутри языковой группы была значительно более похожей, чем маркировка для разных языковых групп.

Оценка устойчивости говорящего по-английски

Чтобы исследовать непротиворечивость одного говорящего, мы сравнили сходство внутри одной группы говорящих по-английски с другой группой говорящих по-английски.

Анализ показал, что «одинаковая» пропорция гласных между 4 повторениями одного человека, говорящего по-английски, значительно отличается от такового в разных группах носителей английского языка, с p <0,001:

Английский-Samex4 по сравнению с англо-английским, = 26,2974

«Одинаковая» пропорция согласных между 4 повторениями одного англоговорящего человека также значительно отличалась от другой группы носителей английского языка, с p <0,001:

Английский-Samex4 в сравнении с англо-английским = 24.8201

Статистика показывает, что один человек, говорящий по-английски, был очень последовательным в 4 разных сессиях, тогда как четыре разных англоговорящих участника показали значительно меньшее сходство. Поскольку многократные повторения одного носителя английского языка были значительно более последовательными, чем маркировка, сделанная разными носителями одного и того же языка, это указывает на то, что лица, осуществляющие уход, похоже, используют личные предубеждения во время процедуры маркировки.

Эксперимент 3 — Изучение слов на 3 языках путем последовательного подражания (n = 6)

Эксперимент 3 исследовал способность Элайджи учиться произносить слова.Используя его приобретенную способность анализировать входящие звуки речи в терминах эквивалентов его собственных токенов, воспитатели научили Элайджу произносить некоторые простые слова путем последовательного имитации. Элайджа сопоставил звуки в новых словах, которые были ему представлены, со звуками, которые он слышал в первом эксперименте взаимодействия, и использовал свои моторные ассоциации с последним, чтобы произнести слово.

В отдельных экспериментах шесть (n = 6) испытуемых, говорящих на трех языках (E1, E2, F1, F2, G1, G2), которые ранее участвовали в эксперименте 1 со звуковой реакцией, снова играли роль опекунов.Им было поручено научить Элайю некоторым простым словам на их родных языках: 219 английских, 219 французских и 237 немецких слов. Списки слов показаны в Приложении S3 в файле S1. Каждый воспитатель решал для себя, считают ли они свою попытку научить Элайджу новым словом успешной или нет, то есть была ли его попытка приемлемой имитацией их слова. В целом каждому воспитателю удалось научить его произносить от 40 до 72 (в среднем 55) слов.

Опытные фонетики аннотировали данные о произнесенных словах каждого воспитателя.Чтобы проанализировать словообразование Элайджи, мы использовали ответы воспитателя, соответствующие двигательным паттернам, используемым Элайджей для имитации слова. Последний был аннотирован ранее для сравнения ответов. Затем, как и раньше, извлекались компоненты архифонемы согласных и гласных. Из наблюдения за процессом взаимодействия было очевидно, что, меняя манеру разговора, воспитатели иногда могут спровоцировать лучшую реакцию Элайджи.

На рис. 12 показаны слова, которые выучил Элия на трех языках.Результаты для лиц, осуществляющих уход, говорящих на английском, французском и немецком языках, показаны для субъектов E1 и E2, F1 и F2 и G1 и G2 соответственно. В левом столбце орфографически указано слово, в среднем столбце — фонематическая транскрипция окончательного произведения опекуна, а в правом столбце — фонематическая транскрипция тех ответов опекуна (переформулировки), которые Элия узнал в целевом слове, а затем использовал для напоминания двигательные паттерны для создания имитации. Конечно, высказывание Элайджи не походило на высказывание опытного оратора, поскольку звуки его речи не были так категорично определены, как звуки зрелого говорящего на L1.

Рис. 12. Примеры слов, которые выучил Элия.

Результаты для 2 предметов, говорящих на английском, французском и немецком языках, показаны для предметов E1 и E2, F1 и F2 и G1 и G2 соответственно. В левом столбце указывается целевое слово, а в среднем столбце — фонематическая транскрипция окончательной целевой продукции лица, осуществляющего уход. Правый столбец — фонематическая транскрипция переформулировок опекуна, соответствующих подражаниям Илии.

https: // doi.org / 10.1371 / journal.pone.0110334.g012

Чтобы сравнить целевые слова, созданные опекунами, со словами, созданными Элайджей в ответ, мы сравниваем архифонемное представление первого и второго. Мы напрямую расшифровали слова опекунов. Однако по причинам, описанным ранее, мы не транскрибируем вокализации Элайджи, а вместо этого используем транскрипцию звуков (переформулировок), сделанных опекунами, которые они считали эквивалентными.

На рис. 13 показаны эти сравнения (между звуками речи в словообразовании опекунов и интерпретацией опекунами звуков речи в имитациях Элии).Последние уже были помечены ранее, поскольку они были установлены во время первого эксперимента по взаимодействию. Звуки речи анализировались по первым гласным V 1 и согласным C 1 . Результаты представлены индивидуально для каждого из 6 лиц, осуществляющих уход. Эти данные анализируются далее в Приложении S4 в файле S1.

Рисунок 13. Сравнение отдельных предметных слов для английского, французского и немецкого языков.

Сравнения архифонемных представлений целевых слов воспитателя и имитаций Элайи.Отдельные динамики показаны на шести панелях E1 и E2, F1 и F2 и G1 и G2 соответственно. Транскрипции целевого слова лица, осуществляющего уход, преобразованные в категории архифонемы, показаны на левой стороне каждой диаграммы. Подражания Элии были обозначены в терминах архифонемы компонентных ответов, из которых они построены. Они показаны справа на каждой диаграмме.

https://doi.org/10.1371/journal.pone.0110334.g013

Звуковые файлы текстовых произведений воспитателей и имитаций Эджиджи доступны в Интернете по адресу https: // github.ru / HowardLab / Elija-PlosOne-2014. Подробная информация об этом онлайн-хранилище данных описана в Приложении S5 в файле S1.

Обсуждение

Резюме

Используя компьютерную модель, которая начинает свое развитие без речевых навыков, но с общими способностями, аналогичными младенческим, мы показали, что для того, чтобы маленькие дети научились произносить слова, основным элементом изучения речевых звуковых соответствий не обязательно должно быть подражательный процесс со стороны ребенка.Вместо того, чтобы использовать акустическое сопоставление, как обычно предполагается, Элайджа связывает свои голосовые действия со звуками речи, которые он слышит в ответ на них. Это стало возможным благодаря отражению поведения со стороны опекуна, наблюдаемого в естественных ситуациях и отображаемого (без коучинга) в наших экспериментах. Взаимодействие выборочно усиливает диапазон возможных речевых звуков Элайджи, а ассоциации, которые он создает из ответов опекуна, позволяют ему разработать инвентарь моторных паттернов и соответствий звуков речи.Таким образом, поведение его опекунов позволяет ему разработать первую модель произношения L1.

Было обнаружено, что, когда лицо, осуществляющее уход, считало естественным отвечать, непредсказуемая форма реакции на звук, который обнаружил Элайджа, почти всегда была переформулировкой высказывания Элайджи в правильно сформированные звуки L1 (а иногда и попыткой имитировать его выход). Природа моторных / звуковых ассоциаций была определена на основании оценки звукового сходства (или эквивалентности), сделанной лицом , осуществляющим уход, , а не Элайджей.Это основная разница между нашим изложением и теориями акустического соответствия развития звуков речи.

В нашем исследовании отдельные экземпляры Элия научились произносить простые слова на английском, французском и немецком языках. Наше описание этого аспекта овладения речью демонстрирует свою эффективность и независимость от языка. Элайджа — первая модель, которая достигла этого (1) с использованием естественных и хорошо подтвержденных социальных взаимодействий, (2) с учетом исходных перцептивных, продуктивных и ассоциативных механизмов, которые явно не превосходят таковых у человеческого младенца, и (3) без преждевременных фонетических взаимодействий. умение оценивать сходство своей речи и речи воспитателя.

Трехступенчатый режим

У настоящего младенца три стадии обучения, смоделированные отдельно в Элии, будут перекрываться. В этом исследовании этапы — обнаружение звука без присмотра, первые эксперименты со звуковой реакцией и эксперименты с имитацией последнего слова — были разделены по трем причинам. Во-первых, это позволило сохранить время взаимодействия с опекунами в практических пределах. Во-вторых, все лица, осуществляющие уход, слышали одни и те же звуки, чтобы можно было сравнить их ответы.В-третьих, на двух этапах взаимодействия он избегал необходимости интерпретировать природу данного взаимодействия обеим сторонам (Элайджа и опекун), поскольку это однозначно фиксировалось в контексте каждого из экспериментов: либо вовлечение опекуна в ответ на высказывание, либо в словесном обучении.

В принципе Elija можно запускать с перекрытием этапов и информированием друг друга. Это моделирует тот факт, что начальные двигательные паттерны могут формировать отправные точки для последующего открытия двигательных паттернов, и что двигательные паттерны могут изменяться со временем.Такая операция потребует дополнительных механизмов в модели Элайджи, чтобы обнаруживать и действовать в контексте данного взаимодействия. То есть Элайджа нужно будет интерпретировать намерения опекуна и, таким образом, использовать любое данное взаимодействие соответствующим образом.

Результаты ответа

Чтобы количественно оценить поведение опекуна во время экспериментов по взаимодействию, мы не пытались напрямую транскрибировать производственные данные Элайджи, поскольку это, как известно, проблематично при изучении развития речи [30].Вместо этого мы проанализировали постановки Элайджи с точки зрения их соответствующих ответов воспитателей.

Наши результаты показывают, что испытуемые считали естественным реагировать на большинство двигательных паттернов, созданных Элайджей, и почти всегда делали это с ответами, которые были хорошо сформированы в L1 и, следовательно, представляли ценность для Элайджи в последующем эксперименте по изучению слов.

Можно спросить, почему изменение рецептуры является предпочтительной реакцией лиц, осуществляющих уход. Одна из причин может заключаться в том, что воспитатели приписывают младенцам «полностью человеческие способности к социальному реагированию: с желаниями, намерениями и чувствами, которые можно передать» [57].Таким образом, реакция L1 может казаться естественной, даже если стимул от младенца еще не является лингвистическим.

Более того, для высококвалифицированного говорящего на L1 практически не составляет труда воспроизводить звуки речи, так что всякий раз, когда это будет сочтено целесообразным, легко будет сделать переформулировку. Какими бы ни были причины, интересно отметить, что опекуны Элайджи действительно вели себя подобным образом по отношению к нему, несмотря на то, что Элайджа не был их собственным ребенком и даже не был настоящим ребенком. Мотивация взрослых к переформулировке продукции младенца кажется довольно сильной.

Сравнение наших результатов с исследованиями на людях

Исследования естественных диад воспитатель-младенец, относящиеся к этим экспериментам с Элайджей, охватывали возраст от 2 до 4 месяцев (17 пар) [58], от 2 до 6 месяцев (15 пар) [59], от 4 до 11 месяцев (8 пар). [60], от 9 до 19 месяцев (6 пар) [61] и от 12 до 21 месяца (3 пары) [62]. Поведение как воспитателей, так и младенцев, о которых сообщается в этих исследованиях, согласуется с моделью Элайджи, согласно которой дети учатся решать проблему соответствия, имитируя детские вокализации воспитателем.Сообщается, что такие имитации лиц, осуществляющих уход, распространены повсеместно, происходят с большой частотой и более распространены, чем имитации высказываний лиц, осуществляющих уход за ребенком,. Мы отмечаем, что этому хорошо задокументированному и широко признанному явлению не отводится какая-либо роль в современной теории развития речи, в том числе в расчетах акустического соответствия, но он составляет основу модели Элайджи, полученной из наблюдений и теоретизирования Гаттегно [27], а также работы группы Асада [24].

Данные

Pawlby [60] могут пролить свет на поведение субъекта E3 в нашем исследовании, который отличался от других наших субъектов, переформулировав около 60% двигательных паттернов, на которые он реагировал, и имитируя около 40%.Полби проанализировал имитационный обмен по пяти модальностям, включая ее группу III, звуки речи (гласные, ранние и поздние согласные) и группу IV, неречевые звуки (хныканье, смех, малина и т. Д.). В последовательностях «младенец-мать» Полби записал 625 случаев, когда матери имитировали звуки детской речи (Группа III) и 261 случай, когда матери имитировали неречевые звуки (Группа IV). (Было намного меньше последовательностей мать-младенец: младенцы имитировали 60 речевых звуков, издаваемых их матерями, и 16 неречевых звуков.)

Если мы приравняем переформулировку и имитацию ответов нашего субъекта E3 к группам III и IV Полби соответственно, его поведение находится в пределах диапазона, который она наблюдала в своих восьми диадах. Возможно, поэтому, он думал, что Элайджа находится примерно в том же возрасте, что и Полби, и ответил соответствующим образом, в то время как другие субъекты считали Элайджу старше, что дало ему больше возможностей для лингвистического общения и адекватно на это реагировало.

Обширное исследование

Pawlby позволяет провести сравнение имитации вокальных актов и других действий.Она обнаружила сходство между всеми формами имитации, вокальной и неголосовой, и, в соответствии со всеми другими исследованиями, упомянутыми выше, обнаружила, что «имитация матерью действий младенца является гораздо более частым явлением, чем имитация младенцем своих действий». поступки его матери. Именно младенец с большей вероятностью инициирует последовательность, а его мать ответит имитацией. «В целом Полби интерпретировал ее результаты как указание на то, что» весь процесс, с помощью которого младенец приходит к явному намеренному подражанию своей матери, коренится в первоначальная готовность матери подражать собственному младенцу.«Модель Элайджи является примером этой парадигмы обучения.

Различия в поведении лиц, осуществляющих уход

Во время процесса зеркалирования некоторые лица, осуществляющие уход, отвечали чаще, чем другие, демонстрируя, что между людьми существует различие в их пороговом критерии для ответа.

Компоненты гласных (архифонема) в ответах лиц, осуществляющих уход, чаще были похожи на компоненты других носителей данной языковой группы, чем на компоненты других языковых групп.Например, ответы английских опекунов на звуки Элайи были более стабильно похожи на ответы других англоговорящих по качеству гласных, чем на ответы немецких и французских опекунов. Таким образом, по крайней мере в отношении качества гласных, воспитатели продемонстрировали значительную систематическую предвзятость при интерпретации результатов Элайджи в рамках их L1.

Качество гласных и согласных в ответах одного и того же англичанина, осуществляющего уход за 4 отдельными сессиями, было очень похоже, двигательный паттерн за двигательным паттерном.Тем не менее, было значительно больше интерпретаций данного двигательного паттерна среди разных лиц, ухаживающих за английским. Это говорит о том, что различия в ответах у разных носителей одной и той же языковой группы могли возникнуть из-за разных систематических интерпретаций, а не из-за лежащего в основе шумного процесса. Объяснить это можно категоричным восприятием речи, поскольку постановки Элайджи никоим образом не ограничивались тем, что они были хорошими образцами L1. Следовательно, многие звуки опекун отнес бы к тому, что он или она считал «достаточно хорошей» категорией.Их суждения по этому поводу, безусловно, были бы разными.

Заучивание слов путем последовательного подражания

В последнем эксперименте изучение слов проводилось с использованием отдельной стадии имитации, предполагающей, что репертуар двигательных паттернов / звуковых реакций уже был установлен. Выполнение этого этапа отдельно от этапа реагирования было эффективным с экспериментальной точки зрения, поскольку это означало, что ни Элайджа, ни лицо, осуществляющее уход, не нуждались в интерпретации контекста взаимодействий.Шесть воспитателей смогли научить Элайджу произносить в среднем 55 типичных первых слов на их языках.

Процесс последовательной имитации основывался на том, что распознаватель Элайджи оценивал высказывания опекуна с точки зрения звуков, которые Элайджа слышал раньше. Это было реализовано с использованием динамического преобразования времени (DTW). Однако высокопроизводительного распознавания звука речи на основе ограниченных обучающих данных трудно достичь без априорных знаний . Таким образом, способность Элайджи распознавать была ниже, чем мы ожидали бы от человеческого младенца.Иногда это приводило к неправильной интерпретации речи опекуна. Однако, хотя Элайджа иногда допускал такие ошибки, опекун также мог исправить их, поскольку она могла побудить его сделать еще одну попытку узнавания или даже снова заговорить, пока он не сгенерировал соответствующий ответ (см. Рис. 4). Аналогичное поведение лиц, осуществляющих уход, наблюдается в естественных условиях.

Элайджа не всегда создавал формы имитации, которые точно соответствовали бы его опекуну, поскольку его репертуара двигательных паттернов было недостаточно для этого.Однако он достиг уровня успеваемости, сравнимого с показателями маленьких детей в возрасте от одного до двух лет.

Феномен переформулирования

Переформулировка была ключевым источником информации, использованной Элайджей, чтобы научиться произносить, а затем выучить произношение слов [28]. В нашем описании младенец узнает о лингвистическом значении своих высказываний (прежде всего воспринимаемых им как двигательные паттерны) через их переформулировку своим опекуном. «Зеркальная» структура такого взаимодействия уже знакома ему по более раннему этапу развития, когда воспитатель, как полагают, служит аффективным зеркалом для маленького младенца [63].Иногда это подразумевает, что опекун отражает поверхностные характеристики своего поведения, но все чаще [64] то, что она отражает, является выражением ее интерпретации его внутреннего состояния (так называемая «аффективная настройка» [65]). В вокальном контексте имитация ответа аналогична первой и переформулировка второй. Когда они переформулировали его голосовые действия, опекуны Элайджи действовали как фонологическое зеркало, представляя ему то, что они сочли эквивалентами L1 определенных двигательных паттернов.Это решение проблемы соответствия затем позволило Элии учить слова путем последовательной имитации составляющих их речевых звуков.

Подтверждающие доказательства и более широкие последствия

Несколько сходящихся направлений исследований согласуются с моделью Элайджи. Гаттеньо сообщил о натуралистических наблюдениях за младенцами, которые учатся говорить, в поддержку своего предположения, что младенцы учатся произносить не путем имитации, а скорее посредством экспериментов, которые оцениваются и вознаграждаются их опекунами [27].Мессум [8] описал другие экспериментальные и теоретические подтверждения этой альтернативной парадигмы.

Совсем недавно исследования изменения речевой обратной связи предоставили экспериментальные доказательства отсутствия акустической саморегуляции речевого вывода у младенцев [9] и даже у некоторых взрослых [10]. Эти наблюдения явно противоречат нынешнему предположению о том, что имитация — это механизм, с помощью которого младенцы учатся произносить звуки речи, образующие элементы, из которых состоят слова [11].Идея об отсутствии саморегуляции речевого образования у младенцев, однако, согласуется с хорошо известной аномалией детской речи, феноменом «рыба / рыба» [12], [13]. Здесь ребенок произносит «рыба» как «фис», и когда его спрашивают, почему он это сделал, он настаивает, во-первых, на том, что он может слышать различие между двумя формами, сделанными взрослым, и, во-вторых, что он сам не сказал неправильную форму. . Такое поведение нельзя удовлетворительно объяснить с помощью имитационных описаний овладения речью, требующих от младенца выполнения акустического сопоставления, но оно согласуется с моделью Элии и отсутствием саморегуляции, наблюдаемым у младенцев.Очевидно, что если младенец не саморегулируется или не может саморегулироваться на основе своей акустической мощности, он не будет осознавать ее акустическую форму и то, что его произношение неверно. Вот что наблюдается.

Поддержка альтернативной парадигмы Гаттеньо в развитии речи также исходит из демонстрации неголосового обучения молодых самцов коровьих птиц, обучающихся пению не поющими самками [66]. Аналогичным образом, в исследованиях на людях, ряд экспериментов с младенцами показал, что поведение воспитателя воспринимается и используется молодыми учениками для создания более продвинутых форм вокализации [56].

Один из самых основных и давних вопросов о речи заключается в том, представлена ​​ли она в мозге в первую очередь как мотор или как акустический феномен: это «жесты, которые становятся слышимыми» [67] или акустический код? Наше предложение выходит за рамки нынешних терминов, в которых сформулированы эти дебаты: вместо простого механизма (имитации), ведущего к сложной и противоречивой нейронной организации любого рода, мы предлагаем, чтобы механизм обучения, включающий зеркальное отображение со стороны социального партнера, приводил к прямому представлению это по своей сути моторно-перцептивное восприятие.В этом процессе ни производство, ни восприятие не более примитивны, чем другие. Это понимание разрешает ряд давних проблем речи [8].

Почему японцы не приняли полностью фонетическую алфавитную систему?

Хорошее объяснение.
Значит, в основном они придерживаются кандзи, потому что слишком много слов звучат одинаково ?.
Но вы знаете, точно так же, как и в английском языке, где хонофоны пишутся по-разному, и тогда люди могут мгновенно различать их после знакомства с их разным написанием, и они могут легко преодолеть это, изобретая несколько специальных символов, чтобы отличить их.
Например, し ょ う с кружком наверху будет означать только «малость» / し ょ う с прямой линией наверху будет означать только «болезнь» / し ょ う с волнистой линией наверху будет означать только «командир» и так далее, и точно так же, как говорящий по-английски сразу видит разницу между «рекламировать» и «добавить», так что говорящие по-японски легко это увидят
Да, им придется запоминать эти особые слова-омофоны, но это, безусловно, легче, чем запоминать тысячи кандзи.

Предлагаемое вами решение для облегчения исключения кандзи состоит в том, чтобы сделать кана более сложной, и, как указал @Toritoribe, по существу заново изобрести бушу, одну из тех вещей, которые делают кандзи настолько полезными в первую очередь?

Вероятно, потому что вы не изучаете японский язык и не понимаете, как работают кандзи, вы, кажется, работаете в предположении, что для того, чтобы выучить кандзи, нужно запомнить все кандзи как отдельные символы, как какой-то чудовищный алфавит.Если бы это было так, кандзи, вероятно, давно бы отменили …

… Но они все еще существуют. 124 миллиона японцев и по крайней мере миллион не носителей языка используют его. И многие из тех, кто выучил это, могут признать, что это было сложно, но очень немногие из них, похоже, думают, что отмена кандзи — хорошая идея. Возможно ли, что они знают то, чего не знаете вы?

Чем больше вы изучаете и понимаете кандзи, тем больше вы понимаете , как изучать иероглифы, которые связаны с соединением нейронов, формированием реляционных воспоминаний между персонажами и их составными частями, а также словами, в которых они появляются.Вы не изучаете это наизусть, вы изучаете это через экспозицию и соотносите это с тем, что вы уже узнали. Вы узнаете, как визуально разделить его на составные части, чтобы понять, что может означать персонаж, и поместить его в контекст, в котором вы его видите, чтобы закрепить это в своем сознании. Вы узнаете, что этимология слова встроена в само слово. Когда вы выучите кандзи, вы научитесь ценить и уважать его. Вы, кажется, не многому научились, поэтому не испытываете особого уважения.

Сами по себе омофоны не обязательно являются целым словом, но разные кандзи могут иметь одно и то же прочтение, которое может быть трудно отличить друг от друга. Одной из самых полезных фраз при изучении новой лексики в контексте была фраза X の Y. Допустим, вы впервые слышите слово 感激 (か ん げ き), вы можете небрежно спросить своего друга (это помогает понять, что говорящие идентифицируют кандзи, о которых идет речь, не видя их):

Вы: 感激 の 「か ん」 は 何 漢字? 漢字 の 「漢」 れ か 観 光 の 「観」 の 「」?
Что такое кан в слове «кангэки»? Это «кан» в «иероглифах» или «кан» в «канкоу / туризм»?

Друг:.?. い い え, 「感 じ る」 と か 「感想」 の 「か ん」 「い い 感 じ」 っ て い う だ ろ う そ れ と 同 じ
Нет, это «кан» в «kanjiru / чувствовать» и «кансу / мысли.«Вы знаете, как мы говорим« ии иероглиф / чувствует себя хорошо? ». Это тот. stage »?

Друг: 違 う。 訓 読 み は「 し い 意味 ご 」近 い ん だ。
Нет, это другое, значит / также читается как« Hageshii / Intense. похоже на «сугоку / чрезвычайно».

Вы: へ ぇ 、 じ ゃ あ て 激 し く 感動 す る っ て こ と?
Ох, так кангэки означает «Быть ​​очень /

тронутым чем-то?» Друг: 当 た り。
Вот и все!

Итак, в этом разговоре вы выучили новое слово и его значение, связав составляющие его символы с другим уже знакомым вам словарным запасом, что укрепляет и расширяет ваш словарный запас, создавая новые связи между словами.Такой разговор происходит постоянно, и даже коренные жители используют его, пытаясь определить географические названия или когда объясняют, как что-то написать по телефону. Вы можете представить, что по мере роста вашего словарного запаса вы меньше полагаетесь на механическое запоминание и начинаете изучать новые символы в контексте, что гораздо эффективнее для обеспечения запоминания. Этого нельзя сделать, если убрать кандзи из уравнения.

Этот аргумент многократно обсуждался, и многие люди, кажется, думают, что они знают, как лучше структурировать чужой язык, но когда вы смотрите на их аргументы, они обычно сводятся к «кандзи есть / был / мне кажется трудным, поэтому его не следует использовать «, и предлагаемое ими решение оставляет японский язык более бедным.

Итак, можно ли писать на японском только с помощью каны? Может ли язык кардинально и быстро измениться в национальном масштабе? Конечно, Корея отказалась от ханджи и изменила свою систему письма в середине 20-го века, и вы больше не видите китайских иероглифов, а во Вьетнаме сейчас используется модифицированный алфавит … Но оба этих языка находятся под сильным влиянием китайского, и знание этих иероглифов требует важно понимать этимологию своих языков. Таким образом, в Корее «китайский» по-прежнему является обязательным предметом, как если бы англоговорящие люди должны были изучать греческий и латынь.Вьетнам, похоже, отошел от Чу Нома согласованными усилиями. И конечно же, стремясь сделать Ханьцзы более доступным и повысить уровень грамотности, Китай ввел упрощенный набор символов в КНР. Но даже тоталитарный режим не может контролировать всех, и поэтому он, возможно, оказал некоторое предполагаемое влияние на материк, теперь у него есть похожий, но другой набор символов из Гонконга и Тайваня, и кандзи в Японии и ханджа. в Корее и Chữ Nôm во Вьетнаме.

NLP: построение конвейера очистки текста и предварительной обработки | Динеш Ядав

Обработка естественного языка, сокращенно НЛП, — это подполе машинного обучения / ИИ, которая занимается лингвистикой и человеческими языками.НЛП занимается взаимодействием между компьютерами и человеческими языками. Другими словами, он позволяет и программирует компьютеры, чтобы понимать человеческие языки, а также обрабатывать и анализировать большие объемы данных на естественном языке.

Но прежде чем компьютерная программа сможет понять и интерпретировать человеческий язык, большая часть предварительной обработки выполняется за кулисами. Вы когда-нибудь задумывались, что происходит за кулисами анализа тональности, классификации текста, анализа твитов и т. Д.? Благодаря предварительной обработке программы могут легко преобразовывать язык или текст в более усвояемую форму, чтобы алгоритмы машинного обучения могли работать лучше.

Чаще всего они используются при анализе тональности, классификации обратной связи, переводе, обобщении и т. Д. Во многих случаях этапы предварительной обработки повышают точность алгоритмов. Обычно входные данные представлены в естественной форме, то есть в формате текста, предложений, комментариев, абзацев, твитов и т. Д. Прежде чем такой ввод может быть передан в алгоритмы машинного обучения, он нуждается в некоторой очистке или предварительной обработке, чтобы алгоритмы может сосредоточиться на главных / важных словах, а не на словах, которые придают минимальную ценность или не имеют никакой ценности.
Достаточно сказать, давайте углубимся в методы предварительной обработки НЛП. В этом примере я использую python в качестве языка программирования.

Часто неструктурированный текст содержит много шума, особенно если вы используете такие методы, как веб-сканирование или очистка экрана. HTML-теги, как правило, являются одним из этих компонентов, которые не имеют особой ценности для понимания и анализа текста, поэтому их следует удалить. Мы будем использовать библиотеку BeautifulSoup для очистки тегов HTML.

 # импорт 
из bs4 import BeautifulSoup # функция для удаления тегов HTML
def remove_html_tags (text):
return BeautifulSoup (text, 'html.parser '). get_text () # call function
remove_html_tags (' \

Заголовок статьи

\

Первое предложение важной статьи. И еще одно. А потом последнее < / p> ')

Вывод:

' Заголовок статьи Первое предложение важной статьи. И еще один. И последний: 

Знаки с ударением — важные элементы, которые используются для обозначения акцента на определенном слове во время произношения или понимания.В некоторых случаях знак ударения также поясняет значение слова, которое может быть другим без ударения. Хотя их использование на английском языке в значительной степени ограничено, есть очень хорошие шансы, что вы встретите акцентированные символы / буквы в свободном текстовом корпусе. Такие слова, как резюме , кафе, протест, развод, согласование, разоблачение, латте и т. Д.

Акценты могут возникать из-за настроек клавиатуры по умолчанию или стиля набора текста. Работа с акцентированными символами становится все более важной, особенно если вы хотите анализировать только английский язык.Следовательно, нам нужно убедиться, что эти символы преобразованы и стандартизированы в символы ASCII. Простой пример — преобразование é в e.

 # import 
import unicodedata # функция для удаления акцентированных символов
def remove_accented_chars (текст):
new_text = unicodedata.normalize ('NFKD', text) .encode ('ascii', 'ignore'). Decode ('utf- 8 ',' ignore ')
return new_text # call function
remove_accented_chars (' Sómě Áccěntěd těxt. Некоторые слова, такие как резюме, кафе, протест, развод, согласование, разоблачение, латте.')

Вывод:

' Текст с диакритическими знаками. Некоторые слова, такие как резюме, кафе, протест, развод, согласование, разоблачение, латте ». 

Сокращения — это сокращенные версии слов или слогов. Они создаются путем удаления одной или нескольких букв из слов. Часто более слов объединяются, чтобы создать сокращение. В письменной форме апостроф используется для обозначения места пропущенных букв. В английском языке / тексте сокращения часто встречаются в письменной или устной форме.

В настоящее время многие редакторы по умолчанию вызывают сокращение. Например, не нет, я бы Да, вы , вы . Преобразование каждого сокращения в его развернутую исходную форму помогает стандартизации текста.

Для удаления сокращений я использую стандартный набор сокращений, доступный в библиотеке сокращений.

 # импортирует 
из сокращений import CONTRACTION_MAP # из сокращений.py
import re # функция для раскрытия сокращений
def expand_contractions (text, map = CONTRACTION_MAP):
pattern = re.compile ('({})'. format ('|' .join (map.keys ())), flags = re.IGNORECASE | re.DOTALL)
def get_match (сокращение):
match = contction.group (0)
first_char = match [0]
расширено = map.get (соответствует) if map.get (соответствует) else map.get (match.lower ())
расширенный = first_char + расширенный [1:]
развернутый возврат new_text = pattern.sub (get_match, text)
new_text = re.sub ("'", "", new_text)
return new_text # call function
expand_contractions («Я бы сказал, что сокращения, которые вы расширили, не думайте.»)

Вывод:

' Вы все я бы схваток вы расширены не думаю. 

Другой способ:

 # импорт 
из pycontractions import Contractions
cont = Contractions (kv_model = model)
cont.load_models () # функция для расширения сокращений
def expand_contractions (text):
text = list (cont. a-zA-z0-9.,!? /:; \ "\ '\ s]'
return re.sub (pat, '', text)

# вызов функции
remove_special_characters (« 007 Не уверен @, если это% было #fun! 558923 Что делать # вы думаете ** об этом.? 500 долларов США! »)

Вывод:

 '007 Не уверен, было ли это весело! 558923 Что вы думаете об этом? 500 долларов США!' 

Как вы видели выше, текст сохраняется. Но иногда это может не потребоваться. Поскольку мы имеем дело с текстом, число может не добавить много информации для обработки текста.a-zA-z.,!? /:; \ «\ ‘\ s]’
return re.sub (pattern, », text)

# вызов функции
remove_numbers (« 007 Not sure @ if this% was # весело! 558923 Что вы # думаете об этом **? $ 500USD! ”)

Вывод:

 'Не уверен, было ли это весело! Что вы думаете об этом.? USD!' 

Это можно исправить, удалив специальные символы. Удаление знаков препинания довольно просто. Этого можно добиться, используя string.punctuation и сохранив все, чего нет в этом списке.

 # import 
import string # функция для удаления знаков препинания
def remove_punctuation (text):
text = '' .join ([c вместо c в тексте, если c не в строке.punctuation])
return text # вызов функции
remove_punctuation ('Статья: @ Первое предложение какой-то {важной} статьи с множеством ~ знаков препинания. И еще одно ;!')

Результат:

 'Статья Первое предложение какой-то важной статьи с большим количеством знаков препинания И еще одно '

Стебель — это процесс сокращения флексионных / производных слов до их основы слова, основы или корневой формы.Основа не обязательно должна совпадать с исходным словом. Существует множество способов выполнения стемминга, таких как таблица поиска, алгоритмы удаления суффиксов и т. Д. Они в основном полагаются на отсечение ‘s’, ‘es’, ‘ed’, ‘ing’, ‘ly’ и т.д. с конца слов, а иногда и преобразование нежелательно. Но, тем не менее, стемминг помогает нам стандартизировать текст.

 # import 
import nltk # функция для стемминга
def get_stem (text):
stemmer = nltk.porter.PorterStemmer ()
text = ''.join ([stemmer.stem (слово) в слово в text.split ()])
return text # call function
get_stem ("мы едим и плаваем; мы ели и плавали; он ест и плавает; он ел и плавал »)

Вывод:

 'мы едим и плаваем; мы ели и плавали; он ест и плавает; он ел и плавал '

Хотя стемминг и лемматизация порождают корневую форму изменяемых / желаемых слов, но лемматизация — продвинутая форма стемминга. Образование стемминг может не привести к фактическому слову, тогда как лемматизация выполняет преобразование должным образом с использованием словаря, обычно стремясь удалить только флективные окончания и вернуть базовую или словарную форму слова, известную как лемма.

Прежде чем использовать лемматизацию, мы должны знать, что она значительно медленнее, чем стемминг, поэтому следует помнить о производительности, прежде чем выбирать стемминг или лемматизацию.

 # import 
import spacy
nlp = spacy.load ('en', parse = True, tag = True, entity = True) # функция для удаления специальных символов
def get_lem (text):
text = nlp (text)
text = '' .join ([word.lemma_ if word.lemma_! = '-PRON-' else word.text for word in text])
return text # call function
get_lem ("мы едим и плаваем; мы ел и плавал; ел и плавал; ел и плавал ")

Вывод:

 'мы будем есть и плавать; мы должны есть и плавать; он ест и плавает; он ел и плавал '

Стоп-слова часто добавляют к предложениям, чтобы сделать их грамматически правильными, например такие слова, как a, is, an, the и и т. д.Эти игнорируемые слова имеют минимальное значение или не имеют значения и доступны в большом количестве в открытых текстах, статьях, комментариях и т. Д. Их следует удалить, чтобы алгоритмы машинного обучения могли лучше сосредоточиться на словах, которые определяют значение / идею текста. Мы используем список из nltk.corpus , и этот список может быть дополнительно расширен путем добавления или удаления пользовательских слов в зависимости от ситуации.

 # import 
import nltk
from nltk.tokenize import ToktokTokenizer
tokenizer = ToktokTokenizer ()
stopword_list = nltk.corpus.stopwords.words ('english')
# custom: удаление слов из списка
stopword_list.remove ('not') # функция для удаления игнорируемых слов
def remove_stopwords (text):
# преобразование предложения в токен слов
tokens = tokenizer.tokenize (текст)
tokens = [token.strip () для токена в токенах]
# проверка в нижнем регистре
t = [токен для токена в токенах, если token.lower () отсутствует в stopword_list]
text = ''. join (t)
return text # call function
remove_stopwords («Я сам являюсь списком запрещенных слов, и эта статья не должна удаляться»)

Вывод:

 «Статья списка запрещенных слов не удалена» 

Лишние пробелы и табуляции делают не добавлять никакой информации в обработку текста.\ s * | \ s \ s * ‘
return re.sub (pattern,’ ‘, text) .strip () # call function
remove_extra_whitespace_tabs (‘ В этой веб-строке есть \ t лишние \ t табуляции и пробелы ‘)

Вывод:

 'В этой веб-строке есть несколько дополнительных вкладок и пробелов' 

Изменить регистр на более низкий можно с помощью функции lower.

 # функция для удаления специальных символов 
def to_lowercase (text):
return text.lower () # вызов функции
to_lowercase ('ConVert THIS string to LOWER cASe.')

Вывод:

' преобразовать эту строку в нижний регистр. ' 

Некоторые из этих шагов можно объединить в один шаг. Также обратите внимание, что некоторые из них могут не потребоваться в зависимости от контекста и требований. Кроме того, мы можем определить новую функцию, инкапсулирующую все вышеупомянутые функции предварительной обработки, чтобы сформировать конвейер нормализатора текста. Эти шаги должны дать вам хорошее представление о том, как построить стратегии очистки и предварительной обработки. После этих шагов предварительной обработки корпус текста готов для алгоритмов НЛП, таких как Word2Vec, GloVe и т. Д.Эти этапы предварительной обработки определенно улучшат точность модели.

Надеюсь, вам понравилась эта статья, и если да, то сообщите об этом в комментариях. Если вы хотите поделиться какими-либо предложениями по любому подходу, не стесняйтесь говорить об этом в комментариях, и я сразу же вернусь.

6.2 Представление значений (VR)

AE

Прикладной объект

Строка символов, которая идентифицирует объект приложения, при этом начальные и конечные пробелы (20H) не имеют значения.Значение, состоящее только из пробелов, не может использоваться.

Набор символов по умолчанию, за исключением кода символа 5CH (BACKSLASH «\» в ISO-IR 6) и управляющих символов LF, FF, CR и ESC.

16 байт максимум

AS

Возрастная строка

Строка символов одного из следующих форматов — nnnD, nnnW, nnnM, nnnY; где nnn должно содержать количество дней для D, недель для W, месяцев для M или лет для Y.

Пример: «018M» соответствует возрасту 18 месяцев.

«0» — «9», «D», «W», «M», «Y» стандартного набора символов

4 байта фиксировано

AT

Тег атрибута

Упорядоченная пара 16-разрядных целых чисел без знака, которая является значением тега элемента данных.

Пример: Тег элемента данных (0018,00FF) будет закодирован как последовательность из 4 байтов в синтаксисе передачи с прямым порядком байтов как 18H, 00H, FFH, 00H и в синтаксисе передачи с прямым порядком байтов как 00H, 18H, 00H, FFH.

Примечание

Кодирование значения AT точно такое же, как кодирование тега элемента данных, как определено в разделе 7.

не применимо

4 байта фиксировано

CS

Кодовая строка

Строка символов с начальным или конечным пробелом (20H), не имеющая значения.

Прописные буквы, «0» — «9», символ ПРОБЕЛ и подчеркивание «_» из набора символов по умолчанию

16 байт максимум

DA

Дата

Строка символов в формате ГГГГММДД; где YYYY должно содержать год, MM должно содержать месяц, а DD должно содержать день, интерпретируемый как дата системы григорианского календаря.

Пример:

Примечание

  1. ACR-NEMA Standard 300 (предшественник DICOM) поддерживал строку символов в формате YYYY.MM.DD для этого VR. Использование этого формата несовместимо.

  2. См. Также DT VR в этой таблице.

«0» — «9» из стандартного набора персонажей

В контексте запроса с сопоставлением диапазона (см. PS3.4) разрешен символ «-», а для заполнения разрешен символ пробела в конце.

8 фиксированных байтов

В контексте запроса с сопоставлением диапазона (см. PS3.4), максимальная длина составляет 18 байт.

DS

Десятичная строка

Строка символов, представляющая либо число с фиксированной запятой, либо число с плавающей запятой. Номер с фиксированной запятой должен содержать только символы 0–9 с необязательным начальным знаком «+» или «-» и необязательным символом «».»для обозначения десятичной точки. Число с плавающей запятой должно передаваться, как определено в ANSI X3.9, с буквами» E «или» e «для обозначения начала экспоненты. Десятичные строки могут быть дополнены начальными или конечными пробелами. Встраиваемые пробелы не допускаются.

Примечание

Элементы данных

с несколькими значениями, использующими этот VR, могут быть некорректно закодированы, если используется синтаксис передачи Explicit-VR и VL этого атрибута превышает 65534 байта.

«0» — «9», «+», «-», «E», «e», «.» стандартного репертуара персонажей

16 байт максимум

ДТ

Дата Время

Объединенная символьная строка даты и времени в формате:

.

ГГГГММДДЧЧММСС.FFFFFF и ZZXX

Компоненты этой строки слева направо: ГГГГ = год, ММ = месяц, ДД = день, ЧЧ = час (диапазон «00» — «23»), ММ = минута (диапазон «00» — «59». «), SS = секунда (диапазон» 00 «-» 60 «).

FFFFFF = Fractional Second содержит дробную часть секунды, равную 1 миллионной секунды (диапазон «000000» — «999999»).

& ZZXX — необязательный суффикс для смещения от всемирного координированного времени (UTC), где & = «+» или «-«, а ZZ = часы и XX = смещение в минутах.

Год, месяц и день должны интерпретироваться как дата григорианской календарной системы.

Используется 24-часовой формат времени. Полночь должна быть представлена ​​только цифрой «0000», поскольку «2400» нарушит часовой диапазон.

Компонент дробной секунды, если он присутствует, должен содержать от 1 до 6 цифр. Если дробная секунда не указана, предшествующий символ «.» не должны быть включены. Суффикс смещения, если присутствует, должен содержать 4 цифры.Строка может быть дополнена завершающими символами ПРОБЕЛ. Ведущие и встроенные пробелы не допускаются.

Компонент, который не указан в строке, называется нулевым компонентом. Завершающие нулевые компоненты Date Time указывают на то, что значение не соответствует точности этих компонентов. Компонент YYYY не может быть нулевым. Не завершающие нулевые компоненты запрещены. Необязательный суффикс не рассматривается как компонент.

Значение даты и времени без дополнительного суффикса интерпретируется как находящееся в местном часовом поясе приложения, создающего элемент данных, если явно не указано смещение часового пояса от UTC (0008,0201).

Смещения

UTC рассчитываются как «местное время минус UTC». Смещение для значения даты и времени в UTC должно быть +0000.

Примечание

  1. Диапазон смещения от -1200 до +1400. Смещение для восточного стандартного времени США составляет -0500. Смещение для японского стандартного времени составляет +0900.

  2. RFC 2822 использование -0000 в качестве смещения для указания местного времени не допускается.

  3. Значение даты и времени 195308 означает август 1953 года, а не конкретный день. Значение даты и времени 19530827111300.0 означает 27 августа 1953 года, 11; 13 часов утра с точностью до 1/10 секунды.

  4. Второй компонент может иметь значение 60 только для дополнительной секунды.

  5. Смещение может быть включено независимо от нулевых компонентов; е.г., 2007-0500 является юридическим значением.

«0» — «9», «+», «-», «.» и символ ПРОБЕЛ в Default Character Repertoire

Максимум 26 байт

В контексте запроса с сопоставлением диапазона (см. PS3.4), максимальная длина — 54 байта.

FL

Одиночная точка с плавающей запятой

Двоичное число с плавающей запятой одинарной точности, представленное в 32-битном формате чисел с плавающей запятой IEEE 754: 1985.

не применимо

4 байта фиксировано

FD

Двойное число с плавающей запятой

Двоичное число с плавающей запятой двойной точности, представленное в 64-битном формате чисел с плавающей запятой IEEE 754: 1985.

не применимо

8 фиксированных байтов

IS

Целочисленная строка

Строка символов, представляющая целое число с основанием 10 (десятичное), должна содержать только символы 0–9 с необязательным начальным знаком «+» или «-».Он может быть дополнен начальными и / или конечными пробелами. Встраиваемые пробелы не допускаются.

Представленное целое число n должно быть в диапазоне:

-2 31 <= n <= (2 31 -1).

«0» — «9», «+», «-» из набора символов по умолчанию

Максимум 12 байтов

LO

Длинная струна

Символьная строка, которая может быть дополнена начальными и / или конечными пробелами.Символьный код 5CH (BACKSLASH «\» в ISO-IR 6) не должен присутствовать, поскольку он используется в качестве разделителя между значениями в многозначных элементах данных. Строка не должна иметь управляющих символов, кроме ESC.

Набор символов по умолчанию и / или как определено в (0008,0005).

Максимум 64 символа (см. Примечание в разделе 6.2)

LT

Длинный текст

Символьная строка, которая может содержать один или несколько абзацев. Он может содержать набор графических символов и управляющие символы, CR, LF, FF и ESC. Он может быть дополнен конечными пробелами, которые можно игнорировать, но ведущие пробелы считаются важными.Элементы данных с этим VR не должны быть многозначными, поэтому может использоваться код символа 5CH (BACKSLASH «\» в ISO-IR 6).

Набор символов по умолчанию и / или как определено в (0008,0005).

Максимум 10240 символов (см. Примечание в разделе 6.2)

OB

Другая строка байтов

Строка байтов, в которой кодирование содержимого определяется согласованным синтаксисом передачи.OB — это виртуальная реальность, нечувствительная к порядку байтов от Little / Big Endian (см. Раздел 7.3). Строка байтов должна быть дополнена одним завершающим значением байта NULL (00H), когда это необходимо для достижения четной длины.

не применимо

см. Определение синтаксиса передачи

OD

Другая двойная струна

Строка 64-битных слов с плавающей запятой IEEE 754: 1985.OD — это виртуальная реальность, которая требует перестановки байтов в каждом 64-битном слове при переключении между порядком байтов Little Endian и Big Endian (см. Раздел 7.3).

не применимо

2 32 -8 байт максимум

ИЗ

Другая строка с плавающей запятой

Строка 32-битных слов с плавающей запятой IEEE 754: 1985.OF — это виртуальная реальность, которая требует перестановки байтов в каждом 32-битном слове при переключении между порядком байтов Little Endian и Big Endian (см. Раздел 7.3).

не применимо

2 32 -4 байта максимум

OW

Строка другого слова

Строка из 16-битных слов, в которой кодирование содержимого определяется согласованным синтаксисом передачи.OW — это виртуальная реальность, которая требует перестановки байтов в каждом слове при переключении между порядком байтов Little Endian и Big Endian (см. Раздел 7.3).

не применимо

см. Определение синтаксиса передачи

PN

Имя человека

Символьная строка, закодированная с использованием 5-компонентного соглашения.Символьный код 5CH (BACKSLASH «\» в ISO-IR 6) не должен присутствовать, поскольку он используется в качестве разделителя между значениями в многозначных элементах данных. Строка может быть дополнена конечными пробелами. Для человеческого использования пять компонентов в порядке их появления следующие: комплекс фамилии, комплекс имени, отчество, префикс имени, суффикс имени.

Примечание

HL7 запрещает начальные пробелы в компоненте; DICOM допускает начальные и конечные пробелы и считает их несущественными.»символ (5EH). Разделители необходимы для внутренних нулевых компонентов. Завершающие нулевые компоненты и их разделители могут быть опущены. В каждом компоненте допускается несколько записей, которые кодируются как естественные текстовые строки в формате, предпочитаемом указанным лицом.

Для ветеринарного использования первые два из пяти компонентов в порядке их появления: фамилия ответственного лица или название ответственной организации, имя пациента. Остальные компоненты не используются и не должны присутствовать.

Эта группа из пяти компонентов называется группой компонентов «Имя человека».

Для написания имен идеографическими и фонетическими символами можно использовать до 3 групп компонентов (см. Приложения H, I и J). Разделителем для групп компонентов должен быть знак равенства «=» (3DH). Три составляющие группы компонентов в порядке их появления: алфавитное представление, идеографическое представление и фонетическое представление.

Любая группа компонентов может отсутствовать, включая первую группу компонентов. В этом случае имя человека может начинаться с одного или нескольких разделителей «=». Разделители необходимы для внутренних групп нулевых компонентов. Конечные группы нулевых компонентов и их разделители могут быть опущены.

Для каждой группы компонентов определена точная семантика. См. Раздел 6.2.1.2.

Примеры и примечания см. В Разделе 6.2.1.1.

Набор символов по умолчанию и / или как определено в (0008,0005), исключая управляющие символы LF, FF и CR, но разрешая управляющий символ ESC.

Максимум 64 символа на группу компонентов

(см. Примечание в разделе 6.2)

SH

Короткая строка

Символьная строка, которая может быть дополнена начальными и / или конечными пробелами.Код символа 05CH (BACKSLASH «\» в ISO-IR 6) не должен присутствовать, поскольку он используется в качестве разделителя между значениями для нескольких элементов данных. Строка не должна иметь управляющих символов, кроме ESC.

Набор символов по умолчанию и / или как определено в (0008,0005).

Максимум 16 символов (см. Примечание в разделе 6.2)

SL

Длинная подпись

Двоичное целое число со знаком длиной 32 бита в форме дополнения до 2.

Представляет целое число n в диапазоне:

.

— 2 31 <= n <= 2 31 -1.

не применимо

4 байта фиксировано

SQ

Последовательность предметов

Значение

— это последовательность из нуля или более элементов, как определено в разделе 7.5.

не применимо (см. Раздел 7.5)

не применимо (см. Раздел 7.5)

SS

Короткая подпись

Знаковое двоичное целое число длиной 16 бит в форме дополнения до 2.Представляет целое число n в диапазоне:

.

-2 15 <= n <= 2 15 -1.

не применимо

2 фиксированных байта

СТ

Краткий текст

Символьная строка, которая может содержать один или несколько абзацев.Он может содержать набор графических символов и управляющие символы, CR, LF, FF и ESC. Он может быть дополнен конечными пробелами, которые можно игнорировать, но ведущие пробелы считаются важными. Элементы данных с этим VR не должны быть многозначными, поэтому может использоваться код символа 5CH (BACKSLASH «\» в ISO-IR 6).

Набор символов по умолчанию и / или как определено в (0008,0005).

Максимум 1024 символа (см. Примечание в разделе 6.2)

TM

Время

Строка символов в формате ЧЧММСС.FFFFFF; где HH содержит часы (диапазон «00» — «23»), MM содержит минуты (диапазон «00» — «59»), SS содержит секунды (диапазон «00» — «60»), а FFFFFF содержит дробную часть секунда всего одна миллионная секунды (диапазон «000000» — «999999»). Используются 24-часовые часы. Полночь должна быть представлена ​​только цифрой «0000», поскольку «2400» нарушит часовой диапазон. Строка может быть дополнена конечными пробелами. Ведущие и встроенные пробелы не допускаются.

Один или несколько компонентов MM, SS или FFFFFF могут быть неуказанными, если каждый компонент справа от неопределенного компонента также не указан, что указывает на то, что значение не соответствует точности этих неопределенных компонентов.

Компонент FFFFFF, если присутствует, должен содержать от 1 до 6 цифр. Если FFFFFF не указан, предшествующий «.» не должны быть включены.

Примеры:

  1. «070907.0705» представляет время 7 часов 9 минут 7,0705 секунды.

  2. «1010» представляет время 10 часов 10 минут.

  3. «021» — недопустимое значение.

Примечание

  1. ACR-NEMA Standard 300 (предшественник DICOM) поддерживал строку символов в формате HH: MM: SS.frac для этого VR. Использование этого формата несовместимо.

  2. См. Также DT VR в этой таблице.

  3. Компонент SS может иметь значение 60 только для дополнительной секунды.

«0» — «9», «.»и ПРОБЕЛ в Default Character Repertoire

В контексте запроса с сопоставлением диапазона (см. PS3.4) допускается использование символа «-».

16 байт максимум

В контексте запроса с сопоставлением диапазона (см. PS3.4) максимальная длина составляет 28 байтов.

UI

Уникальный идентификатор (UID)

Символьная строка, содержащая UID, который используется для однозначной идентификации широкого спектра элементов.UID — это последовательность числовых компонентов, разделенных точкой «.» персонаж. Если поле значения, содержащее один или несколько UID, имеет длину нечетное число байтов, поле значения должно быть дополнено одним завершающим символом NULL (00H), чтобы гарантировать, что поле значения имеет четное число байтов по длине. См. Раздел 9 и приложение B для получения полной спецификации и примеров.

«0» — «9», «.»из стандартного репертуара персонажей

Максимум 64 байта

UL

Длинное без знака

Двоичное число без знака длиной 32 бита.Представляет целое число n в диапазоне:

.

0 <= n <2 32 .

не применимо

4 байта фиксировано

ООН

Неизвестно

Строка байтов, кодировка содержимого которой неизвестна (см. Раздел 6.2.2).

не применимо

Любая длина, допустимая для любого другого представления значений DICOM

США

Беззнаковый короткий

Двоичное число без знака длиной 16 бит.Представляет целое число n в диапазоне:

.

0 <= n <2 16 .

не применимо

2 фиксированных байта

UT

Безлимитный текст

Символьная строка, которая может содержать один или несколько абзацев.Он может содержать набор графических символов и управляющие символы, CR, LF, FF и ESC. Он может быть дополнен конечными пробелами, которые можно игнорировать, но ведущие пробелы считаются важными. Элементы данных с этим VR не должны быть многозначными, поэтому может использоваться код символа 5CH (BACKSLASH «\» в ISO-IR 6).

Набор символов по умолчанию и / или как определено в (0008,0005).

2 32 -2 байта максимум

См. Примечание 2

Глубина орфографии | Психология вики

Оценка | Биопсихология | Сравнительный | Познавательная | Развивающий | Язык | Индивидуальные различия | Личность | Философия | Социальные |
Методы | Статистика | Клиническая | Образовательная | Промышленное | Профессиональные товары | Мировая психология |

Язык: Лингвистика · Семиотика · Речь


Орфографическая глубина буквенной орфографии указывает степень, в которой она отклоняется от простого однозначного соответствия буква-фонема.

Орфографии можно определить как поверхностные или глубокие, в зависимости от легкости предсказания произношения слова по его написанию. В неглубокой орфографии соответствие орфографии и звука прямое: при соблюдении правил любой может немедленно «назвать» слова правильно (Besner & Smith, 1992, стр.45). [1] Другими словами, Мелкие орфографии имеют взаимно однозначное отношение между графемами и фонемами, а написание слов очень согласовано.Мелкую орфографию также иногда называют фонематической орфографией. Напротив, в глубокой орфографии связь менее прямая, и читатель должен выучить произвольное или необычное произношение неправильных слов (Besner & Smith, 1992, p.45). Другими словами, Глубокие орфографии — это системы письма, в которых нет однозначного соответствия между звуками (фонемами) и буквами (графемами), которые их представляют.


Согласно гипотезе орфографической глубины, неглубокие орфографии легче поддерживают процесс распознавания слов, который включает фонологию языка.Напротив, глубокая орфография побуждает читателя обрабатывать напечатанные слова, обращаясь к их морфологии через визуально-орфографическую структуру печатного слова (Katz & Frost, 1992, 71) [2] . Для языков с относительно глубокой орфографией, таких как английский, французский, китайский, арабский или иврит, новым читателям гораздо сложнее научиться расшифровывать слова. В результате дети учатся читать медленнее. [3]

Для языков с относительно неглубокой орфографией, таких как эсперанто, итальянский и финский, у новых читателей мало проблем с обучением декодированию слов.В результате дети относительно быстро учатся читать. [3] Фонетические системы письма японского языка (хирагана и катакана) — еще один пример поверхностной орфографии, но в японском языке также используются логографы (кандзи), что значительно сложнее и требует длительного изучения для освоения.

Bosch et al. [4] рассматривает орфографическую глубину как композицию по крайней мере двух отдельных компонентов. Одна из них связана со сложностью отношений между элементами на графемном уровне (графемы) и элементами на фонематическом уровне (фонемы), т.е.е. насколько сложно преобразовать графемные строки (слова) в фонематические строки. Второй компонент связан с разнообразием на графемном уровне и со сложностью определения графемных элементов слова (графемный синтаксический анализ), то есть того, как согласовать фонематическую транскрипцию с ее орфографическим аналогом.

  1. ↑ Besner, D., Smith, M. C. (1992). Основные процессы при чтении: опускается ли гипотеза орфографической глубины? В R. Frost & L. Katz (Eds.), Орфография, морфология фонологии и значение достижений в психологии Том 94 (стр.45-66). Северная Голландия, Оксфорд, Англия. Получено с http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=pubmed&cmd=Retrieve&dopt=AbstractPlus&list_uids=1993-97079-003
  2. ↑ Кац, Л., и Фрост, Р. (1992). Процесс чтения различен для разных орфографий: гипотеза орфографической глубины. Отчет о статусе исследований речи лабораторий Хаскинс за 1992 г. (стр. 147–160). Лаборатории Хаскинса.
  3. 3,0 3,1 Госвами, Уша (6 сентября 2005 г.).«Глава 28: Орфография, фонология и развитие чтения: кросс-лингвистическая перспектива». в Малатеша, Джоши. Справочник по орфографии и грамоте. Лоуренс Эрлбаум Assoc Inc., стр. 463–464. ISBN 0805846522.
  4. ↑ Ван ден Бош, А., Контент, А., Даелеманс, В., и Де Гелдер, Б. (1994). Анализ орфографической глубины различных языков с использованием алгоритмов, ориентированных на данные.

Шаблон: лингвистика-заглушка

.

admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *