Фонетический разбор слова википедия: википедия — фонетический (звуко-буквенный) разбор слова

Содержание

фонетическое слово — это… Что такое фонетическое слово?

фонетическое слово: Самостоятельное слово вместе с примыкающими к нему безударными служебными словами и частицами, (нъ-лугу) (на лугу), (за-гърът) (за город), (н’ие-знал) (не знал).

фонетический разбор
фоника

Смотреть что такое «фонетическое слово» в других словарях:

Фонетическое слово — Фонетическое слово, или ритмическая группа[1]:27 самостоятельное слово вместе с примыкающими к нему служебными словами, не имеющими собственного ударения[2], иначе говоря клитиками, для которых самостоятельное слово выступает опорным[3].… … Википедия
фонетическое слово — Отрезок звуковой цепи, объединенный одним словесным ударением, соответствующий одному или нескольким лексическим словам: В ту же ночь все произошло (в ту же – это одно фонетическое слово) … Словарь лингвистических терминов Т.В. Жеребило
Слово — Слово основная структурно семантическая единица языка, служащая для именования предметов и их свойств, явлений, отношений действительности, обладающая совокупностью семантических, фонетических и грамматических признаков, специфичных для каждого… … Лингвистический энциклопедический словарь
Сегментные и суперсегментные единицы — Наша речь представляет собой поток звуков, звуковую цепь. Эта цепь членится на отрезки, отдельные единицы, выделяемые раз личными фонетическими средствами. В русском языке такими единицами являются фраза, фонетическая синтагма, фонетическое слово … Википедия
Фонология — (от греч.
φωνή звук и λόγος слово, учение) раздел языкознания, изучающий структурные и функциональные закономерности звукового строя языка. Этим фонология как семиотическая дисциплина отличается от собственно фонетики, изучающей речь в её… … Лингвистический энциклопедический словарь
клитики — Безударные слова, примыкающие к другим и составляющие с ними одно фонетическое слово: 1) проклитика безударное слово, стоящее впереди ударного: односложные предлоги, союзы, некоторые частицы; 2) энклитика – безударное слово, стоящее после… … Словарь лингвистических терминов Т.В. Жеребило
Лингвистическая типология — Лингвистика Теоретическая лингвистика Фонетика Фонология Морфология Синтаксис Семантика Лексическая семантика Прагматика … Википедия
Типология (лингвистика) — У этого термина существуют и другие значения, см. Типология. … Википедия
Фонема — (от греч. φώνημα звук, голос) единица звукового строя языка, служащая для опознавания и различения значимых единиц морфем, в состав которых она входит в качестве минимального сегментного компонента, а через них и для опознавания и различения… … Лингвистический энциклопедический словарь
энклитика — и; ж. [греч. enklitikos наклоняющийся назад] Лингв. Слово, не имеющее собственного ударения и стоящее после ударяемого слова, к которому оно непосредственно примыкает, образуя вместе с ним в отношении ударения одно целое (например: там же , здесь … Энциклопедический словарь

Фонетическая транскрипция слов онлайн. Фонетика.

Переводчики слов в транскрипцию

Произношение может представлять затруднение для людей, начинающих изучать иностранный язык. В некоторых языках, например, в английском, нет строгих правил чтения.

Когда вы в первый раз видите незнакомое английское слово, вы не знаете, как оно произносится.

Онлайн-переводчики слов в транскрипцию на этом сайте помогут вам справиться с этой проблемой и облегчат изучение иностранного языка. Работают они очень просто – вы вставляете текст в окно браузера и нажимаете кнопку «отправить». Переводчик покажет вам фонетическую транскрипцию иностранного текста, записанную символами международного фонетического алфавита. Вам больше не потребуется искать произношение слова в словаре с транскрипцией!

Переводчики слов в транскрипцию доступны для следующих языков:

Фонетика и транскрипция – словарь терминов

Международный фонетический алфавит (МФА) – система символов для записи фонетической транскрипции слов. В МФА чаще всего один звук передается одним фонетическим символом. Читать о международном фонетическом алфавите в Википедии.
Ударение – выделение компонентов речи каким-либо акустическим средством: высотой звука, силой звука, длительностью звучания и др. Читать об ударении в Википедии.
Фонема – минимальная смыслоразличительная звуковая единица языка. Возьмем, к примеру, английское слово mill /ˈmɪl/. Если мы заменим звук /m/ в этом слове на звук /k/, то смысл слова изменится. Это будет уже другое слово – kill /ˈkɪl/. Оба звука /m/ и /k/ – фонемы. Читать о фонеме в Википедии.
Фонетика – это наука, изучающая звуки речи. Читать о фонетике в Википедии.
Фонетическая транскрипция – графическая запись звучания слова. Существуют разные системы фонетической транскрипции. Наиболее распространенная – международный фонетический алфавит (МФА), где каждому звуку соответствует один фонетический символ. К примеру, английское слово «hello» в МФА пишется как «[həˈloʊ]».
Другие системы могут использовать другие символы. Транскрипция того же слова «hello» в словаре Merriam-Webster, например, записывается как «\hə-ˈlō\». Читать о фонетической транскрипции в Википедии.
Фонетический алфавит – способ прочтения слова по буквам, когда каждая буква произносится как отдельное слово. Наиболее распространенный фонетический алфавит для английского языка – ИКАО. Если, к примеру, вы хотите прочитать английское слово «bad» c помощью этого алфавита, вы скажете: браво (b), альфа (a), дельта (d). Читать о фонетическом алфавите в Википедии.
Фонетический разбор слова – учебное задание по анализу слоговой структуры и звукового состава слова. Читать о фонетическом разборе слова в Википедии.
Фонология – раздел фонетики, изучающий функционирование звуков в языковой системе. Основной предмет изучения фонологии — фонема. Читать о фонологии в Википедии.

Другие проекты Тимура Байтукалова: Тренировка абсолютного слуха

Зарегистрируйтесь и получите 7-дневный бесплатный доступ ко всем аудио- и видеозаписям!

Подписка на сайте

это… Что такое фонетика русского языка?

Фонетика — это раздел науки о языке, предметом исследования которого является звук. Звук является основной единицей языка наряду со словом и предложение, но в отличие от них он сам по себе не имеет никакого значения.

Фонетика и звук

Звуки выполняют в языке важную смыслоразличительную роль. Они оформляют слово фонетически, создавая его внешнюю звуковую оболочку.

Вот какое определение, что такое фонетика дает Википедия:

Фонетика (от греч. φωνή — «звук», φωνηεντικός — «звуковой») — раздел лингвистики, изучающий звуки речи и звуковое строение языка (слоги, звукосочетания, закономерности соединения звуков в речевую цепочку).

Звуки, соединяясь в разные комбинации, помогают различать слова в речи. В каждом слове содержится определенное количество звуков. Сравним:

бор — сбор;
порт — спорт;
кошка — окошко;
каска — сказка

Слова различаются набором звуков и последовательностью их расположения. Понаблюдаем за словами, которые различаются

одним звуком

вагон — вазон;
поход — подход;
город — огород;

двумя звуками

ложка — обложка;
фасоль — пароль;
смазка — замазка.

В фонетическом облике слов наблюдаем отличие в последовательности звуков:

сорт — торс;
коршун -шнурок;
короб — порог ([к о р а п] — [п а р о к]).

Образование звуков языка

Фонетика изучает каждый звук с точки зрения акустики, как физический объект, и артикуляции — способа образования звука с помощью органов речи человека. Звуки образуются в речевом аппарате при выдыхании воздуха. К речевому аппарату отнесем гортань с голосовыми связками, ротовую и носовую полости, язык, губы, нёбо.

Гласные звуки

В речевом аппарате выдыхаемый воздух проходит через гортань между напряженными голосовыми связками и через ротовую полость, которая может менять свою форму. Так образуются гласные звуки: [а], [о], [у], [э], [и], [ы].

Они состоят только из голоса.

Согласные звуки

Выдыхаемый воздух может встретить преграду в ротовой полости в виде смычки или сближения органов речи и выйти через рот или через нос. Так образуются согласные звуки. Они состоят из шума, а некоторые — из голоса и шума.

Источник изображения: абв-стенд.рф

Фонетическая позиция звука

В речи все звуки находятся либо в сильной позиции, либо в слабой. В сильной позиции звук слышится отчетливо. Для гласных звуков сильная позиция — это нахождение звука под ударением, а слабая — без ударения, например:

го́рка — гора́ [г а р а]
ведро́ [в’ и д р о]

Согласный звук имеет сильную позицию, если рядом с ним находятся гласные звуки:

борода, ворота, ураган, рука, столик, чулан, тропы.

Слабой позицией для согласных звуков является их расположение

1. в конце слова

гардероб [п]
кров [ф]
пирог [к]
брод [т]
сторож [ш]
князь [с’]

2. перед глухими согласными

ко́вшик [к о ф ш ы к]
вста́вка [ф с т а ф к а]
обхо́дчик [а п х о т ч’ и к]

Видеоурок «Фонетическая транскрипция»

Видеоурок «Фонетический разбор слова»

Обучающий материал

Школьница разбор слова — Wikipedia для взрослых

8 мар 2019 Твоя школьница Аккорды Алена Швец разбор песни на гитаре без баррэ бой и текст (под описанием внизу) простые для начинающих . — Сами объясните мистеру Кингсли что к чему, у меня сейчас нет времени на подробности

Разбор по составу слова ШКОЛЬНИЦА: школь/ниц/а. Подробный разбор, графическую схему и сходные по морфемному строению слова вы найдёте на . Во второй раз не говорил и, само собой, тоже ничего не добился

Разбор по составу слова: «школьница» —. школьница. школь, — корень. ниц, — суффикс. а, — окончание. школьниц, — основа слова . Как раз время прийти домой, нацепить тапочки и поломать голову над шахматной партией

Слово школьница: как пишется, где ударение, сколько слогов. Разборы слова: морфемный, фонетический, морфологический. Склонение слова . Теперь-то я вижу, где вы слегка пережали, но в тот момент поверил полностью

14 май 2014 Нажми, чтобы увидеть ответ на свой вопрос ✍️: фонетический разбор слова -школьница. На той стороне каньона по склону вилась безлюдная мощеная улочка

8 мар 2019 Егор Натс — \. Как бы там ни было, его увезли на допрос в Сан-Бернардино, а труп отправили на вскрытие

Морфемный анализ слова школьница — выделение частей слова: основа, корень, суффикс, окончание. Наглядное схематическое обозначение. С тех пор как я открыл дверь, он выдал не менее десяти звонков

Разбор по составу (морфемный) слова «школьница»: Школьница — корень [школь], суффикс [ниц], окончание [а];. Ночной крем с лица она стерла и слегка подкрасилась

Информация о том, как разобрать по составу слово школьница, провести морфемный разбор, определить состав слова школьница, найти корень и . Такие жены очень, опасны для людей типа доктора Альберта С

Морфологический разбор слова школьница Слово школьница является Именем существительным (это самостоятельная, склоняемая часть речи). — С сияющими улыбками на физиономиях, — добавил сержант

Единственное число;; Женский род;; Именительный падеж;; Одушевленное; . Через три квартала на спидометре было уже пятьдесят

Разбор слова \. Он вытащил из старого обтрепанного бумажника замусоленный клочок бумаги и протянул мне

Фонетический (звуко-буквенный) разбор слова«шко́льница». шко́льница→[школница]. В слове «шко́льница»: слогов—3 (шко-льни-ца), букв—9, . Высокие красноватые сосны вздымали к безоблачному небу свои вершины

— Я нашел его в доме Криса Лавери, на кровати под подушкой

Я встал, поблагодарил их ж, сделав пару шагов к двери, спросил:

Время выпить чего-нибудь вкусненького со льдом и спокойно разжечь трубку

Раньше было можно, а теперь нельзя, — ответил Кингсли и, медленно подняв глаза, посмотрел на меня отсутствующим взглядом

Кто бы поверил, что его жену до смерти накачал наркотиком другой человек? Никто, разве лишь тот, кто знал все обстоятельства

Срезают кожу с подушечек и закрепляют в дубильном растворе

Ярлык на внутреннем кармане пиджака подсказал мне, что имя владельца — X

На грубой деревянной доске было написано: «Оленье озерцо — 1¾ мили»

В нижнем холле я увидел две двери по краям и две посередине

Я пообещал, пожал ему руку и вышел из большого прохладного кабинета в приемную, где сидела за столом элегантная мисс Фромсет

— Когда я кого-то запугиваю, то хочу видеть результаты

— Садитесь и спрашивайте, — она закрыла дверь, пересекла комнату и устроилась в деревянной качалке с высокой резной спинкой

Фонетическое соответствие | Справочное руководство Apache Solr 7.1

Примеры использования этой кодировки в анализаторе см. В разделе «Фильтр Морзе Бейдера» в разделе «Описание фильтров».

Фонетическое сопоставление по Бейдеру-Морзе (BMPM) — это «звуковой» инструмент, который позволяет выполнять поиск с использованием новой системы фонетического сопоставления. BMPM помогает вам искать личные имена (или просто фамилии) в индексе Solr / Lucene и намного превосходит существующие фонетические кодеки, такие как обычный звуковой сигнал, метафон, каверфон и т. Д.

Как правило, фонетическое соответствие позволяет искать в списке имен имена, фонетически эквивалентные желаемому имени. BMPM похож на поиск soundex в том, что точное написание не требуется. В отличие от soundex, он не генерирует большого количества ложных срабатываний.

По написанию имени BMPM пытается определить язык. Затем он применяет фонетические правила для этого конкретного языка, чтобы транслитерировать имя в фонетический алфавит. Если невозможно определить язык с достаточной степенью уверенности, вместо этого используется общая фонетика.Наконец, он применяет независимые от языка правила в отношении таких вещей, как звонкие и глухие согласные и гласные, чтобы еще больше гарантировать надежность совпадений.

Например, предположим, что при поиске Стивена в базе данных были найдены совпадения «Стефан», «Стеф», «Стивен», «Стив», «Стивен», «Плита» и «Stuffin». «Стефан», «Стивен» и «Стивен», вероятно, уместны, и это имена, которые вы хотите видеть. Однако «Stuffin», вероятно, не имеет отношения к делу. Также отклонены были «Стеф», «Стив» и «Плита».Из них «Плита», наверное, не та, которую мы бы хотели. Но, возможно, вас заинтересуют «Стеф» и «Стив».

Для Solr поиск BMPM доступен для следующих языков:

Английский
Французский
Немецкий
Греческий
Еврейские буквы, написанные еврейскими буквами
Венгерский
Итальянский
Польский
Румынский
Русский кириллицей
Русская транслитерация английскими буквами
Испанский
Турецкий

Сопоставление имен также применимо к нееврейским фамилиям из стран, в которых говорят на этих языках.

Phonics | Психология вики | Фэндом

Психология образования: Оценка · Вопросы · Теория и исследования · Техники · Техники X предмет · Special Ed. · Пастораль

Для изучения звуков и звуков речи см. Акустика и фонетика.

С британской точки зрения см. Синтетическая акустика.

Phonics относится к методам обучения детей чтению на английском языке. Фонетика включает в себя обучение детей соединению звуков разговорного английского с буквами или группами букв (например, что звук / k / может быть представлен в виде написания c , k или ck ) и обучение их сочетанию звуки букв вместе для получения приблизительного произношения неизвестных слов.

Фоника — широко используемый метод обучения чтению и расшифровке слов, хотя и не без противоречий (см. «История и противоречия» ниже). Дети начинают учиться читать с помощью фонетики обычно в возрасте 5-6 лет. Обучение чтению на английском языке с использованием фонетики требует от детей усвоения связи между образцами букв и звуками, которые они представляют. Обучение акустике требует, чтобы учитель предоставил студентам основную информацию о правилах или паттернах фонетики.

Примечание. В этой статье используется общеамериканское произношение.

Основные правила [править | править источник]

Алфавитный принцип [править | править источник]

С точки зрения лингвистики, правописание английского языка основано на алфавитном принципе. В алфавитной системе письма буквы используются для обозначения звуков речи или фонем. Например, слово pat пишется из трех букв: p , a и t , каждая из которых представляет фонему, соответственно, / p /, / æ / и / t /.^[1]

Системы правописания для некоторых алфавитных языков, таких как испанский, относительно просты, потому что существует почти однозначное соответствие между звуками и образцами букв, которые их представляют. Английское правописание является более сложным, поскольку оно пытается представить более 40 фонем разговорного языка с помощью алфавита, состоящего всего из 26 букв (без акцентов). В результате две буквы часто сливаются в группы, представляющие разные звуки, называемые диграфами .Например, «t» и «h», поставленные рядом, используются для обозначения третьего звука / th / (IPA: / θ / или / ð /).

Английский язык вобрал в себя большое количество слов из других языков на протяжении своей истории, без изменения написания этих слов. В результате письменная форма английского языка включает в себя наложенные друг на друга орфографические образцы пяти языков (староанглийского, датского, нормандского французского, классической латыни и греческого). ^[2] Эти перекрывающиеся образцы написания означают, что во многих случаях один и тот же звук может быть написан по-разному, и одно и то же написание может представлять разные звуки.Однако образцы написания обычно следуют определенным соглашениям. ^[3] В результате образцы написания английского языка значительно различаются по степени соответствия установленному образцу. Например, буквы ee почти всегда представляют / iː /, но звук также может быть представлен буквой y . Точно так же буквенная группа ough представляет / ʌf / как в , достаточно , / oʊ / как в , хотя , / uː / как в –, / ɔːf / как в кашель, , и / aʊ / как в сук .

Хотя шаблоны непоследовательны, когда правила написания английского языка учитывают структуру слогов, фонетику и акценты, существуют десятки правил, которые на 75% или более надежны. ^[4]

Выбор звуковых паттернов показан ниже.

Паттерны гласных звуков [править | править источник]

Краткие гласные — это пять однобуквенных гласных, a, e, i, o и u, когда они производят звуки / æ / как в cat , / ɛ / как в bet , / ɪ / as в — , / ɒ / как в hot и / ʌ / как в cup .Термин «краткий гласный» на самом деле не означает, что эти гласные произносятся в течение особенно короткого периода времени, но это не дифтонги, как длинные гласные.
Длинные гласные являются синонимами названий однобуквенных гласных, например / eɪ / in baby , / iː / in meter , / aɪ / in tiny , / oʊ / in broken , и / juː / в юмор . То, как педагоги используют термин «долгие гласные», отличается от того, как лингвисты используют этот термин.В классах длинные гласные звуки преподаются как «такие же, как названия букв».
Schwa — третий звук, который может воспроизводить большинство написаний одиночных гласных. Шва — это нечеткий звук гласной в безударном слоге, представленный лингвистическим символом ə . / ə / — звук, издаваемый o на уроке . Schwa — это гласный образец, который не всегда преподают ученикам начальной школы, потому что его трудно понять.Тем не менее, некоторые преподаватели утверждают, что schwa следует включать в программы начального чтения из-за ее важности при чтении английских слов.
Закрытые слоги — это слоги, в которых за одной гласной буквой следует согласная. В слове кнопка оба слога являются закрытыми, потому что они содержат одиночные гласные, за которыми следуют согласные. Следовательно, буква u ‘ представляет собой короткий звук / ʌ /. ( o во втором слоге дает звук / ə /, потому что это безударный слог.)
Открытые слоги — это слоги, в которых гласная появляется в конце слога. Гласная произносит долгий звук. В слове бассейн , ba — открытый слог и, следовательно, говорит / beɪ /.
Дифтонги — лингвистические элементы, которые объединяют два соседних гласных звука. В английском есть четыре распространенных дифтонга. Общепризнанными дифтонгами являются / aʊ / as в cow и / ɔɪ / as в boil . Четыре долгих гласных также технически являются дифтонгами, / eɪ /, / aɪ /, / oʊ / и / juː /, что частично объясняет причину, по которой они считаются «длинными».«
Диграфы гласных — это те орфографические шаблоны, в которых две буквы используются для обозначения гласного звука. ai в парусе — это орграф гласных. Поскольку первая буква в диграфе гласных иногда произносит длинный гласный звук, как в sail , некоторые программы по звуку однажды учили, что «когда две гласные идут, первый говорит». Это соглашение было почти повсеместно отвергнуто из-за множества непримеров. Орфография au звука / ɔː / и oo написание звуков / uː / и / ʊ / не соответствуют этому шаблону.
Написание гласных-согласных-E — это те, в которых одна гласная буква, за которой следует согласная, и буква e издают долгий гласный звук. Примеры: bake , theme , hike , cone и cute . (Правописание ee , как и в и , иногда считается частью этого образца.)

Звуковые паттерны согласных [править | править источник]

Согласные диграфы — это те варианты написания, в которых две буквы используются для обозначения согласной фонемы.Наиболее распространенные согласные диграфы: ch для / tʃ /, ng для / ŋ /, ph для / f /, sh для / ʃ /, th для / θ / и / ð /, и wh для / ʍ / (часто произносится / w / в американском английском). Комбинации букв, такие как wr для / r / и kn для / n /, также являются согласными диграфами, хотя иногда их считают образцами с «безмолвными буквами».
Короткие гласные + согласные модели включают написание звуков / k / как в peek , / dʒ / как в стадии и / tʃ / как в речи .Каждый из этих звуков имеет два возможных варианта написания в конце слова: ck и k для / k /, dge и ge для / dʒ /, и tch и ch для / tʃ / . Правописание определяется типом гласной, предшествующей звуку. Если звуку предшествует короткая гласная, используется прежнее написание, например, в выберите , судите и соответствует . Если короткая гласная не предшествует звуку, используется последнее написание, так как в взято , barge , а launch .

Последний «короткий гласный + согласный узор» — это всего лишь один из десятков примеров, которые можно использовать, чтобы помочь детям распознать сложный английский алфавитный код. Этот пример показывает, что, несмотря на сложность, английское правописание сохраняет порядок и разумность.

Визуальные и часто встречающиеся слова [править | править источник]

Есть слова, которые не соответствуют этим правилам фонетики, например, было , было , а было . Их часто называют «визуальными словами», потому что их нужно запоминать наизусть.

Учителя, использующие фонетику, также часто учат студентов запоминать наиболее часто встречающиеся слова английского языка, такие как it , he , их и при , даже если эти слова полностью декодируемы. Аргументом в пользу обучения этим «часто используемым словам» является то, что знание их улучшит беглость чтения учащимися.

Есть способы помочь в запоминании слов с первого взгляда с помощью мультисенсорных действий, таких как постукивание руками.

Из-за сложности письменного английского языка более века велись споры о том, следует или не следует использовать английскую фонетику в обучении начинающему чтению. Несмотря на работу сторонников XIX века, таких как Ребекка Смит Поллард, некоторые американские педагоги, в первую очередь Гораций Манн, утверждали, что акустику вообще не следует преподавать. Это привело к широко используемому подходу «посмотри-скажи», унаследованному читателями «Дика и Джейн», популярными в середине 20-го века. Однако, начиная с 1950-х годов, акустика снова стала методом обучения чтению.Подстегиваемая критикой Рудольфа Флеша по поводу отсутствия инструкций по фонетике (особенно в его популярной книге « Почему Джонни не умеет читать, ») фоника снова всплыла на поверхность, но — благодаря полемическому подходу Флеша — термин «акустика» стал ассоциироваться с политической идеологией.

В 1980-е годы подход к чтению на основе «всего языка» еще больше поляризовал дебаты в Соединенных Штатах. Полноязычное обучение основывалось на принципе, что дети могут научиться читать при условии (а) надлежащей мотивации, (б) доступа к хорошей литературе, (в) множества возможностей чтения, (г) сосредоточения внимания на значении и (д) помощи учащиеся используют смысловые подсказки, чтобы определить произношение неизвестных слов.Для некоторых сторонников целостного языка фоника была противоположностью помощи новым читателям в понимании смысла; они утверждали, что разбор слов на небольшие куски и их повторная сборка не имеют никакого отношения к идеям, которые автор хотел передать.

Акцент всего языка на идентификации слов с использованием контекста и с небольшим акцентом на звуки (обычно на согласные буквы алфавита и короткие гласные) не мог быть согласован с акцентом на фонетике на индивидуальных соответствиях звука и символа.Таким образом, дихотомия между целостным языковым подходом и фонетикой возникла в Соединенных Штатах, вызвав интенсивные дискуссии. В конечном итоге эти дебаты привели к серии комиссий по заказу Конгресса и финансируемых государством обзоров состояния обучения чтению в США.

В 1984 году Национальная академия образования заказала отчет о состоянии исследований и методики обучения чтению, « Становление нации читателей». ^[5] Среди других результатов, отчет включает открытие, что обучение звуку улучшает способность детей определять слова.В нем сообщается, что полезные фонетические стратегии включают обучение детей звукам букв по отдельности и словами, а также обучение их сочетанию звуков букв для получения приблизительного произношения слов. В нем также говорится, что обучение звуку должно происходить вместе с возможностью определять слова в значимых предложениях и рассказах.

В 1990 году Конгресс попросил Министерство образования США составить список доступных программ для начала обучения чтению, оценив каждую с точки зрения эффективности ее звукового компонента. В рамках этого требования Министерство энергетики США попросило доктора Мэрилин Дж. Адамс подготовить отчет о роли обучения акустике в начале чтения, в результате чего в 1994 г. была выпущена ее книга « Начало чтения: мышление и изучение печати». ^[6] В книге Адамс утверждал, что существующие научные исследования подтверждают, что фоника является эффективным методом обучения студентов чтению на уровне слов. Адамс категорически утверждал, что правы и сторонники фонетики, и целые языки.Акустика — это эффективный способ научить студентов алфавитному коду, развить их навыки расшифровки неизвестных слов. Она утверждала, что, рано выучив алфавитный код, ученики могут быстро высвободить умственную энергию, которую они использовали для анализа слов, и посвятить это умственное усилие значению, что приведет к более глубокому пониманию в начальной школе. Таким образом, заключила она, обучение фонетике является необходимым компонентом обучения чтению, но его недостаточно для обучения детей чтению. Этот результат соответствовал общей цели обучения всему языку и поддерживал использование фонетики для определенного подмножества навыков чтения, особенно на самых ранних этапах обучения чтению.

Подобные результаты, основанные на широкомасштабном историческом исследовании обучения чтению на других языках помимо английского, были опубликованы Диной Фейтельсон в ее книге « Факты и причуды в начале чтения: межъязыковая перспектива» ^{[ 7]}. Тем не менее, спор о том, как обучать чтению, в конечном итоге известный как «Великая дискуссия», не утихал.

Национальный исследовательский совет повторно изучил вопрос о том, как лучше всего научить детей чтению (среди других вопросов в сфере образования), и в 1998 г. опубликовал результаты в документе «Профилактика трудностей с чтением у детей младшего возраста». ^[8] Выводы Национального исследовательского совета во многом совпадают с выводами Адамса. Они пришли к выводу, что фоника — очень эффективный способ научить детей читать на уровне слов, более эффективный, чем так называемый «встроенный фонетический» подход всего языка (где фонетика преподавалась оппортунистически в контексте литературы). Они обнаружили, что обучение звуку должно быть систематическим (следуя последовательности все более сложных звуковых паттернов) и явным (обучение студентов именно тому, как эти паттерны работают, т.е.g., «это b , он обозначает звук / b /»). .. ^[9]

В 1997 году Конгресс попросил директора Национального института здоровья детей и человеческого развития (NICHD) в Национальных институтах здравоохранения, в консультации с министром образования, созвать национальную комиссию для оценить эффективность различных подходов к обучению детей чтению. Национальная комиссия по чтению изучил количественные исследования по многим областям обучения чтению, включая фонетику и язык в целом.Итоговый отчет «Обучение детей чтению: доказательная оценка научно-исследовательской литературы по чтению и его значение для чтения». Инструкция был опубликован в 2000 году и содержит всесторонний обзор того, что известно о передовых методах обучения чтению в США. ^[10] Экспертная группа сообщила, что несколько навыков чтения имеют решающее значение для того, чтобы стать хорошим читателем: акустика для определения слов, беглость речи, словарный запас и понимание текста. Что касается фонетики, их метаанализ сотен исследований подтвердил выводы Национального исследовательского совета: обучение фонетике (и связанным с ней фонетическим навыкам, таким как фонематическая осведомленность) является более эффективным способом научить детей навыкам чтения в раннем возрасте, чем встроенная фонетика. или нет инструкции по акустике.^[11] Экспертная группа обнаружила, что обучение звуку является эффективным методом обучения чтению для учащихся от детского сада до 6-го класса, а также для всех детей, которым трудно научиться читать. Они также обнаружили, что обучение звуку приносит пользу всем возрастам в обучении правописанию. Они также сообщили, что учителя нуждаются в большем обучении эффективному обучению чтению, как до начала работы, так и во время работы.

Различные подходы к акустике [править | править источник]

Синтетическая акустика — это метод, используемый для обучения фонетике детей, когда они учатся читать.Этот метод включает в себя изучение каждого написания в слове по отдельности как отдельного звука, а затем смешивание этих звуков вместе. Например, саваны можно было бы прочитать, произнеся звуки для каждого написания «/ ʃ, r, aʊ, d, z /», а затем смешав эти звуки устно, чтобы получить произносимое слово «/ ʃraʊdz /». Цель обучения синтетической фонетике состоит в том, чтобы учащиеся идентифицировали соответствия звуков и символов и автоматически смешивали их фонемы. (см. синтетическую акустику)

Аналитическая акустика предлагает детям анализировать соответствия звука и символа, такие как написание или слова / aʊ / в кожухах , но ученики не смешивают эти элементы, как на уроках синтетической фонетики.Кроме того, сочетания согласных (отдельные смежные фонемы согласных) преподаются как единицы (например, в shrouds shr будут учиться как единица).

Аналоговая акустика — это особый тип аналитической фоники, в котором учитель предлагает ученикам анализировать фонические элементы в соответствии с фонограммами в слове. Фонограмма, известная в лингвистике как иней, состоит из гласной и всех следующих за ней звуков. Учителя, использующие метод аналогии, помогают учащимся запомнить банк фонограмм, например, -at или -am .Затем студенты используют эти фонограммы для сопоставления неизвестных слов.

Встроенная акустика — это тип инструкций по фонетике, используемых во всех языковых программах. Хотя фонетическим навыкам не уделяется должного внимания во всех языковых программах, некоторые учителя включают «мини-уроки» по фонетике в контекст литературы. Включены короткие уроки, основанные на элементах фонетики, с которыми у учащихся возникают проблемы, или на новом или сложном звуковом образце, который появляется в задании по чтению в классе. Сосредоточение внимания на значении обычно сохраняется, но мини-урок дает некоторое время для сосредоточения на отдельных звуках и символах, которые их представляют. Встроенная акустика отличается от других методов тем, что обучение всегда проводится в контексте литературы, а не на отдельных уроках, а навыки, которым нужно обучать, определяются оппортунистически, а не систематически.

Из-за меняющихся дебатов с течением времени (см. «История и противоречия» выше), многие школьные системы, например, Калифорния, внесли серьезные изменения в методы обучения чтению в раннем возрасте.Сегодня большинство учителей сочетают акустику с элементами всего языка, которые направлены на понимание прочитанного. Адамс ^[12] и Национальная комиссия по чтению выступают за комплексную программу чтения, которая включает несколько различных вспомогательных навыков, основанных на научных исследованиях. Такой комбинированный подход иногда называют сбалансированной грамотностью, хотя некоторые исследователи утверждают, что сбалансированная грамотность — это просто целый язык, называемый другим именем. ^[13] Сторонники различных подходов в целом согласны с тем, что комбинированный подход важен.Некоторые приверженцы предпочитают изолированное обучение синтетической фонетике и введение в понимание прочитанного только после того, как дети усвоят соответствие звуков и символов. С другой стороны, некоторые сторонники целого языка непреклонно утверждают, что акустике следует мало преподавать, если вообще преподавать.

В последние годы наблюдается возрождение интереса к синтетической акустике, особенно в Соединенном Королевстве. Эту тему продвигала межпартийная группа парламентариев, в частности депутат Ник Гибб.В недавнем отчете Комитета по образованию и профессиональным навыкам Палаты общин содержится призыв к пересмотру содержания фонетики в национальной учебной программе. Департамент образования и навыков с тех пор объявил об обзоре чтения в первые годы обучения, который возглавил Джим Роуз.

Группа Джима Роуза сообщила, и правительство Великобритании постановило, что синтетическая акустика должна быть предпочтительным методом обучения чтению в начальных школах Англии.

↑ Фонемы представлены символами, помещенными между знаками косой черты.Википедия использует Международный фонетический алфавит (см. Справка: Произношение) для обозначения фонем, с учетом использования символа æ для обозначения звука буквы a в pat . Эта система используется, потому что она стандартизирована и точна.
↑ МакГиннесс, Дайан. (2004). Инструкция для раннего чтения Кембридж: MIT Press 41.
↑ Рен, Себастьян. Исключительные слова, Юго-западная лаборатория развития образования. Получено с http: // www.sedl.org/reading/topics/exception.html, 30 сентября 2007 г.
↑ Эбботт, М. (2000). Выявление надежных обобщений для написания слов: важность многоуровневого анализа. Журнал начальной школы 101 (2), 233-245.
↑ Становление нацией читателей, Национальная академия образования, Центр изучения чтения, 1984 г.
↑ Адамс, Мэрилин Дж. Начинаю читать: думать и узнавать о печати. MIT Press, февраль 1994 г .; ISBN.
↑ Дина Фейтельсон (1988). Факты и причуды для начинающих читать: межъязыковая перспектива , Норвуд, Нью-Джерси: Ablex Pub. Корп.
↑ Сноу, Кэтрин Э., Сьюзан Бернс, Пег Гриффин, ред. Предотвращение трудностей чтения у детей младшего возраста. Комитет по предотвращению затруднений чтения у детей раннего возраста, Национальный исследовательский совет, 1998 ISBN 0-309-06418-X
↑ Шаблон: Harvcolnb
↑ Национальный институт детского здоровья и развития человека. (2000). Отчет Национальной комиссии по чтению.Обучение детей чтению: основанная на фактах оценка научно-исследовательской литературы о чтении и его значении для обучения чтению (публикация NIH № 00-4769). Вашингтон, округ Колумбия: Типография правительства США.
↑ Выводы и определения Национальной комиссии по чтению по тематическим областям
↑ Адамс, Мэрилин Джагер (1990). Начало чтения: размышления и изучение Print , Кембридж, Массачусетс: MIT Press. ISBN 0-262-51076-6.
↑ Ров, Луиза.Многоязычный язык: как определить, что научные инструкции по чтению — нет, январь 2007 года. Проверено 12 февраля 2008 года.

Структурированное систематическое обучение акустике — это тип обучения акустике, который наиболее эффективен для детей из групп риска или детей с ограниченными возможностями в обучении. Этот подход учит буквы и соответствующие фонемы в очень продуманном порядке с большим количеством повторений (по мере необходимости). Дети могут запоминать эту информацию, поскольку ее тщательно учат. Акустика, преподаваемая по принципу «по мере необходимости», более характерна для всего языка.

Фонетический алфавит — полезный

Обратите внимание, что вне лингвистики «фонетический алфавит» обычно означает радиотелефонный орфографический алфавит, а не то, что подробно описано ниже.

Международный фонетический алфавит (IPA) допускает стандартизированные, подробные и международные фонетические и фонематические обозначения, а также весьма полезен для определения альтернативных вариантов произношения.

Например, / bɪˈkɔz /, / bɪˈkɒz / и / bɪˈkʌz / — альтернативные варианты произношения ‘потому что.’

Обратите внимание, что SIL определил «IPA93» (до Unicode), но от этого в значительной степени отказались в пользу Unicode.

ASCII IPA

Эта неофициальная кодировка была создана для передачи символов IPA по электронной почте в виде обычного текста.

Преобразование IPA в символы ASCII обязательно делает его кодированием с несколькими символами и, как правило, с переменной длиной. Он более подробный и / но его легче анализировать (человек и машина), чем другие подобные попытки.

Он позволяет использовать несколько альтернативных способов написания одного и того же, поэтому он немного сложнее и потенциально более гибок. Из-за совпадения целей наиболее сжатая форма ASCII IPA выглядит как X-SAMPA.

См. Также:

Примечания к IPA на основе Unicode

Шрифты

При записи фонетических данных очень полезно использовать шрифт, который фактически содержит (и поэтому рисует) все фонетические символы Unicode, на которые вы ссылаетесь.

Шрифты SIL, такие как Gentium, Doulos, Charis и Andika, созданы для этой цели.

Шрифты
, в названии которых есть «Unicode», такие как «Arial Unicode MS» и «Lucida Sans Unicode», имеют широкий охват символов и также могут быть вам полезны.
См. Также этот список.

Инструкции по установке для Windows и Linux см. На таких страницах, как http://helpful.knobs-dials.com/index.php/Font_installing_notes

Это не охватывает все и не всегда согласуется со следующим разделом (Я больше не работаю в этой области, поэтому, если какой-нибудь лингвист хочет впитать все эти детали в свой собственный лучший набор заметок, продолжайте.)

Выбор персонажа

Unicode использует фонетическое кодирование в том, что многие фонетические символы основаны на существующих символах, которые можно использовать вместо них. Например, некоторые символы представляют собой простые латинские символы, а некоторые диакритические знаки являются общими диакритическими знаками или обычные символы в качестве надстрочных знаков, которые уже определены в другом месте.

Это означает, что символы могут действовать семантически некорректно. Вы должны , а не разбирать (или составлять) фонетические данные.Например, глухой небный фрикативный звук — это c с седилем, который распадается на Некоторые другие случаи не изменятся. Например, согласно Unicode риторизованная шва не связана с шва или диакритическим знаком риторизации.

Вы, вероятно, будете рисовать из обоих блоков с уникальными персонажами IPA:

Расширенная латиница-B (от U + 0180 до U + 024F), в частности четыре символа щелчка, от U + 01C0 до U + 01C3.

Функционально это охватывает большинство вещей, но графически вы можете выбрать из: …и выбирая и выбирая из существующих персонажей:

Буквы тона модификатора (от U + A700 до U + A71F) для тоновых полос
«глобальное падение» и «глобальный подъем» можно имитировать с помощью стрелок (от U + 2190 до U + 21FF).

Примечание: U + 25CC (пунктирный круг) обычно используется, чтобы удостовериться, что объединяющий диакритический знак имеет базовый символ для рендеринга, и чтобы предложить относительное положение, в котором он будет находиться.

Для некоторых ссылок см .:

Существуют различные более узкие определения (скажем, уральский фонетический алфавит, который был прилично определен в Unicode) и многие другие местные соглашения (например, различные соглашения об обозначении тона упоминаются в Priest’s «Marking Tone»).

Этот инструмент может вас заинтересовать для перевода из IPA и X-SAMPA в IPA, X-SAMPA и пакет типа LaTeX.

Способы ввода

Если вы транскрибируете много звуков, вы можете найти метод, который позволит вам печатать то, что вы слышите, вместо того, чтобы искать и часто нажимать.

Онлайн-подборщики персонажей IPA

Листы щелчков мышью на основе Javascript, которые формируют строку, выглядят наименее беспокоящими для небольших работ. Пытаться:

… среди других.В некоторых из них даже есть звук.

Приложения и плагины для выбора персонажей

Сборщики IPA:

Общие средства выбора символов Юникода:

Карта символов Windows
BabelMap (windows)
kcharselect KDE, gcharmap GNOME и другие
Кабинет:

Копирование-вставка имеет тенденцию быть утомительным в долгосрочной перспективе, хотя вы можете немного облегчить это, сохранив общие в документе.

Приложения

yudit (linux) — это программа на основе X, которая выполняет перезапись текста — только в своем графическом интерфейсе, что означает, что вы можете копировать и вставлять, и вам не нужно понимать хитрость метода ввода, чтобы использовать его.

Обратите внимание, что у него есть метод ASCII-IPA и SAMPA, но оба кажутся неполными — поэтому, если вы еще не привыкли к ним, вам, вероятно, не стоит начинать их использовать, и вам следует написать карту, которая либо переписывает вашу локальную транскрипцию. систему в Unicode или X-SAMPA в нее.

У меня есть данные для последнего, напишите мне, если интересно.

Уловки с клавиатурой

Если вы хотите транскрибировать, используя только клавиатуру, и в конечном итоге научитесь делать это довольно быстро, вы можете переопределить поведение клавиатуры, часто позволяя вывод дополнительных символов с помощью определенных комбинаций клавиш и / или последовательностей клавиш.

Обратите внимание, что когда дело доходит до переназначения клавиатуры, доступно много необщих карт. Вы можете сделать свой собственный; для каждой платформы есть бесплатные редакторы раскладки клавиатуры.

В windows:

, вы можете использовать метод ввода Windows Alt- number , но он принимает десятичные числа, в то время как Unicode записывает кодовые точки в шестнадцатеричном формате, поэтому вам понадобится параллельная ссылка, как на этой странице UCL .
«Инструмент быстрого ввода Unicode» — небольшое улучшение этого

Раскладки клавиатуры: (только для определенных версий Windows)

раскладки клавиатуры, которые повторно отображают обычные клавиши на фонетические символы (например, это)
Переписчики в стиле Keyman [1].

Linux любит методы ввода. Многие реализации специфичны для ввода на азиатском языке и построены на вещах, в некоторой степени привязанных к X или оконным менеджерам:

UIM (универсальный метод ввода), который имеет вспомогательную панель инструментов / приложение системной панели и включает определение IPA
SCIM (Smart Common Input Method), в котором также есть приложение для панели задач
более старый, XIM (X Input Method), который часто используется как (много) клавишный перезаписчик (также используется Qt, KDE)
Существует также GTK + IM, который хорош, но не может использоваться приложениями, отличными от GTK, и поэтому нецелесообразен в качестве предложения.

IIIMF, определяется в более общем смысле (не привязан к X, оконному менеджеру, языку или операционной системе), поэтому может быть интегрирован довольно широко

Вы также можете использовать X KeyBoard Extension (XKB), например

изменить сопоставление существующих клавиш (например, кнопок мультимедийной клавиатуры), или

определяет новые комбинации клавиш make (например, shift + ctrl + определенные буквенные клавиши)

и вместо этого сопоставьте их с фонетическими символами

Mac OS X:

TODO: поэкспериментируйте и напишите, как на самом деле работать с каждым из них.

САМПА

Фонетический алфавит методов оценки речи — это фонетический алфавит, полностью состоящий из ASCII, основанный на IPA, который был удобным способом общения между различными системами и носителями.

Существует множество различных диаграмм SAMPA, каждая из которых относится к определенному языку, и между ними есть некоторые дублирования и двусмысленности (один и тот же символ используется для разных звуков в разных диаграммах и т. Д.).

См. Также

X-SAMPA

Расширенный вариант SAMPA объединяет отдельные диаграммы SAMPA, устраняя неоднозначности.Обычно это предпочтительнее SAMPA.

Он работает почти со всеми IPA и имеет сопоставление почти 1: 1 между IPA и им.

«Почти», потому что:

есть некоторые концепции X-SAMPA, для которых нет прямого перевода, часто потому, что он не является официальным (например, сегментарная нотация)

есть некоторые неявные варианты / предпочтения:
иногда есть два кода X-SAMPA для чего-то, обычно один из старых соглашений (например,грамм. губно-зубной аппроксимант)
в IPA есть два способа отображения уровня / контура: диакритическим знаком и символом. Поскольку они эквивалентны, X-SAMPA не кодирует их отдельно.

есть некоторые детали, связанные с композицией:
Некоторые концепции X-SAMPA представляют собой множественные из IPA. Например, в IPA используются разные символы ритмичности для гласных и согласных, а в X-SAMPA — нет.
Некоторые комбинации знаков и диакритических знаков могут быть составлены в один знак / разложены на два.(Возможно даже, что этот шаг изменяет задействованный комбинирующий символ (проверить) )

Это относительно немногочисленные и редкие случаи. Однако они немного усложняют автоматический перевод и перевод без потерь.

См. Также:

Эта статья / раздел является заглушкой — вероятно, стопка полусортированных заметок, плохо проверен , поэтому могут иметь неправильные биты.

Расширенный IPA (ExtIPA)

Предназначен для расширения возможностей транскрипции IPA, включая эффекты нарушения речи, и включает вторичные детали произношения, просодические детали и т. Д.

См. Википедию: Расширенный IPA

CXS, Conlang X-SAMPA

Слегка измененная (и несовместимая!) Форма X-SAMPA, вариант списка рассылки Conlang на X-SAMPA состоит из нескольких изменений и дополнений к X-SAMPA, внесенных членами списка рассылки конструирования языка conlang.

Добавляет две неофициальные гласные, по-разному кодирует некоторые диакритические знаки, а также по-разному кодирует четыре существующих гласных, но повторно использует символы. Таким образом, он неоднозначен / несовместим со стандартным X-SAMPA.(Я не уверен, насколько серьезно относиться к этому варианту из-за этой детали).

CMU

Простая кодировка только на английском языке, используемая для словаря произношения CMU, который представляет собой свободно доступное отображение произношения слов.

САМПРОСА

SAM PROSodic Alphabet предназначен для просодической транскрипции.

См., Например, [2]

ARPAbet

ARPABET был ранним (1970-е годы) кодированием только ASCII, очевидно, для простого синтеза речи. Он не основан на IPA и не такой мелкозернистый, как он.

ТИМИТ

TIMIT был заказан DARPA для аналогичных целей в 80-х годах.

Существует также речевой корпус TIMIT начала девяностых годов. См., Например, [3]

WSJ

По-видимому, используется в корпусе DARPA Wall Street Journal (проверить) .

SWB

Очевидно, используется в корпусе системы транскрипции коммутатора ISCI (проверить) .

AHD

Вероятно, имеется в виду Словарь американского наследия. (проверить)

VoQS

Символы качества передачи речи

канистра

http://venus.unive.it/canipa/

FLOSS

Фонемическая система правописания Latin-One (FLOSS), разработанная Аланом Билом, полученная из MCM

http://www.wyrdplay.org/AlanBeale/FLOSS-ref.html

FLEWSY

Fonemic Latin-1 English Writing SYstem (FEWLSY), автор Алан Биль, производный от MCM

См. Также FEWL.

MCM

Mixed Case Minglish (MCM), Алан Бил

http: // www.wyrdplay.org/AlanBeale/MCM-ref.html

Вы, вероятно, захотите использовать пакет типа. Видеть:

Наиболее полезными для справок о типах персонажей являются:

Посмотреть:

Pocketsphinx для оценки произношения — CMUSphinx Open Source Speech Recognition

ОБНОВЛЕНИЕ: пожалуйста, посмотрите этот документ, чтобы узнать о гораздо более совершенном методе, разработанном во время Google Summer of Code 2017, заменяющем все нижеприведенное.

Это короткое руководство со ссылками на Джеймса Салсмана (jim at talknicer dot com.)

Установка и тестирование

Сначала в системе с набором инструментов компилятора gcc C установите automake, python включая библиотеки для разработки и swig, например таким образом в Debian или Ubuntu:

sudo apt-get install automake python python-dev swig

Затем вы можете установить и протестировать pocketsphinx следующим образом:

  svn checkout svn: //svn. code.sf.net/p/cmusphinx/code/trunk/sphinxbase
cd sphinxbase
./autogen.sh
делать
sudo make install
CD ..
svn checkout svn: //svn.code.sf.net/p/cmusphinx/code/trunk/pocketsphinx
карманы для компакт-дисков
./autogen.sh
делать
sudo make install
 
CD тест / регрессия
./test-lm.sh

Если у вас нет прав root на машине, на которую вы устанавливаете, вы можно пропустить команду sudo apt-get и вместо этого создать новый локальный каталог, например mkdir $ HOME / pocketsphinx , а затем используйте ./autogen.sh --prefix = $ HOME / pocketsphinx --without-python для обе команды из autogen и опускают префикс sudo при выполнении двух make install команды.Исполняемые двоичные файлы будут установлены в подкаталог bin, например ~ / pocketsphinx / bin / pocketsphinx_continuous

Если вы используете MacOSX, вам сначала нужно установить autoconf, automake и libtool.

Файлы конфигурации

Затем создайте эти файлы для проверки оценки произношения:

phonemes.dict — используйте табуляцию вместо пробелов для каждого CMUBET:

  aa AA
ae AE
Ах ах
АО
aw AW
ау АЙ
б В
ch CH
d D
dh DH
эээ
er ER
ey EY
f F
г G
чч чч
ih IH
iy IY
jh JH
k K
l L
м М
п N
нг НГ
ой вй
oy OY
p P
r R
SS
ш ш
сил SIL
сс S
т т
th TH
эээ
uw UW
v V
w W
y Y
z Z
zh ZH

слов.dict — Опять же, первым пробелом в каждой строке должна быть одна табуляция; включить SILence:

  танец D AE N S
сил SIL
игрушка T OY
с W IH DH

Добавьте еще слов из CMUDICT или составить их из CMUBET, как вам нужно. Просто убедитесь, что SIL указан как «sil».

Затем сделайте аудиозапись одного из этих слов, например «с», произнесенного на звуковой файл, например, с .wav при 16000 выборок в секунду с 16 битами на семпл и 1 монофонический канал.

Вот файлы конечной грамматики (FSG) формата JSGF для произношения. оценка этого единственного слова «с»:

with-align.jsgf для принудительного выравнивания фонем:

  #JSGF V1.0;
форсирование грамматики;
общедоступный  = sil w ih dh [сил];

with-neighbors.jsgf определяет, являются ли ожидаемые фонемы признаны как более или менее произносимые, чем их ближайшие покрывающих физически соседние фонемы, как определено приращением смещения компонентов голосового тракта:

  #JSGF V1.0;
грамматика соседей;
public  = sil    [sil];
 = aa | ах | эр | ао;
 = ae | а | эр | ах;
 = ах | ае | эр | аа;
 = ao | аа | эр | Эм-м-м;
 = aw | аа | э-э | ау;
 = ay | аа | iy | ой | ey;
 = b | p | d;
 = ch | ш | jh | т;
 = dh | th | z | v;
 = d | т | jh | г | б;
 = eh | ih | эр | ае;
 = эр | а | ах | ао;
 = ey | а | iy | ай;
 = f | чч | th | v;
 = g | k | d;
 = hh | th | f | p | т | k;
 = ih | iy | ага;
 = iy | ih;
 = jh | ch | ж | d;
 = k | г | т | чч;
 = l | г | w;
 = m | n;
 = нг | n;
 = n | м | нг;
 = ow | ао | э-э | aw;
 = oy | ао | iy | ай;
 = p | т | б | чч;
 = r | y | л;
 = sh | s | z | th;
 = sh | s | ж | ch;
 = t | ch | k | d | p | чч;
 = th | s | dh | f | чч;
 = uh | ао | ув | uw;
 = uw | э-э | uw;
 = v | f | dh;
 = w | л | у;
 = y | w | р;
 = z | s | dh | z;
 = zh | ш | z | jh;

Обратите внимание, что продукция для перекрывающих фонем соседних / S / кодируется как , чтобы избежать двусмысленности с начальным токеном ~~, поэтому / S / находится под «S» и «ss» в фонемах.dict выше.~~

with-word.jsgf выполняет выравнивание всего слова:

  #JSGF V1.0;
грамматическое слово;
public  = sil с [sil];

Для нескольких слов используйте что-то вроде public = sil dance [sil] с [сил] той [сил]; в последней строке. Аналогично для файлов фонем, общедоступная продукция должна просто включать больше фонем с [необязательно] между соседними словами вставлена сила.

Карман для бегаSphinx

Затем вы можете запустить эти три разных этапа распознавания речи. Каждый ниже это одна командная строка с разрывами строк для ясности:

Принудительное выравнивание фонем

  карманыphinx_continuous
    -infile with.wav
    -jsgf с-align.jsgf
    -dict phonemes.dict
    -backtrace да
    -fsgusefiller нет
    -bestpath нет
  2> & 1> with-alignment.txt

Различение физиологически соседних фонем

  карманыphinx_continuous
    -infile с расширением.wav
    -jsgf с соседями.jsgf
    -dict phonemes.dict
    -backtrace да
    -fsgusefiller нет
    -bestpath да
  2> & 1> with-neighbors.txt

Принудительное выравнивание целых слов

  карманыphinx_continuous
    -infile with.wav
    -jsgf с-word.jsgf
    -dict words.dict
    -backtrace да
    -fsgusefiller нет
    -bestpath нет
  2> & 1> with-word.txt

Выход

~~Результат должен выглядеть примерно так:~~

  $ хвост с- *.текст
==> with-alignment.txt <==
ИНФОРМАЦИЯ: pocketsphinx.c (1171): sil w ih dh sil (-2822)
начало слова конец pprob ascr lscr lback
сил 3 77 1.000 -1797 0 1
ш 78 83 1.000 -377 0 1
ih 84 86 1.000 -147 0 1
дх 87 102 1.000 -335 0 1
сил 103107 1.000 -166 0 1
ИНФОРМАЦИЯ: fsg_search.c (265): ИТОГО fsg 0.22 ЦП 0.209 xRT
ИНФОРМАЦИЯ: fsg_search.c (268): ИТОГО fsg 0,06 стены 0,058 xRT
Sil w ih dh Sil
 
==> with-neighbors.txt <==
ИНФОРМАЦИЯ: pocketsphinx.c (1171): sil y eh v (-2888)
начало слова конец pprob ascr lscr lback
сил 3 60 1.000 -1643 0 1
г 61 67 1.000 -352 0 1
а 68 75 1.000 -332 0 1
в 76107 1.000 -561 0 1
(ПУСТО) 107 107 1.000 0 0 1
ИНФОРМАЦИЯ: fsg_search.c (265): ИТОГО fsg 0.68 CPU 0.644 xRT
ИНФОРМАЦИЯ: fsg_search.c (268): ИТОГО fsg 0.69 wall 0.657 xRT
Sil y eh v
 
==> with-word. txt <==
ИНФОРМАЦИЯ: fsg_search.c (869): fsg 0,05 CPU 0,051 xRT
ИНФОРМАЦИЯ: fsg_search.c (871): fsg 0,09 стена 0,084 xRT
ИНФОРМАЦИЯ: pocketsphinx.c (1171): серебристый с серебром (-2607)
начало слова конец pprob ascr lscr lback
сил 3 77 1.000 -1602 0 1
с 78 102 1.000 -845 0 1
сил 103 107 1.000–160 0 1
ИНФОРМАЦИЯ: fsg_search.c (265): ИТОГО fsg 0,05 CPU 0,051 xRT
ИНФОРМАЦИЯ: fsg_search.c (268): ИТОГО fsg 0,09 стены 0,085 xRT
сил с сил

Здесь начальная и конечная колонки указаны в сотых долях секунды, акустическая оценка «ascr» - единственный другой значимый столбец, а строки - фонемы - первый набор - это «принудительное выравнивание» ожидаемых фонем, второй набор рядов - это фонемы, физиологически соседствующие с ожидаемыми фонемами которое лучше всего соответствовало речи ребенка, а в третьем наборе строк акустическая оценка всего слова.

Обратите внимание, что акустические оценки даны в логарифмической вероятности, поэтому они отрицательны. числа с большими числами (например, отрицательные числа ближе к нулю) соответствует большей уверенности в том, что фонема или слово были произнесены когда используется -bestpath № .

Убедитесь, что вы используете -bestpath no для выравнивания фонем без затруднений и выравнивание слов FSG, но -bestpath да на более высоком уровне сложности соседнем фонемной грамматики, и не зависят от акустических оценок, полученных в результате этих ФСГ с высокой степенью недоумения, потому что они не коррелируют с достоверностью.

Часто неправильное произношение и обычный фоновый шум приводят к отсутствию оценки, лишние записи в таблицах обратной трассировки (например, « (NULL) » как выше), несколько выходных таблиц для каждого вызова и другие мешающие факторы, все из которых вам нужно будет поэкспериментировать, чтобы иметь возможность успешно анализировать выход.

Выполнение оценки произношения

Вы можете использовать логистическую регрессию, например, для прогнозирования процента транскрипционисты, которые смогли успешно ввести слово «с» после прослушивание аудио с помощью. wav файл, используя в качестве независимых переменных:

~~акустическая оценка каждой фонемы в каждом слове,~~
~~длительность каждой фонемы в каждом слове,~~
~~фонема, распознаваемая вместо каждой ожидаемой фонемы, и~~
~~акустическая оценка всего слова.~~

Рассмотрите возможность взять логарифм 1 минус акустические оценки (которые должны быть логнормальное распределение в отрицательной целочисленной форме для обоих выровненных фонемы и целые слова) так, чтобы они образовывали нормальное распределение, а затем преобразование их в стандартные баллы (стандартные отклонения выше среднего нормальное распределение.) Продолжительность также, вероятно, будет начинаться почти как логнормальное распределение (неотрицательное, но нулевое для некоторых неправильно произнесенных фонемы), и вы можете сделать то же самое для них, добавляя вместо вычитания из 1. При преобразовании в стандартные баллы обязательно используйте средние и стандартные отклонение популяций журнала (1-ascr) и log (1 + длительность) от каждой фонемы в отдельности. Вы не можете сравнивать акустическую оценку или продолжительность разных фонемы в разных словах или в разных позициях в одном и том же слове, даже если они из одной фонемы.Невозможно даже достоверно сравнить баллов и длительности одной и той же фонемы из одинаковых слов в разных контекстах.

Интересно, как лучше всего использовать неколичественные данные соседних фонем. открытый вопрос в машинном обучении. Пожалуйста, не используйте акустические оценки из -bestpath yes грамматики конечных состояний соседних фонем, но вы можете захотеть поэкспериментировать с -bestpath нет баллов из таких грамматик, когда их вывод локально похож (те же предыдущие, текущие и последующие фонемы) на фонемы -bestpath да результатов.Пожалуйста, поделитесь тем, что вы узнали.

Примеры

Примечание. В этих примерах интенсивно используется язык программирования AWK (man страница; GNU awk manual) вместе с различными bash оболочка и связанные команды unix.

Файл wyn.tar.gz содержит аудио, скрипт и данные .wav. файлы ниже. Он основан на 80 звуковых высказываниях с именами от wyn01.wav от до wyn80.wav студентов попросили произнести слова «Как вас зовут?» с разной степени успеха, от молчания до внятного произношения.Высказывания оцениваются с помощью этих команд:

  $ за w в wyn * .wav; do pocketsphinx_continuous -infile $ w -jsgf wyn-align.jsgf -dict phonemes.dict -backtrace yes -fsgusefiller no -bestpath no 2> & 1 | tee $ w-align.txt; Выполнено
 
$ вместо w в wyn * .wav; do pocketsphinx_continuous -infile $ w -jsgf wyn-neighbors.jsgf -dict phonemes.dict -backtrace yes -fsgusefiller no -bestpath yes 2> & 1 | tee $ w-neighbors.txt; Выполнено
 
$ вместо w в wyn * .wav; do pocketsphinx_continuous -infile $ w -jsgf wyn-words.jsgf -dict words.dict -backtrace yes -fsgusefiller no -bestpath no 2> & 1 | tee $ w-words.txt; Выполнено

Акустические партитуры и длительность фонем

Это приводит к созданию 240 файлов вывода текста wyn NN .wav-align.txt , wyn NN .wav-neighbors.txt и wyn NN .wav-words.txt с вывод каждой команды. Мы будем работать с акустическими партитурами и длительностями в файлы -align.txt .(w | ah | t | s | y | uh | r | n | ey | m) / {printf "% 2s% 5d% 4.2f", $ 1, $ 5, ($ 3- $ 2) / 100.0} END {print FILENAME } '$ f >> alignments.txt; Выполнено

~~Выходной файл, созданный этой командой, выглядит следующим образом:~~

  $ head alignments.txt
 w -208 0,02 ah -141 0,02 t -76 0,03 s -175 0,03 y -183 0,09 uh -151 0,02 r -77 0,06 n -146 0,03 ey -487 0,37 м -134 0,08 wyn01.wav-align.txt
 w -89 0,05 ah -62 0,03 t -390 0,18 s -447 0,02 y -217 0,04 uh -109 0,02 r -154 0. 02 n -208 0,02 ey -267 0,18 m -90 0,04 wyn02.wav-align.txt
 w -364 0,14 ah -271 0,03 t -111 0,05 с -210 0,02 y -99 0,05 uh -100 0,03 r -111 0,03 n -262 0,06 ey -304 0,08 м -213 0,03 wyn03.wav-align.txt
 w -1148 0,27 ah -693 0,20 t -279 0,02 с -637 0,02 y -99 0,05 uh -80 0,03 r -176 0,07 n -276 0,04 ey -334 0,14 м -287 0,11 wyn04.wav-align.txt
 w -68 0,06 ah -170 0,06 t -137 0,06 s -78 0,02 y -199 0,02 uh -105 0,04 r -180 0,02 n -171 0,04 ey -976 0.36 м -255 0,13 wyn05.wav-align.txt
wyn06.wav-align.txt
wyn07.wav-align.txt
wyn08.wav-align.txt
 w -279 0,02 ah -149 0,02 t -621 0,29 s -406 0,11 y -195 0,02 uh -274 0,05 r -151 0,05 n -837 0,25 ey -676 0,12 м -158 0,05 wyn09.wav-align.txt
wyn10.wav-align.txt
.... `

В некоторых файлах нет данных, как показано, некоторые по уважительным причинам и другие по неизвестным причинам, возможно, связанные с отсутствием тишины в начало аудиофайла. Мы можем преобразовать эти логарифмически нормально распределенные данные к более нормальному распределению, используя функции натурального логарифма, таким образом:

  $ за f in * -align.(w | ah | t | s | y | uh | r | n | ey | m) / {printf "% 2s% 6.3f% 6.3f", $ 1, -log (1–5 долларов), log (3–2 доллара +1)} END {print FILENAME} '$ f | тройник -a normalign.txt; Выполнено

~~Выходной файл этой команды выглядит так:~~

  $ head normalign.txt
 w -5.342 1.099 ah -4.956 1.099 t -4.344 1.386 s -5.170 1.386 y -5.215 2.303 uh -5.024 1.099 r -4.357 1.946 n -4.990 1.386 ey -6.190 3.638 m -4.905 2.197 wyn01.wav-align.txt
 ш -4,500 1,792 а-ч -4,143 1,386 т -5,969 2,944 с -6.105 1.099 y -5.384 1.609 uh -4.700 1.099 r -5.043 1.099 n -5.342 1.099 ey -5.591 2.944 m -4.511 1.609 wyn02.wav-align.txt
 w -5.900 2.708 ah -5.606 1.386 t -4.718 1.792 s -5.352 1.099 y -4.605 1.792 uh -4.615 1.386 r -4.718 1.386 n -5.572 1.946 ey -5.720 2.197 m -5.366 1.386 wyn03.wav-align.txt
 w -7.047 3.332 ah -6.542 3.045 t -5.635 1.099 s -6.458 1.099 y -4.605 1. 792 uh -4.394 1.386 r -5.176 2.079 n -5.624 1.609 ey -5.814 2.708 m -5.663 2.485 wyn04.wav-align.текст
 w -4,234 1,946 ah -5,142 1,946 t -4,927 1,946 с -4,369 1,099 y -5,298 1,099 uh -4,663 1,609 r -5,198 1,099 n -5,147 1,609 ey -6,884 3,611 м -5,545 2,639 wyn05.wav-align.txt
wyn06.wav-align.txt
wyn07.wav-align.txt
wyn08.wav-align.txt
 w -5.635 1.099 ah -5.011 1.099 t -6.433 3.401 s -6.009 2.485 y -5.278 1.099 uh -5.617 1.792 r -5.024 1.792 n -6.731 3.258 ey -6.518 2.565 m -5.069 1.792 wyn09.wav-align.txt
wyn10.wav-align.txt
....

Мы можем использовать строки в этом файле с хорошими данными (и, следовательно, с пробелом), чтобы производят средние и стандартные отклонения и, следовательно, стандартные баллы, например:

  grep 'normalign.txt | awk '{если (! mnf || NF  standard.txt

~~Результат этой длинной команды AWK дает средние значения, стандартные отклонения и стандартные баллы:~~

  $ head standard.txt
Средние значения и стандартные отклонения акустических партитур и длительностей для каждой фонемы:
w -4,987 0,776 2,204 0,594 ah -4,921 0,706 1,714 0,543 t -5,224 0,654 1,916 0,682 с -5,078 0,545 1,657 0,534 y -5,145 0,496 1,525 0,498 uh -4,930 0,461 1.593 0,505 r -5,201 0,604 1,802 0,785 n -5,466 0,487 1,927 0,598 ey -5,674 0,452 2,583 0,717 м -5,475 0,561 2,303 0,816
 
Стандартные баллы акустических оценок и продолжительности для каждого оцененного высказывания:
w -0,458 -1,858 ah -0,050 -1,133 t +1,346 -0,777 с -0,170 -0,508 y -0,141 +1,563 uh -0,203 -0,979 r +1,396 +0,184 n +0,978 -0,905 ey -1,141 +1,471 м +1,016 -0,131 wyn01. wav-align.txt
w +0,627 -0,692 ah +1,102 -0,605 t -1,139 +1,508 с -1,885 -1,045 y -0,482 +0,169 uh +0,499 -0,979 r +0,261 -0,895 n +0,254 -1.384 ey +0,183 +0,503 м +1,719 -0,851 wyn02.wav-align.txt
w -1,177 +0,848 ah -0,971 -0,605 t +0,774 -0,182 с -0,503 -1,045 y +1,090 +0,536 uh +0,683 -0,411 r +0,798 -0,529 n -0,218 +0,031 ey -0,102 -0,539 м +0,194 -1,125 wyn03.wav-align.txt
w -2,656 +1,898 ah -2,297 +2,450 t -0,628 -1,198 с -2,533 -1,045 y +1,090 +0,536 uh +1,162 -0,411 r +0,041 +0,353 n -0,325 -0,532 ey -0,310 +0,174 м -0,336 +0,222 wyn04.wav-align.txt
w +0,970 -0,433 ah -0,313 +0,426 t +0,454 +0,044 с +1,300 -1,045 y -0,308 -0,857 uh +0.579 +0.031 r +0.004 -0.895 n +0.655 -0.532 ey -2.675 +1.434 m -0.126 +0.411 wyn05.wav-align.txt
w -0,836 -1,858 ah -0,128 -1,133 t -1,849 +2,178 с -1,709 +1,550 y -0,268 -0,857 uh -1,489 +0,393 r +0,292 -0,012 n -2,600 +2,224 ey -1,866 -0,025 м +0,723 -0,627 wyn09.wav-align.txt
....

~~Вот графическое изображение всех этих данных:~~

Стандартные оценки подходят для агрегирования с простыми арифметическими средними, и может использоваться вместе с соседними символами фонем (из -соседи.txt файлов) и оценки слов для логистической регрессии для прогнозирования можно ли получить правильную человеческую транскрипцию из звукового высказывания, или для поддержки векторной машины (SVM) и нейронных сетей, альтернативных логистическим регресс.

Вы можете услышать, что просто усредняя стандартизированные акустические оценки каждой фразы — полезная приблизительная мера разборчивости речи, поскольку три самых высоких озвучивания, wyn21.wav , wyn26.wav и wyn39.wav , все ясно разборчиво, в то время как самый низкий балл wyn09.wav пропустил весь первое слово, возможно, из-за медленного микрофона, wyn43.wav ослабляется громкое дыхание статика, а wyn04.wav — совершенно неправильная фраза. sil / &&! / NULL / {printf $ 1 «»} END {print «»} ‘wyn *.wav-соседи.txt> соседи.txt $ head neighbors.txt wyn01.wav-neighbors.txt л а х т с и а о р н эй м wyn02.wav-neighbors.txt с т ш р э эй н ай н wyn03.wav-neighbors.txt l ah d th y uw l m ay n wyn04.wav-neighbors.txt с помощью wyn05.wav-neighbors.txt с shr uw y n ey m wyn08.wav-neighbors.txt w aa p sh y ao l n ey n wyn09.wav-neighbors.txt l ae t th y uw r n ey n wyn13.wav-neighbors.txt был в этом месте wyn14.wav-neighbors.txt с помощью этого файла wyn16.wav-соседи.txt l ah t sh y ao y n eh n ….

71 из 80 файлов дал такие результаты. Давайте посчитаем, сколько точнее всего соответствовали ожидаемым фонемам в каждом высказывании:

  $ awk '{print ($ 2 == "w") + ($ 3 == "ah") + ($ 4 == "t") + ($ 5 == "s") + ($ 6 = "y") + ($ 7 == "uh") + ($ 8 == "r") + ($ 9 == "n") + ($ 10 == "ey") + ($ 11 == "m"), $ 1} 'соседи .txt | sort -n
0 wyn61.wav-neighbors.txt
1 wyn03.wav-neighbors.txt
1 wyn54.wav-neighbors.txt
1 wyn80.wav-neighbors.txt
2 wyn04.wav-neighbors.txt
2 wyn14.wav-соседи.текст
...
7 wyn48.wav-neighbors.txt
7 wyn51.wav-neighbors.txt
7 wyn53.wav-neighbors.txt
8 wyn29.wav-neighbors.txt

Этот метод также легко проверить на слух, так как wyn61.wav не просто плохой произношение, но слово, которое полностью отличается от ожидаемой фразы, и wyn29.wav четко внятно. Идеальная оценка произношения по крайней мере, объединить информацию из акустических оценок, относительной продолжительности и ближайшие совпадающие соседние фонемы.

Ранговые соотношения этих методов

Все методы, показанные выше, имеют положительную ранговую корреляцию друг с другом. и общие оценки акустики фраз в -words.txt уровне слов выравнивания, которые не показаны выше.

Непараметрическая ранговая корреляция тау Кендалла	A	N	П,	Вт
A: акустическая оценка всего выравнивания фонемы	1	0. 44	0,74	0,85
N: количество ожидаемых фонем среди соседей	0,44	1	0,57	0,47
P: средние стандартизированные акустические оценки фонем	0,74	0,57	1	0,71
W: акустическая оценка выравнивания слов (не показано)	0.85	0,47	0,71	1

~~Общие акустические оценки фразы показаны в скобках в конце этих линий в кармане на выходе phinx:~~

  wyn20.wav-align.txt: ИНФОРМАЦИЯ: pocketsphinx.c (1171): silw ah t s y uh r n ey m sil (-4099)
 
wyn20.wav-words.txt: ИНФОРМАЦИЯ: pocketsphinx.c (1171): Сил как тебя зовут Сил (-4393)

Степень, в которой каждый из этих методов коррелирует с разборчивостью или хорошее произношение остается в качестве упражнения.Обратите внимание, что все эти методы ранжирования используют только сравнения с другими учащимися (метод (B) «плохо» на диаграмме выше), поэтому они намного уступают подлинному исправлению разборчивости метод, описанный в Loukina et al. (2015) и Kibishi et al. (2014) в Ссылки ниже.

Устранение неполадок

Если вы столкнулись с ошибкой «Конечный результат не соответствует грамматике», сначала убедитесь, что вы используете вместо начального символа в Распознавание соседних фонем JSGF файлы.Если проблема не в этом, попробуйте сделать параметры -wbeam и / или -beam меньше (меньшие значения означают более широкие луч поисковый.)

То есть, попробуйте -wbeam 1e-56 -beam 1e-57 на кармашках phinx_continious командные строки. Спасибо Павлу Денисову за эти ценности. Они указаны в экспоненциальная нотация с основанием 10, но они будут сообщены pocketsphinx как отрицательный целочисленный логарифм, пороги отсечения перехода между состояниями таким образом:

  ИНФОРМАЦИЯ: fsg_search.c (227): FSG (луч: -1282, pbeam: -1080, wbeam: -1260; wip: -26, pip: 0)

Вот начало оптимизации задача по настройке той и другой команды параметры поиска строки. Вот статья, описывающая другой подход к получение сложных центровок на более длительный срок высказывания. См. Также: http://cmusphinx.github.io/2014/07/long-audio-aligner-landed-in-trunk/

Помните, что PocketSphinx имеет API, потому что у вас есть исходный код, и вы можете изменить его, чтобы он делал то, что вы хотите, чтобы вы могли запрограммируйте его на C, который намного быстрее, чем bash и AWK.

PocketSphinx.js

Два потенциальных абитуриента (пока) на Google Summer of Code 2017 перенесены приведенные выше примеры «Как вас зовут» на pocketsphinx.js:

~~Для них требуется Chrome или Firefox со звуком микрофона WebRTC (GetUserMedia) разрешение на ввод.~~

Список литературы

Лукина, и др. (сентябрь 2015 г.) «Точность и разборчивость произношения. неродной речи », InterSpeech-2015, Материалы Шестнадцатой Ежегодная конференция Международной ассоциации речевой коммуникации (Дрезден, Германия: Служба образовательного тестирования.) http://www.oeft.com/su/pdf/interspeech3015b.pdf

Kibishi, et al. (Май 2014 г.) «Статистический метод оценки владение произношением / разборчивость презентаций на английском языке японцами выступающих », ReCALL (Европейская ассоциация компьютерных языков Обучение.) DOI: 10.1017 / S0958344014000251. http://www.slp.ics.tut.ac.jp/Material_for_Our_Studies/Papers/shiryou_last/e2014-Paper-01.pdf

Ронанки, Салсман и Бо (декабрь 2012 г.) «Автоматическая оценка произношения. И обнаружение неправильного произношения с помощью CMUSphinx »в материалах от 24-го Международная конференция по компьютерной лингвистике (Мумбаи, Индия: COLING 2012) стр. 61-67: http://www.aclweb.org/anthology/W12-5808 Исходный код репозиторий: https://sourceforge.net/p/cmusphinx/code/HEAD/tree/branches/speecheval/ Блог: http://pronuctioneval.blogspot.com/

Салсман, Дж. (Июль 2014 г.) «Проблемы развития в области автоматического распознавания речи. для компьютерного обучения произношению и изучению языка »в Труды исследования проблем компьютерного обучения языкам Конференция (Антверпен, Бельгия: CALL 2014.) http://talknicer.com/Salsman-CALL-2014.pdf

~~CMUSphinx PocketSphinx учебное пособие: https://cmusphinx.github.io/wiki/tutorialpocketsphinx~~

Huggins-Daines, David, et al. (2006) «Pocketsphinx: бесплатное приложение в реальном времени. система распознавания слитной речи для портативных устройств ». Труды Международная конференция IEEE по акустике, обработке речи и сигналов (ICASSP) т. 1: https://www.cs.cmu.edu/~awb/papers/ICASSP2006/0100185.pdf

~~Исходный код PocketSphinx: https: //cmusphinx.github.io / doc / pocketsphinx / files.html~~

Russell et al. (Ноябрь 1992 г.) «Детский речевой тренажер», патент США. 5 679 001 (срок действия истек; первоначально был выпущен в Великобритании как «Помощь для обучения речи») https://www.google.com/patents/US5679001

Труды Международного симпозиума по автоматическому обнаружению ошибок в Обучение произношению, , 6–8 июня 2012 г., KTH, Стокгольм, Швеция. http://www.speech.kth.se/isadept/ISADEPT-proceedings.pdf

Труды семинара по речевым и языковым технологиям в образовании, 4–5 сентября 2015 г. (Сателлитный семинар Interspeech 2015 и ISCA Special Interest Group SLaTE) Лейпциг, Германия.https://www.slate2015.org/files/SLaTE2015-Proceedings.pdf

Чен и Ли (2016) «Компьютерное обучение произношению: от оценка произношения в отношении изучения разговорного языка » Труды 2016 Азиатско-Тихоокеанская ассоциация обработки сигналов и информации (APSIPA) Ежегодный саммит и конференция: http://www. apsipa.org/proceedings_2016/HTML/paper2016/227.pdf

~~Библиография по обучению произношению с помощью компьютера: http://liceu.uab.es/~joaquim/applied_linguistics/L2_phonetics/CALL_Pron_Bib.html~~

~~Панайотов В., и др. (2015) «LIBRISPEECH: корпус ASR, основанный на Аудиокниги домена » http://www.danielpovey.com/files/2015_icassp_librispeech.pdf~~

~~Хуэй Цзян (2005) «Меры уверенности в распознавании речи: A опрос,» Речевое общение 45: 455–470~~

Проект предложения GSoC 2017

Пожалуйста, посмотрите https://en.wiktionary.org/wiki/Wiktionary:Grease_pit/2017/March#Please_comment_on_adding_pronuction_assessment для демонстрационного примера.

Голы

а. Избавьтесь от всех отзывов об оценке произношения, которые не связаны с связанное с этим неправильное произношение, противоречащее подлинному разборчивость.

г. Переходная обратная связь с неправильным произношением от визуальных сигналов к паре звуковых слова на родном языке учащихся, первые содержащая правильную фонему, а вторая содержащая ошибочный звук произведено.

~~г. Измерьте результирующее повышение производительности обучения.~~

Фаза I

Начать сбор транскрипций высказываний учащихся. Этот сбор данных задача — это узкое место, без которого вы не сможете понять, какие ошибки в произношении являются последовательными. Итак, для продвинутых учеников включите запись другого ученика. основной фразы записанного высказывания, и просто попросите их ввести то, что они слышал. Например, при отображении сообщения «Прослушайте эту фразу и введите в английских словах, которые вы слышите », включите этот звук для фразы:« I’m here on от имени группы отелей Excellence Hotel.»В этом примере предположим, что в audio, «имя» было неправильно произнесено как «beh-alf», а «Excellence» — неправильно произносится как «отлично», но в остальном все хорошо.

Учащийся вводит текст: «Я здесь от имени отличного отеля. группа.» (То есть, продвинутый учащийся, выполняющий расшифровку, получает право «от имени», но не транскрибирует Excellence правильно, потому что было неправильно произнесено.)

Система видит, что «Excellence» было неправильно расшифровано, в то время как SR система сообщает о двух неправильных произношениях.Поэтому обновите запись в базе данных для эта фраза о том, что подсчет соответствующих фонем в «имени» несущественно, но окончательный / s / в «превосходстве» имеет значение, если неправильно произносится.

Фаза II

После сбора достаточного количества данных начните игнорировать несущественные неправильное произношение. Это должно быть ясно сверху. Ваша база данных всех фразы будут иметь вероятность, связанную с каждой фонемой. Масштабировать каждый акустическая оценка неправильного произношения с такой вероятностью, чтобы установить сокращение балл за масштабированные значения, которые не будут оценены как неправильные (или желтые вместо оранжевого, e.г.)

Этап III

Создайте библиотеку слов для каждого учащегося первого языка, содержащую каждый фонема возле фронта. Это не особо долгая задача по сравнению с для его поддержки задействовано кодирование, но очевидно, что для этого нужны люди, свободно владеющие всеми первых языков. Итак, вместо того, чтобы показывать зеленый / желтый / оранжевый, вы можете играть например Испанское слово, которое начинается со звука / с /.

Итак, вы можете сказать, что на испанском языке звук (важно, чтобы языковой звук): «Когда вы сказали« превосходство »[это целевое слово на английском языке], вы нужен был звук, с которого начинается [какое-нибудь испанское слово, начинающееся с / s /], но вместо этого вы произнесли звук [какое-то испанское слово, начинающееся с / t /] начинается с.Послушайте, что вы сказали … [сыграйте неправильно произнесенное слово ученика.] Вы должны были сказать превосходство [слово снова по-английски]. Нажмите «Воспроизвести», чтобы услышать это снова. » И все это при отображении слова «Превосходство» и двух кнопок «Воспроизвести». и продолжить.

Контрольный список требований к программным компонентам

~~Отображение фраз и сбор записей (это необходимо начинать заранее вместе с сбором транскрипции)~~
~~Сравнить напечатанную транскрипцию с ожидаемым текстом~~
~~Определить результаты по фонемам (согласно e.грамм. результаты распознавания речи из работы GSoC 2012)~~
Сохранение положительных и отрицательных результатов подсчета в базе данных {phrases x phonemes} для устранения последствий неправильного произношения
~~Игнорировать неправильное произношение, не соответствующее вычисленному порогу~~
~~Отображение неразборчиво произнесенного слова~~
~~Поиск слов на первом языке, соответствующих неправильному произношению~~
~~Извлечь неправильно произнесенное слово учащегося с временными кодами сегмента~~
~~Воспроизвести записанный звук из извлеченных слов учащегося~~
~~Воспроизведение аудиозаписи из библиотеки слов на родном языке~~

EmacsWiki: wuxch-dict.el

~~Загрузить~~


(defun сделать-словарь-вставить-слово (новое-слово)
  "сделать-словарь-вставить-слово:"
  (сделать-словарь-вставить-все новое-слово "" "" "" "")
  )

(defun do-Dictionary-insert-all (новое-слово-фонетический новый-термин новый-английский новый-китайский)
  "сделать-словарь-вставить-все:"
  (let ((словарь-имя-файла "~ / словарь / словарь.bib")
        (comment-str "@comment {"))
    (найти-файл словарь-имя-файла)
    (goto-char (точка-мин))
    (если (search-forward (concat "VOCABULARY {" новое-слово ",") nil t)
        (прогноз
          (новое слово "% s уже в словаре"))
      (прогноз
        (goto-char (точка-мин))
        (когда (search-forward comment-str nil t)
          (предыдущая строка)
          (начало строки)
          (вставить (concat "\ n @ VOCABULARY {" новое-слово ", \ n"))
          (вставить (concat "key = {" новое-слово "}, \ n"))
          (вставить (concat "word = {" новое-слово "}, \ n"))
          (вставить (concat "phonetic = {\\ char \" 005B "new-phonetic" \\ char \ "005D}, \ n"))
          (вставить (concat "term = {" new-term "}, \ n"))
          (вставить (concat "english = {" new-english "}, \ n"))
          (вставить (concat "китайский = {" новый-китайский "}, \ n"))
          (вставить (concat "owner = {吴晓春}, \ n"))
          (insert (concat "timestamp = {" (формат-время-строка "% Y. % m.% d ")"}, \ n "))
          (вставить (concat "} \ n"))
          (сохранить буфер)
          )
        )
      )


    )
  )

(defun словарь-вставка (новое-слово)
  "поиск-дикт-ввод:"
  (интерактивное «sWord:»)
  (сделать-словарь-вставить-слово: новое-слово)
  )



(defun babylon-translation-parse (buf)
  "Вавилон-перевод-синтаксический анализатор:"
  (let ((word nil) (фонетический nil) (term nil) (english nil) (китайский nil))
    (переключение на буферный буфер)
    (goto-char (точка-мин))
    (setq word (слово вещь в точке))
    
    (когда (повторный поиск-вперед "\\ [\\ (.\\ (n \\ | adj \\ | adv \\ | v \\ | prepare \\ | vi \\ | vt \\ | con \\) \\. [] ")
      (setq термин (строка соответствия 1))
      

      (setq english (буфер-подстрока (точка) (позиция-конец строки)))
      
      )
    (если (и слово фонетический термин английский китайский)
        (прогноз
          (сообщение "синтаксический анализ из вавилонского перевода ОК!")
          (перечислить слово фонетический термин английский китайский)
          )
      (прогноз
        (сообщение "ошибка перевода из вавилона!")
        ноль
        )
      )
    )
  )

(global-set-key [(control c) (b)] 'babylon-translation-to-my-dict-and-cite)

(defun babylon-translation-utility-add-cite (текст-слово, дикт-слово)
  "Вавилон-функция-перевод:"
  (вставить (concat "\\ cite {" dict-word "}"))
  (заполнить абзац t)
  (сохранить буфер)
  (сообщение "цитируйте \"% s \ "с \"% s \ "OK!" текстовое слово dict-word)
  )

(defun вавилон-полезность-слово-предложение (слово)
  "Вавилон-полезное-слово-предложение:"
  (пусть ((предложение)
        (len (длина слова))
        (число-последней-буквы-игнорировать 1)
        )
    (setq предполагать (concat (слово-подстрока 0 (- len число-последней-буквы-игнорировать)) "[a-z] *"))
    )
  )

(defun babylon-translation-to-my-dict-and-cite ()
  "Вавилон-преобразование-диктовать-цитировать:"
  (интерактивный)
  (пусть * ((dict-word)
         (текст-слово)
         (совпадающее-текст-слово)
         (исходный-бафф (текущий-буфер)))
    (setq dict-word (babylon-translation-to-my-dict))
    (когда дикт-слово
      (setq текстовое слово dict-слово)
      (переключение на буфер исходный бафф)
      (если (повторный поиск-вперед (concat "\\ b" dict-word "\\ b") nil t)
          (прогноз
            (Вавилон-перевод-утилита-добавить-цитировать текстовое слово dict-слово)
            )
        (прогноз
          (setq текст-слово
                (читать-регулярное выражение
                 (concat "не могу найти [" dict-word "], повторить поиск?"
                         "по умолчанию: [" (вавилонское-служебное-слово-предложение дикт-слово) "]")
                 (Вавилон-полезное-слово-предложение дикт-слово)))

          (если (повторный поиск-вперед (concat "\\ b" текстовое слово "\\ b") nil t)
              (прогноз
                (setq сопоставленное-текстовое-слово (строка-сопоставления 0))
                (Вавилон-перевод-утилита-добавить-цитировать совпадающее-текст-слово дикт-слово)
                )
            (прогноз
              
              (goto-char (точка-мин))
              (если (повторный поиск-вперед (concat "\\ b" текстовое слово "\\ b") nil t)
                  (прогноз
                    (setq сопоставленное-текстовое-слово (строка-сопоставления 0))
                    (Вавилон-перевод-утилита-добавить-цитировать совпадающее-текст-слово дикт-слово)
                    )
                (прогноз
                  (сообщение "поиск снова завершился неудачно, прервать!")
                  )
                )
              )
            )
          )
        )
      )
    )
  )

(Defun babylon-translation-to-my-dict ()
  "синтаксический анализ-вавилон-дикт:"
  (интерактивный)
  (let ((buf "* babylon-temp-buffer *")
        (результат синтаксического анализа равен нулю)
        (слово))
    
    (если (get-buffer buf)
        (буфер уничтожения buf)
      (прогноз
        (переключение на буфер (get-buffer-create buf))
        (буфер обмена)))

    (setq parse-result (babylon-translation-parse buf))
    (если parse-result
        (прогноз
          (setq word (результат синтаксического анализа n-го 0))
          (сделать-словарь-вставить-все слово
                                    (n-й 1 результат синтаксического анализа)
                                    (n-й 2 результат синтаксического анализа)
                                    (n-й 3-й результат синтаксического анализа)
                                    (n-й 4-й результат синтаксического анализа))
          (убить новое слово)
          (буфер уничтожения buf)
          (сообщение "поместить [% s] в словарь ОК и оставить в буфере обмена" слово)
          слово
          )
      (прогноз
        (сообщение "ошибка перевода из вавилона!")
        ноль
        )
      )
    )
  )

(defvar babylon-phonetic-adjust-list ноль)
(setq babylon-phonetic-adjust-list '(
                                     ("ɪ". "я")
                                     («ʊ». «u»)
                                     ("‚ "." \\ char \ "0345")
                                     ("ː". ":")
                                     («ɒ». «ɔ»)
                                     ))

(defun вавилон-фонетическая-корректировка (исходная-стр.)
  "Вавилон-фонетическая-корректировка:"
  (пусть ((длина (длина исходная строка))
        (i 0) (ch nil) (пара настроек)
        (вне строки ноль))
    (в то время как ( Glottopedia 
 Glottopedia - это свободно редактируемая энциклопедия для лингвистов, созданная лингвистами, которая в настоящее время находится в стадии разработки.Он будет содержать словарные статьи по всем техническим терминам лингвистики и многоязычный. Кроме того, есть обзорные статьи, биографические статьи и языковые статьи, возможно, по всем лингвистам и всем языкам.
 Статьи Glottopedia также существуют на немецком, испанском, итальянском, французском, русском, датском, шведском, китайском, японском, норвежском (нюнорск) и, надеюсь, в будущем, также на многих других языках.
  Glottopedia нужна ваша помощь !
 Редакторы 
  Главные редакторы : Др.Свен Науманн, доктор Ян Вольгемут
  Технический редактор : Тим Ростин
 Научно-консультативный совет 
 Габриэль Альтманн, Пьер Марко Бертинетто, Гревиль Г. Корбетт, Остен Даль, Мартин Хаазе, Мартин Хаспельмат, Райнхард Кёлер, Джон Маквортер, Ева Шёнке, Юрген Ведекинд
 Синтаксис 
 (см. Также Портал: Синтаксис)
 прилагательное, аллитеративное соглашение, аппликатив, приложение, структура аргумента, атрибут, падеж, дополнение, контактное предложение, координирующее выражение, основной аргумент, c-структура, преобразование дательного падежа, грамматика зависимостей, многоточие, эргативность, свободное состояние, полный глагол, пробел, инфинитив, внутренний аргумент, лексическая категория, отрицательное согласование, неконфигурационность, существительное, часть речи, грамматика фразовой структуры, многогранник, предложная фраза, pro, PRO, продвижение, богатое согласие, семантическая макророль, подлежащее, подчиненный, субсравнительная конструкция, синтаксическая функция , Теория X-стержня, Θ-роль
 Морфология 
 (см. Также Портал: Морфология)
 винительный падеж, адфикс, аффикс, аллокутив, основание, система категорий, мертвый, деривация, измерение, распределенная морфология, ругательная инфиксация, деление, флаг, обеднение, инфинитив, перегиб, лексема, макропарадигма, морфема, морфофонемика, морфосинтаксическая категория косой падеж, множественное число тантумов, префикс, дубликат, симплекс, лежа на спине, приостановленная аффиксация, синкретизм
 Фонетика и фонология 
 (см. Также Портал: Фонетика и фонология)
 аффрикат, апокоп, апикодентальный, аппендикс (в слоговой структуре), аппроксимант, хриплый голос, кода, компенсаторное удлинение, теория контрастной спецификации, дактиль, декларативная фонология, дегенеративная стопа, фонология зависимости, экстраметричность, фрикативный, губно-зубной, гортанный, ларингеальный жидкость, манера артикуляции, принцип максимального начала, метрическая фонология, минимальное ограничение слов, носовой, естественный класс, акцент высоты тона (лексический), препендикс, остановка, ударение, синхронизированный по ударению и по слогам, увулярный, велярный, веларизация, гласный
 Семантика 
 (см. Также Портал: Семантика)
 агент, двусмысленность, антоним, аспект, комиссив, собирательное существительное, коннотация, de dicto и de re, обозначение, директива, эхо-вопрос, лицо, хедж, холоним, гипероним, гипоним, идиома, иллокуция, импликатура, косвенный речевой акт, внутренне обусловленная ситуация, значение, модальность, естественный семантический метаязык, перформативный глагол, перлокутивный акт, предложение, протазис, семантический маркер, семантическая роль, смысл, специфичность, речевой акт, тетическое vs. категоричность, расплывчатость
 Диахрония 
 (см. Также Портал: Диахрония)
 антиграмматикализация, заимствование, род, гаплология, гиперанализ, инновация, языковая семья, заимствованное слово, нормальная передача, распространение, толкающая цепь, реанализ, звуковой закон, синтаксизация, ксенизм
 Компьютерная лингвистика 
 (см. Также Портал: Компьютерная лингвистика)
 Brill-Tagger, функциональная логика, конечные автоматы, GPSG, HPSG, LFG, правила ID / LP, согласование KWIC, синтаксический анализатор, неглубокий анализ, подчинение, теггер, двухуровневая морфология, унификация, грамматики на основе унификации, машина перевод, разбивка
 Количественная лингвистика 
 (см. Также Портал: Количественная лингвистика)
 цели и методы количественной лингвистики, история количественной лингвистики,
свойство, единица измерения, энтропия, частота, функция, закон, теория графов, гипотеза,
индекс, информация, теория информации, числовая классификация, длина, мера,
метрики, модель (здание), экономика, процесс, масштаб, языковой закон, статистика,
структура, синергетическая лингвистика, система, системные требования, текст, статистика текста,
теория, распределение, повторение, свойства слова, взаимосвязь, многозначность, политекстуальность, соседи, частота Ngram
 (см. Также: Портал: Биография)
 Карл Фердинанд Беккер, Йоханнес Бенцинг, Саймон К.Дик, Дионисий Тракс, Стефан Элдерс, Х. Аллан Глисон младший, Эйнар Хауген, Марко Хаверкорт, Карл Эрих Хейдольф, Борис Исаакович Ярчо, Георг Фридрих Мейер, Гарри Л. Шорто, · Джон Синклер, Сергей А. Старостин, Йост Винтелер
 ситхов (язык) | Вукипедия | Фэндом 
 Ситхи 
  [Источник] 
 " Dzworokka yun; nyâshqûwai, nwiqwai.Wotok tsawakmidwanottoi, yuntok hyarutmidwanottoi  "
 ―Правило двух ^[src]
  Ситх , или  язык ситхов , был родным языком жителей Зиоста и Коррибана. Он был принят как мистический язык Ордена ситхов после того, как тёмные джедаи-изгнанники поработили ситхов. Ситх был агглютинативным языком, в котором слова или даже фразы состояли из линейных последовательностей отдельных значимых единиц. Несмотря на превосходство Галактического Базового Стандарта, язык ситхов использовался вплоть до постимперского периода.Для Затерянного племени ситхов, ордена, основанного на далекой планете Кеш, язык ситхов был известен как , Старый язык .
  Satal Keto : « Клянусь Императрицей! Я ... Я прекрасно это читаю! »
  Оммин : « Конечно, можешь, сын мой. »
 - Сатал Кето получает знание языка ситхов от короля Оммина ^[src]
 Книга заклинаний Фридона Надда была написана на ситхах
 Первоначально на этом языке говорили только ситхи, вид краснокожих гуманоидов ^[9] из Стигийской кальдеры.^[10] Позже он был расширен и развился, когда второе поколение темных джедаев отделились от Ордена джедаев в 7000 ДБЯ, сразу после битвы при Корбосе, и поработили коренных жителей Коррибана. ^[9] Язык ситхов стал символом недавно созданного Ордена ситхов, могущественной секты адептов темной стороны. Это стало проще благодаря созданию приспособлений, известных как переводческие талисманы. ^[11] Такие артефакты, первоначально разработанные и созданные джедаями-изгнанниками, которые стремились узнать секреты ситхов, позволяли их владельцу читать ситхский язык, как если бы это был его родной язык.^[12] Кодекс ситхов, первоначально написанный на Basic изгнанником Сорзусом Сином и вдохновленный образом жизни чистокровных ситхов, ^[1] был также переведен на язык ситхов как Qotsisajak. ^[13]
 Примерно в 5000 ДБЯ ситхский дредноут  Omen  был вынужден совершить крушение на далекой планете Кеш. Обездоленные ситхи так и не смогли вернуться в космос, поэтому они поселились среди местных кешири и основали Затерянное племя ситхов. Это позволило языку ситхов расшириться далеко от его колыбели.^[4] В этой маргинальной колонии ситхов язык стал известен как «Старый язык». ^[14]
 Три голокрона ситхов мастера Атриса
 Даже после того, как большинство ситхов принадлежало к другим расам, кроме чистокровных ситхов, язык сохранился в голокронах, ^[15] храмах и фолиантах. ^[11] Однако, за пределами кругов темной стороны, очень немногие ученые знали, как расшифровать этот язык, и еще меньше умели произносить его сложные словесные структуры.^[12] Намного позже, в одиннадцатом веке до битвы при Явине, человек Дарт Бэйн познакомился с языком древних ситхов во время учебы в Академии Коррибана, в отличие от большинства своих однокурсников. Бэйн будет искать мудрость давно умерших мастеров в томах в кожаном переплете, покрытых кроваво-красными чернилами. ^[2]
 Тысячелетия после основания Ордена ситхов, люди столь же современные, как павшая джедай Верджер ^[16] и Джерек ^[17] или салластанский натуралист Др'уун Унн, ^[18] говорил это.Члены Затерянного племени ситхов также сумели сохранить знание Старого Языка, и все члены от учеников и выше знали это. Например, Вестара Кхай смогла использовать его, чтобы общаться со стаей Тук'ата на Коррибане. ^[14] Последние члены Ордена лордов ситхов, основанного Бэйном, Дартом Сидиусом и его последующими учениками Дарт Мол, Дарт Тиранус и Дарт Вейдер, все были способны бегло говорить на ситхском языке. ^[19]
 Фонетическая палитра языка ситхов состояла из 23 фонем или звуков речи.Было примерно 17 препятствий: / t /, / d /, / k /, / q /, / m /, / n /, / ts /, / dz /, / s /, / z /, / h /, / t͡ʃ /, / j / / ʃ /, [ɹ / l], / w /, / ʎ /. ^[20] Соответственно, графемическая система для их представления была  t ,  d ,  k ,  q ,  m ,  n ,  ts ,  dz ,  s ,  z ,  h ,  ch ,  j ,  sh ,  r / l ,  w ,  y . ^[5]
 Также было 6 различных гласных: / i / или  i  (как в «тепло»), / æ / или  â  (как в «bash»), / u / или  u.  (как в «костюме»), / ʌ / или  û  (как в «клубе»), / oʊ / или  или  (как в «жаба»), / a / или  a  (как в « ах ").^[5] Кроме того,  a  и  o  можно комбинировать с  i  для получения дифтонгов:  oi  (как в «игрушке») и  ai  (как в «купить»). ^[5] Эпентическая гласная была / u /.
 Из-за этого ограниченного сегмента инвентаря ситхские писцы столкнулись с трудностями при попытке перевести не ситхские имена. Например, имя Палпатина должно быть расшифровано как  Marmûtin , поскольку в языке ситхов не было звука «p» или «l» между двумя согласными.Чтобы преодолеть такие трудности, творческие писцы фактически переводили имя на свой язык, исходя из его этимологии. ^[5] Ассимиляция из заимствованных лексических единиц предпочтительна по месту артикуляции: у Палпатина, / p /> / m /
 Морфемы ситхов - самые маленькие значимые единицы в грамматике языка - часто состояли из закрытых слогов (слогов, оканчивающихся на согласные), что заставляло их звучать живо и прерывисто. В языке регулярно делались ударения, каждое слово ставилось с ударением на первом слоге.^[5]
 В языке ситхов не поощрялись гласные в перерывах, и вставлялись скользящие / j / или / ʎ /, когда две гласные появлялись рядом друг с другом. Фраза  siqsayanjat  («о демоне») фактически состояла из  siqsa  («демон») и  anjat  (аблативный маркер существительного) с добавлением glide  y  для устранения перерыва. ^[21]
 В языке ситхов широко использовалась регулярная агглютинация и производные суффиксы в большей степени, чем в базовом Галактическом стандарте.К корню можно было добавить множество разных маркеров, пока не образовывались очень длинные слова - и одно слово могло составить целое предложение. Например, фраза «из-за сна о демоне» переводится на ситх как одно слово  kûskutsiqsayanjat . Это слово состояло из четырех различных морфем:  kûsk  +  ut  +  siqsa  +  (y) anjat  = «мечтать» + (номинальный маркер глагола) + «демон» + (аблятивный маркер существительного). Некоторые маркеры можно было добавлять только к существительным, а другие - только к глаголам.^[5]
 Порядок слов [править | править источник] 
 Типичный декларативный порядок слов ситхов был глагол / субъект / объект - например, «Вонокш Кьясик монахиня» буквально означало «Освободи / Сила / я». Однако существовали и предложные фразы, а предметы или предметы иногда можно было поставить в начале предложения для акцента. ^[13]
 глаголов [править | править источник] 
 Корни глаголов обычно состояли из одного слога и оканчивались согласной.Настроения, времена и другие тонкости указывались маркерами глаголов-суффиксов. Например, добавление  -atul  выражало алетическое настроение, уверенность говорящего в том, что действие было логически необходимым или очевидно истинным. (Фраза  Châts nu midwan  будет «Я обретаю силу», а ее алетическая форма  Châtsatul nu midwan  может быть переведена как «Я обязательно обретаю силу».) Кроме того, добавление  -oksh  выражает будущее время. (Например,  монахиня Вон Кьясик  означает «Сила освобождает меня», а  Монахиня Вонок Кьясик  означает «Сила освободит меня.Суффикс  -win  иногда добавлялся к переходному глаголу для обозначения эргативности, означая, что грамматический субъект этого глагола фактически был его семантическим объектом, в то время как истинный семантический агент оставался невыраженным (во фразе  kotswinot itsu  или «мои цепи разорваны», описанное действие на самом деле выполняется с субъектом  itsu  неопределенным агентом.) ^[13] Благодаря суффиксу  -ut , глаголы также могут быть именованными (например, ,  kskut  было «сновидением», а  kûskut  было «актом сновидения». ") ^[5]
 Существительные [править | править источник] 
 Существительные ситхов имеют падежи, флективные формы, указывающие на их грамматическое отношение к другим словам в предложении. Эти случаи были выражены добавлением маркера существительного. Известными случаями были инструментальный падеж ( -jontû ), аблативный падеж ( -anjat ), дательный падеж ( -ottoi ). Инструментальный падеж указывал, что отмеченное им существительное было средством совершения действия, выраженного предложением; например,  ashajontû  означало «через победу».«Что касается аблативного падежа, его лучше всего перевести на базовый язык, используя предлог« о ». Слово  siqsayanjat  означало« о демоне / о демоне ». :  midwan  было "власть", а  midwanottoi  означало "для / для власти". ^[5]
 " Почему-то шрифт Массасси с крючками и зубцами на каждом глифе казался более опасным, чем любые проклятия, которые они могли вызвать. "
 ―Корранский рог ^[src]
 Экзар Кун читает ситхские иероглифы
 Изначально язык ситхов был написан сложными иероглифами. На протяжении веков писцы ситхов хотели разработать менее сложные сценарии. Это привело к созданию двух разных скриптов. Первый, известный как «Общие ситхи», использовался для повседневного обихода, а другой, «Высокие ситхи», использовался в церковных целях. ^[6] Третья система письма, известная как Киттат, также использовалась для свитков заклинаний.Последняя состояла из тридцати семи рун и подходила как для каллиграфии, так и для эпиграфики. ^[5]
 Воины массасси, которые следовали за лордом ситхов Нагой Садоу в изгнании на четвертой луне Явина Прайма, также разработали свою собственную иероглифическую систему, упрощенную версию Высших ситхов. С помощью этой новой системы письма они высекли множество надписей на стенах храмов и обелисках, разбросанных по джунглям Явина 4, ^[6], особенно в Храме скопления Синего листа ^[18] или у монументального заднего входа в Великий храм . ^[22] Когда салластанский натуралист Друун Унн исследовал Явин 4 от имени Альянса за восстановление Республики, он успешно перевел некоторые тексты массасси, содержащиеся в храме Экзара Куна. ^[22] Когда Новый Орден джедаев Люка Скайуокера основал свою академию на Явине 4, Скайуокер и некоторые из его учеников научились расшифровывать этот сценарий, что позволило им читать Книги Массасси. ^[23]
 " Неудача и непослушание - одно и то же... На языке ситхов оба переводятся как «измена». Это мудрость древних!  "
 ―Razer ^[SRC]
 Ситх  Базовый
 ' Ari  «Лорд» ^[24]
  Ajak  «Доктрина» ^[5]
  Алеф  Буква общеситского алфавита ^[23]
  -anjat  Маркер аблятивного существительного ^[5]
  Asha  «Победа» ^[13]
  -atul  Маркер глагола алетического настроения ^[13]
  Châts  «Чтобы получить» ^[13]
  Чирикят  «Тот, кто заставляет их биться и дрожать от страха» ^[5]
  Чваят  «Власть, закон» ^[5]
  Чваятюн  «Правило двух» ^[5]
  Chwit  «Бросить» ^[21]
  Chwûq  «Уголь» ^[1]
  Далет  Буква общеситского алфавита ^[23]
  Деррифан  «Пожиратель» ^[25]
  Двомуцикса  «Вызов демона» ^[1]
  Дзвол  «Существовать, оставаться» ^[5]
  Dzu  «Лист, листообразный объект» ^[21]
  Grotthu  «Раб» (относится к низшей касте ситхов) ^[1]
  Hadzuska koshûjontû  «рожденный в тени» ^[1]
  Хаск  «Страдания» ^[5]
  Hyal  «Жаждать» ^[5]
  Itsu  «Цепочка» ^[13]
  Jen  «Темный», «тень», «скрытый» ^[24]
  Дзидай  «Джедаи» ^[24]
  Джен'ари  «Темный лорд (ситхов)» ^[24]
  Джен'джидай  «Темные джедаи» (имеется в виду именно Темные джедаи-изгнанники Столетней тьмы) ^[24]
  Дженсаараи  «Скрытые последователи истины» ^[24]
  Jiaasjen  «Интеграция тени» ^[24]
  -jontû  Инструментальный маркер существительного ^[13]
  Kaggath  Древний обряд ситхов ^[26]
  Каф  Буква общеситского алфавита ^[23]
  Кинтик  «Самый черный» (множественное число) ^[1]
  Киссай  «Жреческая каста» ^[1]
  Коц  «Разорвать» ^[13]
  кун  «Только» (используется как суффикс) ^[13]
  Kûsk  «Мечтать» ^[5]
  -кут  Маркер совокупного множественного числа существительного ^[5]
  Ламед  Буква общеситского алфавита ^[23]
  Массасси  «Каста воинов» ^[1]
  Midwan  "Power" ^[5]
  Mwintuska hâskûjontû  «Обиженный на боли» ^[1]
  Нин  «Галстук, узел» ^[5]
  Ninûshwodzakut  «Узловщики внутренностей» ^[1]
  Nu  "I" ^[13]
  Монахиня  «Я» ^[13]
  Nuyak  «Мой» (множественное число) ^[13]
  Nwit  "Маленькие, немногочисленные" ^[21]
  Nwûl  «Мир» ^[5]
  Няш  «Большой, много, много» ^[5]
  Ододжинья  «Темная паутина» ^[1] (не буквальное значение) ^[21]
  -окш  Маркер глагола будущего времени ^[13]
  -ottoi  Маркер существительного дательного падежа ^[5]
  Qabbrat  «Комната медитации» ^[27]
  Qâzoi Kyantuska  «Подавить мысли» ^[1] (не буквальное значение) ^[21]
  Qo  «Путь, путь» ^[13]
  Qorit  «Конец» ^[5]
  Qotsisajak  «Кодекс ситхов» ^[13]
  qû  Сравнительная частица ^[5]
  Qyâsik  «Сила» ^[13]
  Рак-скури  «Певец мечты» ^[14]
  Рор'джан  «Та-чей-листья-пот-яд» ^[28]
  Самех  Буква общеситского алфавита ^[23]
  Седрисс  Слово ситхов неизвестного значения, принятое Кага Лок в качестве титула ^[29]
  Шоккай  Перевод неизвестен ^[1]
  Ситх  «Высший», «премьер», «совершенный» ^[1]
  Сит'ари  «Повелитель / Король», «совершенное существо», «бог» ^[1]
  Саарай  «Правда» ^[24]
  Саараи-Каар  «Хранитель истины» ^[24]
  Шасот  «Борьба, страсть» ^[13]
  Голень  Буква общеситского алфавита ^[23]
  Siqsa  «Демон» ^[5]
  Сутта  «Копье» ^[21]
  Сутта Чвитускак  «Бегущие копья» ^[21]
  Тарал  «Защищающий», «защитник» ^[30]
  Таш  «Ложь» ^[13]
  -ток  Маркер порядкового номера ^[5]
  Цайвинокка Хоякут  «Воскрешенные мертвые» ^[1] (не буквальное значение) ^[21]
  Цавак  «Вариант осуществления» ^[5]
  Tsis  «Ситх» ^[31]
  Цисаяк  «Доктрина ситхов» ^[13]
  Цёк  «Отжать рукой» ^[5]
  Туката  «Гончая ситхов» (разновидность порождений ситхов) ^[32]
  Тайфоджем  «Бог-левша» (древнее божество ситхов) ^[1]
  Тайро  Ситх-стажер, еще не ставший учеником Мастера (используется Затерянным племенем ситхов, может быть кешири по происхождению) ^[33]
  Tyûk  «Прочность» ^[13]
  -ûsh  Агентивный маркер глагола ^[1]
  -ut  Именной маркер глагола ^[5]
  wai  Частица отрицания ^[5]
  -win  «Маркер эргативного глагола» ^[13]
  Wo  «Один» ^[5]
  Wodza  "Кишечник" ^[5]
  Вон  «Бесплатно» ^[13]
  Воюнокс  «Маленький» ^[1]
  Юнь  «Двойка» ^[5]
  Заин  Буква общеситского алфавита ^[23]
  Зугурук  «Инженер» (относится к касте в обществе ситхов) ^[1]
  Dzworokka yun; ньяшкувай, нвикваи. Wotok tsawakmidwanottoi, yuntok hyarutmidwanottoi.  - «Их должно быть двое; ни больше, ни меньше. Один олицетворяет силу, другой - жаждет ее». ^[5]
  Эйах сех маат, шу кор хуан.  - Неизвестно. Что-нибудь успокаивающее. ^[14]
  Хаа, нейо ла юд масур ки, тах уна кахру лур шу.  - Неизвестно. Что-то угрожающее и вызывающее. ^[14]
  Ja'ak.  - «Я свободен». ^[34]
  На-хах ур су ка-хаат.Су ка хару ат.  - Неизвестно. Скорее всего, что-то вроде: «Приведи к нам ситхов, если они здесь есть». ^[14]
  Taka zeech ma toka duuwaj.  - Неизвестно. Заклинание для доступа к обелиску ситхов. ^[12]
  Ура-каа!  - Неизвестно. Наверное, что-то вроде "Стой!" или "Замри!" ^[14]
  Вексок савака.  - «Просыпайтесь, есть работа». ^[34]
  Жол каш динора.  - «Готово."^[34]
 " С этой целью я придумал жесткий - но не варварский - язык, который мог бы передать своего рода уверенную, элегантную жестокость. И Ситх должен был бы позвонить с авторитетом, чтобы вы могли представить, как он действует среди элит тьмы. Наряду с тем, как латинский язык функционировал в Европе на протяжении веков: как хранилище культуры и знаний.  "
 ―Ben Grossblatt ^[src]
 Раннее воплощение языка ситхов
 Язык ситхов впервые появился в 1990-х годах в серии комиксов  Звездные войны: Сказки о джедаях .В то время вхождения этого языка состояли из бессмысленных слов, состоящих только из непроизносимых последовательностей согласных, таких как  Nkrttw flgkllm shprrlt mdnnq . ^[8] Эта версия Ситхов не очень хорошо сочетается со скрытыми проявлениями в каноне, и, вероятно, ее следует рассматривать как художественную лицензию. В книге  «Говори как ситх » Бен Гроссблатт отметил, что никто даже не стал бы пытаться говорить на языке, если бы он состоял из непроизносимых слов, таких как  r'rhhoqtk . ^[5] Тем не менее, в адаптации аудиодрамы  Tales of the Jedi , случаи, когда Экзар Кун говорит, что ситх звучит очень иначе, чем их аналог из комиксов, отличаются разнообразием вокальных звуков. ^[35]
 В видеоигре 2004 года  Star Wars: Knights of the Old Republic II: The Sith Lords  было слышно, как Дарт Нихилус общался в той же манере, что и голокроны ситхов, хранящиеся у Атрис, что заставило некоторых фанатов поверить что Темный Лорд говорил на ситхе.Однако во время работы над « Knights of the Old Republic Campaign Guide ,  Star Wars » автор Абель Г. Пенья написал целый отрывок, посвященный маске Нихилуса, который в конечном итоге был вырезан. Примечательно, что это дало бы два научных объяснения речи Нихилуса. Согласно этому отрывку, шипение Темного Лорда могло быть первым языком, на котором когда-либо говорили в галактике, или грубым диалектом самой Силы, не переведенным мидихлорианами. ^[36]
  Говори как ситх 
 В ноябре 2010 года старший редактор Бен Гроссблатт, имеющий ученую степень в области лингвистики, создал функциональный язык ситхов для книги  «Книга ситхов: Секреты темной стороны ».Его работа включала ситхские правила грамматики и построения предложений, а также рунический сценарий ситхов. Более подробная информация о создании этого языка была раскрыта в  Speak Like a Sith , статье, представленной в  Star Wars Insider 134 . ^[5] Sith - второй рабочий конланг, когда-либо разработанный для вселенной  Star Wars , первым из которых является Мандо'а Карен Трависс. ^[37]
 Хотя система Гроссблатта реалистична и функциональна, между его версией фонологии ситхов и лексикой ситхов, установленной в предыдущих работах, есть противоречия.В то время как в статье  Star Wars Insider  говорится, что у ситхов нет звуков, слов или имен 'e' 'p' или 'f', таких как "derriphan", "Ffon", "aleph", Jen'ari, Jen'jidai, Дженсаарай или «Кресш» появились в более старых канонических источниках.

Ситх	Базовый
' Ari	«Лорд» ^[24]
Ajak	«Доктрина» ^[5]
Алеф	Буква общеситского алфавита ^[23]
-anjat	Маркер аблятивного существительного ^[5]
Asha	«Победа» ^[13]
-atul	Маркер глагола алетического настроения ^[13]
Châts	«Чтобы получить» ^[13]
Чирикят	«Тот, кто заставляет их биться и дрожать от страха» ^[5]
Чваят	«Власть, закон» ^[5]
Чваятюн	«Правило двух» ^[5]
Chwit	«Бросить» ^[21]
Chwûq	«Уголь» ^[1]
Далет	Буква общеситского алфавита ^[23]
Деррифан	«Пожиратель» ^[25]
Двомуцикса	«Вызов демона» ^[1]
Дзвол	«Существовать, оставаться» ^[5]
Dzu	«Лист, листообразный объект» ^[21]
Grotthu	«Раб» (относится к низшей касте ситхов) ^[1]
Hadzuska koshûjontû	«рожденный в тени» ^[1]
Хаск	«Страдания» ^[5]
Hyal	«Жаждать» ^[5]
Itsu	«Цепочка» ^[13]
Jen	«Темный», «тень», «скрытый» ^[24]
Дзидай	«Джедаи» ^[24]
Джен'ари	«Темный лорд (ситхов)» ^[24]
Джен'джидай	«Темные джедаи» (имеется в виду именно Темные джедаи-изгнанники Столетней тьмы) ^[24]
Дженсаараи	«Скрытые последователи истины» ^[24]
Jiaasjen	«Интеграция тени» ^[24]
-jontû	Инструментальный маркер существительного ^[13]
Kaggath	Древний обряд ситхов ^[26]
Каф	Буква общеситского алфавита ^[23]
Кинтик	«Самый черный» (множественное число) ^[1]
Киссай	«Жреческая каста» ^[1]
Коц	«Разорвать» ^[13]
кун	«Только» (используется как суффикс) ^[13]
Kûsk	«Мечтать» ^[5]
-кут	Маркер совокупного множественного числа существительного ^[5]
Ламед	Буква общеситского алфавита ^[23]
Массасси	«Каста воинов» ^[1]
Midwan	"Power" ^[5]
Mwintuska hâskûjontû	«Обиженный на боли» ^[1]
Нин	«Галстук, узел» ^[5]
Ninûshwodzakut	«Узловщики внутренностей» ^[1]
Nu	"I" ^[13]
Монахиня	«Я» ^[13]
Nuyak	«Мой» (множественное число) ^[13]
Nwit	"Маленькие, немногочисленные" ^[21]
Nwûl	«Мир» ^[5]
Няш	«Большой, много, много» ^[5]
Ододжинья	«Темная паутина» ^[1] (не буквальное значение) ^[21]
-окш	Маркер глагола будущего времени ^[13]
-ottoi	Маркер существительного дательного падежа ^[5]
Qabbrat	«Комната медитации» ^[27]
Qâzoi Kyantuska	«Подавить мысли» ^[1] (не буквальное значение) ^[21]
Qo	«Путь, путь» ^[13]
Qorit	«Конец» ^[5]
Qotsisajak	«Кодекс ситхов» ^[13]
qû	Сравнительная частица ^[5]
Qyâsik	«Сила» ^[13]
Рак-скури	«Певец мечты» ^[14]
Рор'джан	«Та-чей-листья-пот-яд» ^[28]
Самех	Буква общеситского алфавита ^[23]
Седрисс	Слово ситхов неизвестного значения, принятое Кага Лок в качестве титула ^[29]
Шоккай	Перевод неизвестен ^[1]
Ситх	«Высший», «премьер», «совершенный» ^[1]
Сит'ари	«Повелитель / Король», «совершенное существо», «бог» ^[1]
Саарай	«Правда» ^[24]
Саараи-Каар	«Хранитель истины» ^[24]
Шасот	«Борьба, страсть» ^[13]
Голень	Буква общеситского алфавита ^[23]
Siqsa	«Демон» ^[5]
Сутта	«Копье» ^[21]
Сутта Чвитускак	«Бегущие копья» ^[21]
Тарал	«Защищающий», «защитник» ^[30]
Таш	«Ложь» ^[13]
-ток	Маркер порядкового номера ^[5]
Цайвинокка Хоякут	«Воскрешенные мертвые» ^[1] (не буквальное значение) ^[21]
Цавак	«Вариант осуществления» ^[5]
Tsis	«Ситх» ^[31]
Цисаяк	«Доктрина ситхов» ^[13]
Цёк	«Отжать рукой» ^[5]
Туката	«Гончая ситхов» (разновидность порождений ситхов) ^[32]
Тайфоджем	«Бог-левша» (древнее божество ситхов) ^[1]
Тайро	Ситх-стажер, еще не ставший учеником Мастера (используется Затерянным племенем ситхов, может быть кешири по происхождению) ^[33]
Tyûk	«Прочность» ^[13]
-ûsh	Агентивный маркер глагола ^[1]
-ut	Именной маркер глагола ^[5]
wai	Частица отрицания ^[5]
-win	«Маркер эргативного глагола» ^[13]
Wo	«Один» ^[5]
Wodza	"Кишечник" ^[5]
Вон	«Бесплатно» ^[13]
Воюнокс	«Маленький» ^[1]
Юнь	«Двойка» ^[5]
Заин	Буква общеситского алфавита ^[23]
Зугурук	«Инженер» (относится к касте в обществе ситхов) ^[1]