Государственное казенное учреждение социального обслуживания Ростовской области центр помощи детям, оставшимся без попечения родителей, "РОСТОВСКИЙ ЦЕНТР ПОМОЩИ ДЕТЯМ № 7"
Звуко буквенный разбор слова медленно: «Медленно» фонетический разбор слова по составу
Слова «медленно» морфологический и фонетический разбор
Объяснение правил деление (разбивки) слова «медленно» на слоги для переноса. Онлайн словарь Soosle.ru поможет: фонетический и морфологический разобрать слово «медленно» по составу, правильно делить на слоги по провилам русского языка, выделить части слова, поставить ударение, укажет значение, синонимы, антонимы и сочетаемость к слову «медленно».
Содержимое:
1 Слоги в слове «медленно» деление на слоги
2 Как перенести слово «медленно»
3 Разбор слова «медленно» по составу
4 Синонимы слова «медленно»
5 Антонимы слова «медленно»
6 Ударение в слове «медленно»
7 Фонетическая транскрипция слова «медленно»
8 Фонетический разбор слова «медленно» на буквы и звуки (Звуко-буквенный)
9 Предложения со словом «медленно»
10 Сочетаемость слова «медленно»
11 Значение слова «медленно»
12 Как правильно пишется слово «медленно»
Слоги в слове «медленно» деление на слоги
Количество слогов: 3 По слогам: ме-дле-нно
По правилам школьной программы слово «медленно» можно поделить на слоги разными способами. Допускается вариативность, то есть все варианты правильные. Например, такой: мед-лен-но
По программе института слоги выделяются на основе восходящей звучности: ме-дле-нно
Ниже перечислены виды слогов и объяснено деление с учётом программы института и школ с углублённым изучением русского языка.
ме — начальный, прикрытый, открытый, 2 буквы
дле — средний, прикрытый, открытый, 3 буквы сдвоенные согласные нн не разбиваются при выделении слогов и парой отходят к следующему слогу
нно — конечный, прикрытый, открытый, 3 буквы
Как перенести слово «медленно»
ме—дленно мед—ленно медлен—но
Разбор слова «медленно» по составу
медл
корень
енн
суффикс
о
суффикс
медленно
Синонимы слова «медленно»
1. кропотливо
2. ленто
3. протяжно
4. еле-еле
5. замедленно
6. копотливо
7. лениво
8. неторопливо
9. неспешно
10. медлительно
11. нерасторопно
12. потихоньку
13. небыстро
14. шагом
15. тиховодно
16. анданте
17. затяжно
18. помалу
19. тягуче
20. по-черепашьи
21. еле
22. мешкотно
23. медленным темпом
24. в медленном темпе
25. не торопясь
26. не спеша
27. полегоньку
28. шаг за шагом
29. неторопко
30. шаг за шаг
31. с расстановкой
32. как сонная муха
33. как черепаха
34. черепашьим ходом
35. черепашьим шагом
36. нога за ногу
37. неоперативно
38. с прохладцей
39. с чувством, с толком, с расстановкой
40. заторможенно
41. разжевывая слова
42. черепахой
43. адажио
Антонимы слова «медленно»
1. скоро
2. быстро
3. стремительно
Ударение в слове «медленно»
ме́дленно — ударение падает на 1-й слог
Фонетическая транскрипция слова «медленно»
[м’`эдл’ин а]
Фонетический разбор слова «медленно» на буквы и звуки (Звуко-буквенный)
Буква
Звук
Характеристики звука
Цвет
м
[м’]
согласный, звонкий непарный (сонорный), мягкий
м
е
[`э]
гласный, ударный
е
д
[д]
согласный, звонкий парный, твёрдый, шумный
д
л
[л’]
согласный, звонкий непарный (сонорный), мягкий
л
е
[и]
гласный, безударный
е
н
[н]
согласный, глухой парный, твёрдый, долгий
н
н
—
не образует звука
н
о
[а]
гласный, безударный
о
Число букв и звуков: На основе сделанного разбора делаем вывод, что в слове 8 букв и 7 звуков. Буквы: 3 гласных буквы, 5 согласных букв. Звуки: 3 гласных звука, 4 согласных звука.
Предложения со словом «медленно»
Оно, разумеется, течёт, пусть и медленно — динамизмом тамошнее бытие и в самом деле не отличается.
Источник: Евгений Панов, Ветры странствий. Публицистические очерки.
Обойдя машину, он медленно открыл дверь, помогая девушке выйти.
Источник: Светлана Мерцалова, Под маской Санта Клауса, 2012.
От маминого хохота стайка пушинок слетела с перил и медленно поплыла в сторону заходящего солнца.
Фонетический разбор слова глазки, транскрипция, характеристика звуко буквенный разбор глазки сделать анализ узнать произношение в фонетическом словаре русского языка. » /> » /> .keyword { color: red; }
Фонетический разбор слова глазки 2 класс русский язык канакина
⇒ Звуко-буквенный разбор слова и характеристика звуков:
Нелабиализованный, переднего ряда верхнего подъёма языка
⇒ Сколько звуков и букв в слове:
В слове 6 букв и 6 звуков
Правописание или как правильно написать слово, ударные и безударные гласные в нем, различные формы слова «Глазки»
Морфемный разбор слова, его схема, строение, состав и морфемы: Глазки, корень — глаз; суффикс — к; окончание — и; .
Г г согласный, звонкий парный, твёрдый парный л л согласный, сонорный, звонкий непарный, твёрдый парный а а гласный, ударный з с согласный, глухой парный, твёрдый парный к к согласный, глухой парный, мягкий парный и и гласный, безударный.
Фонетический разбор слова глазки 2 класс русский язык канакина
Глазки. Глаз — ки — 2 слога Г — (г) — согл, тв, звон, парная Л — (л) — согл, тв, звон, непарн. А — (а) — гл, уд. З — (с) — согл, тв, парн, глух. К — (к’) — согл, парн, мягк, глух И — (и) — гл, б/уд
————————————- 6 букв, 6 звуков.
Новые вопросы в Русский язык
Подготовьте устное высказывание (монолог) на основе личных впечатлений и наблюдение на одну из предложенных тем. ПОМОГИТЕ ПОЖАЛУЙСТА.
Пожалуйста помогите, составить две схемы. Можно пожалуйста это сделать на листочке ( т. к. так понятнее)
НАЙДИТЕ СПП С ПОДЧИНИТЕЛЬНЫМ ОПРЕДЕЛИТЕЛЬНЫМ Однажды в бурную ветреную погоду из гнезда выпал оперившийся, но еще не умевший летать птенец. Я поймал е … го и, осторожно держа за длинный, острый, как шило, клюв, принес домой. Золотистые глаза молодой цапли казались недобрыми. Рукою я придерживал клюв цапли, опасаясь, что она может выколоть мне глаз. Молодую цаплю я устроил на небольшой застекленной веранде, где помещалась моя собака Фрам. Устроенная в другом углу цапля, казалось, ни малейшего внимания не обращала на Фрама. Она скоро привыкла к своему новому обиталищу и охотно глотала мелкую рыбешку, которую я приносил. Когда Фраму в глиняной чашке приносили корм и он начинал обгладывать кости, повторялась смешная картина: цапля медленно выходила из своего угла и не торопясь направлялась к Фраму. Боже мой, что делалось с бедным Фрамом! Он поднимал на спине шерсть, грозно оскаливал зубы, рычал и лаял. Не обращая ни малейшего внимания на Фрама, цапля медленно приближалась к нему, внимательно осматривала чашку, разбросанные на полу кости, поворачивалась и так же медленно возвращалась в свой угол. Я недолго держал у себя злую цаплю; опасаясь, что она может поранить доверчиво подходивших к ней детей, выпустил ее на волю. Окрепшая молодая цапля взмахнула широкими крыльями, поднялась над деревьями и скоро исчезла.
Спиши вставляя пропущенные буквы. Выдели окончания. Укажи время лицо число у глаголов И род число падеж склонение у имён существительных Ед. шь на кон. … . отдыха. т под дерев. м, шага. шь по дорог. пиш. т письмо, смотр. т телевизор, работа. т в огород. леж. т на стол. поднима. т кран. м. СРОЧНО! ЕСЛИ БУДЕТ ФИГНЯ ТО БАН
Глазки. Глаз — ки — 2 слога Г — (г) — согл, тв, звон, парная Л — (л) — согл, тв, звон, непарн. А — (а) — гл, уд. З — (с) — согл, тв, парн, глух. К — (к’) — согл, парн, мягк, глух И — (и) — гл, б/уд ————————————- 6 букв, 6 звуков.
Подготовьте устное высказывание (монолог) на основе личных впечатлений и наблюдение на одну из предложенных тем. ПОМОГИТЕ ПОЖАЛУЙСТА.
Пожалуйста помогите, составить две схемы. Можно пожалуйста это сделать на листочке ( т. к. так понятнее)
НАЙДИТЕ СПП С ПОДЧИНИТЕЛЬНЫМ ОПРЕДЕЛИТЕЛЬНЫМ Однажды в бурную ветреную погоду из гнезда выпал оперившийся, но еще не умевший летать птенец. Я поймал е … го и, осторожно держа за длинный, острый, как шило, клюв, принес домой. Золотистые глаза молодой цапли казались недобрыми. Рукою я придерживал клюв цапли, опасаясь, что она может выколоть мне глаз. Молодую цаплю я устроил на небольшой застекленной веранде, где помещалась моя собака Фрам. Устроенная в другом углу цапля, казалось, ни малейшего внимания не обращала на Фрама. Она скоро привыкла к своему новому обиталищу и охотно глотала мелкую рыбешку, которую я приносил. Когда Фраму в глиняной чашке приносили корм и он начинал обгладывать кости, повторялась смешная картина: цапля медленно выходила из своего угла и не торопясь направлялась к Фраму. Боже мой, что делалось с бедным Фрамом! Он поднимал на спине шерсть, грозно оскаливал зубы, рычал и лаял. Не обращая ни малейшего внимания на Фрама, цапля медленно приближалась к нему, внимательно осматривала чашку, разбросанные на полу кости, поворачивалась и так же медленно возвращалась в свой угол. Я недолго держал у себя злую цаплю; опасаясь, что она может поранить доверчиво подходивших к ней детей, выпустил ее на волю. Окрепшая молодая цапля взмахнула широкими крыльями, поднялась над деревьями и скоро исчезла.
Спиши вставляя пропущенные буквы. Выдели окончания. Укажи время лицо число у глаголов И род число падеж склонение у имён существительных Ед. шь на кон. … . отдыха. т под дерев. м, шага. шь по дорог. пиш. т письмо, смотр. т телевизор, работа. т в огород. леж. т на стол. поднима. т кран. м. СРОЧНО! ЕСЛИ БУДЕТ ФИГНЯ ТО БАН
Звуко-буквенный разбор слова глазки.
Znanija. com
16.09.2018 20:29:37
2018-09-16 20:29:37
Источники:
Https://znanija. com/task/3366865
Звукобуквенный анализ слова «лыжи». — КиберПедия
– Отгадайте загадку.
На прогулке бегуны
Через луг к березке
Одинаковой длины
Тянут две полоски.
(Лыжи.)
– Сколько звуков в слове «лыжи»? (4.)
– Произнесите это слово, ведя по клеточкам в учебнике. Каждый звук должен попасть в клеточку.
– Интонационно выделите первый звук в слове. (Л-л-л-ыжи.)
– Назовите первый звук. ([л].)
– Интонационно выделите второй звук в слове. (Л-ы-ы-ы-жи.)
– Назовите второй звук. ([ы].)
– Интонационно выделите третий звук в слове. (Лы-ж-ж-ж-жи.)
– Назовите этот звук. ([ж].)
– Интонационно выделите четвертый звук в слове. (Лыжи-и-и.)
– Прочитайте слова, в которых слог «жа»последний. (Сажа, кожа, лужа, ложа.)
– Негромко хором прочитаем новые слова, меняя одну букву. (Жара – пара – парк – паук.)
Найди слово в слове».
– Прочитайте первое слово.(Ежик.)
– Какое слово в нем нашли? (Еж.)
– Какие буквы лишние? (Буквы и, к.)
– Закройте эти буквы ладошкой. Прочитаем новое слово.
Аналогичная работа проводится с остальными словами: ежик, жеребенок, жаворонок, пожар, этажерка.
7. Чтение рассказа «Жаба и Жук».
– Каким был Жук? А Жаба?
Самостоятельная работа по тетради «Я учусь писать и читать».
1) Закрась те части рисунка, в которые вписана буква ж. (Жук.)
2) Прочитай рассказ, составь предложения. Подчеркни слоги с буквой ж.
Чтение рассказа Г. Юдина «Поэты».
– Прочитайте последнее предложение.
– Вы согласны, что мышонок Мыша много знает? Подтвердите свой ответ.
IV. Итог урока.
На доске записаны слоги.
ЗЁ ВА ТЕ РО ГЫ ДЭ КЯ СЮ ЛУ ЖИ
– Разделите слоги на две группы. (ВА РО ЛУ ГЫ ДЭ; КЯ ЗЁ СЮТЕ.)
– Почему слог «жи» не включили ни в какую группу? (Буква и указывает на мягкость предшествующего согласного, но в данном случае этого не происходит, так как з вук [ ж ] всегда твердый.)
Урок 38 ЗНАКОМСТВО С БУКВОЙ Ш, ш
Цели : познакомить с буквой Ш, ш; формировать навык чтения слов, предложений с изученными буквами; развивать речь, фонематический слух, творческое воображение
Ход урока
I. Введение в тему урока.
– Отгадайте загадку.
Мышка дом себе нашла,
Мышка добрая была:
В доме том в конце концов
Стало множество жильцов.
(Теремок.)
– Сегодня у нас урок изучения новой буквы, но чтобы познакомиться с очередной буквой, мы отправимся в гости к сказке.
– В свою сказку возьмем не всех. А вот кого… Слушайте внимательно: мыш-ш-шка-норуш-ш-шка, зайчиш-ш-шка-трусиш-ш-шка, волчиш-ш-шка – серый хвостиш-ш-шко, лягуш-ш-шка-попры-гуш-ш-ка, лисуш-ш-шка-подружка, ежик-ерш-ш-шик, миш-ш-шка-топтыжка.
– Догадались? (Тех животных, в названии которых есть звук [ ш ] .)
– Итак, ребята, мы сегодня изучаем звук [ш], который обозначается буквами Ш, ш. Рассмотрите букву Ш.На что она похожа? (Ответы детей.)
Шура сено ворошил,
Вилы в сене позабыл.
Г. Виеру
– А поэт Светик из произведения Н. Н. Носова «Незнайка в солнечном городе» написал вот эти стихи:
Когда у расчески три зуба осталось,
Тогда буква Ш над ней посмеялась.
– Поэт А. Шибаев увидел букву Швот так:
Посмотри на букву Ш –
Буква очень хороша,
Потому что из неё
Можно сделать Е и Ё.
Урок по обучению грамоте с использованием конструктора ЛЕГО в 1-м классе
Тема: Гласные буквы «И, и «,
обозначающие звук [ и ].
Цель: осуществление индивидуального
подхода к учащимся при изучении фонетики
посредством упражнений на логику и крупную
моторику.
Задачи:
уточнение представления учащихся о звуке [и];
обучение слого-звуковому анализу;
осуществление индивидуального подхода к
учащимся при изучении фонетики посредством
упражнений на логику и крупную моторику.
Оборудование:
1. Конструктор ЛЕГО – DYPLO: (на 1 ученика) плата, 3
красных кубика, 2 кубика и 2 кирпичика синих, 2
кубика и 2 кирпичика зеленых. Карточки для
обозначения ударения и точки в конце
предложения.
2. Карточки «Слоговое лото»
3. Рисунки с изображением ириса, павлина, улитки.
4. Набора «Магнитный алфавит».
ХОД УРОКА
1. Организационный момент
2. Актуализация знаний
У: Что мы знаем о речи? Что мы
произносим, когда говорим? На какие две группы
делятся все звуки? Как мы обозначаем звуки на
письме? С какими буквами мы уже познакомились?
Гласные или согласные звуки они обозначают?
– Сегодня мы продолжим изучение букв нашего
алфавита. Для того, чтобы узнать, о какой букве мы
сегодня поговорим нужно отгадать загадку. Эта
буква стоит в начале слова-отгадки.
Всех на свете обшивает, что сошьет – не надевает.(Иглока)
3. Постановка темы урока
– Сегодня на уроке мы закрепим наши знания о
букве «И» звуке [и], который она обозначает.
Звуко-буквенный анализ слова «иголка»
У: А сейчас мы с помощью деталей ЛЕГО
конструктора на платах выложим схему слова
«иголка». Сколько слогов в этом слове?
– Какой первый слог? Сколько звуков в нем?
Охарактеризуйте этот звук.
– Какого цвета берем деталь? Назовите второй
слог. Что вы можете о нем сказать?
– Охарактеризуйте эти звуки. Назовите третий
слог. Чем он является?
– Охарактеризуйте этот слог. На какой слог
падает ударение?
Д: В этом слове три слога.
– В первом слоге один звук. Звук [и] гласный.
Берем деталь одинарную красного цвета.
-[гол]. Состоит из 3 звуков. К слогу слиянию
примыкает согласный звук. Слог слияние [го].
Согласная твердая, поэтому берем двойную синюю
деталь. Прикрепляем красную одинарную деталь,
которая обозначает гласный звук [о] в слиянии.
Примыкает согласный звук [л]. Он твердый. Поэтому
берем одинарную синюю деталь и прикрепляем рядом
со слиянием.
-[ка].Слиянием. Согласный звук [к] твердый. Поэтому
берем двойную синюю деталь. На нее прикрепляем
красную одинарную деталь обозначая слияние. На
второй слог.
4. Физкультминутка
Иголка, иголка
Лежала на полке.
Встала, потянулась,
Всем улыбнулась.
Иголка, иголка,
Зашей мне футболку.
Раз стежок, два стежок,
Получается стишок!
5. Продолжение работы по теме
Работа со слоговым лото
На доске карточки со слогами.
У: Нужно из представленных слогов
сложить слова. Давайте посмотрим, какие слова мы
сможем сложить из этих карточек. Используя эти
слова, составьте предложение.
Работа над схемой предложения
У: А теперь, выложим схему на платах
используя детали ЛЕГО.
– Какую деталь мы с вами возьмем для обозначения
первого слова в предложении.
«Ира» имя собственное или нарицательное? С
какой буквы мы пишем имя собственное?
– А начало предложения мы пишем с большой буквы?
Как мы покажем начало предложения на схеме? Как
мы выложим на схеме второе слово? Какие детали
будем использовать? Какой знак препинания мы
поставим в конце предложения?
6. Зарядка для глаз
У: Мы сегодня с вами много работали и
нашим глазкам пора немного отдохнуть. Выполним
зарядку для глаз: посмотрите направо, налево,
вверх, вниз; вытяните правую руку перед собой,
следя за указательным пальчиком медленно
дотрагиваемся до кончика носа: закройте глазки
(считаем до 5), открываем глазки.
7. Закрепление (работа со схемами слов)
У: Посмотрите на доску. На фотографиях
изображены различные предметы. Назовите их. (Ирис,
павлин, улитка)
– Под каждой фотографией выложены схемы. Давайте
с ними поработаем. Рассмотрим первую схему к
слову «ирис». Сколько слогов в этом слове?
– Почему? Какой слог пропущен? Дайте
характеристику этому слогу.
– Поставьте на плату ту деталь, которую мы бы
использовали для этого слога и покажите.
– Молодцы. Давайте теперь проверим, правильно ли
составлена схема дальше.
– На какой слог падает ударение?
– Давайте сейчас произнесем слово «ирис»
так, чтобы ударение падало на второй слог. Что у
нас получается?
– Важно помнить, что ударение играет в слове
важную роль. И если мы, произнеся слово, не
правильно поставим ударение, то нас могут
неправильно понять.
Аналогичная работа ведется со словами
«павлин» и «улитка».
– Давайте составим схему с помощью деталей
ЛЕГО. Один из вас выйдет к доске и попробует
выложить схему на большой плате. Остальные
работают со своими платами. Потом проверим, как
вы справились.
– Давайте сравним три слова, которые мы с вами
разобрали. Что вы можете сказать о них?
Д: Во всех слова есть «И». Смягчение
согласного после [и].
8. Физкультминутка
Руки вверх, руки вниз.
На носочках подтянись.
Руки ставим на бочок, на носочках скок по скок.
А теперь мы приседаем.
Никогда не замерзаем.
9. Работа с учебником («Русская
Азбука», стр. 35)
У: Сейчас мы поработаем в учебнике на
странице 35 и составим рассказ по картинкам.
– Кто главные герой сказки? Кто попробует
рассказать сказку, опираясь на иллюстрации?
Почему лиса и журавль перестали ходить друг к
другу в гости? Как им нужно было поступить, чтобы
остаться друзьями? Если хочешь кому-то сделать
приятное, нужно выбирать не то, что ты сам любишь,
а то, что любит этот человек. Особенно если вы его
пригласили в гости.
10. Итоги урока
– О какой букве шла речь на уроке?
– Как звучат согласные звуки, если после них
стоит гласный звук [и]?
– Что вам больше всего понравилось на уроке?
Приложение
Транскрипция к слову торт
Фонетический разбор слова торт показывает как оно произносится (транскрипция и ударение), сколько букв, звуков и слогов содержит.
Слово можно разделить на 1 слог: торт. Ударение ставится на единственную гласную то́рт.
Звуковой анализ показывает количество букв и звуков, он не влияет на произношение:
Звуко-буквенный разбор слова торт по звукам и буквам может быть включён в программу обучения 1, 2, 3, 4, 5 или 6 класса.
— кусок твердого вещества (например, мыло или воск) (синоним: брусок) — небольшая плоская масса измельченной пищи (синоним: пирожок) — выпечка, изготовленная из смеси или на ее основе. мука, сахар, яйца и жир
Мы знаем, что иногда английский может показаться сложным.Мы не хотим, чтобы вы зря тратили время.
Посмотреть руководство «Как использовать премиум-функции: высококачественный компьютерный звук и автоматический перевод»
Английское произношение может сбивать с толку.Как вы знаете, не существует строгих правил произношения в английском языке , поэтому, если вы увидите неизвестное английское слово, вы не будете знать, как его произносить. Одна и та же английская буква или комбинация букв может по-разному произноситься в разных словах. Более того, одно и то же английское слово может по-разному произноситься носителями английского языка из разных стран или даже из одной страны! Это затрудняет изучение и понимание английского языка.
Этот онлайн-переводчик позволяет преобразовать английский текст в фонетическую транскрипцию , используя Международный фонетический алфавит (IPA) символов. Если вы хотите увидеть фонематическую транскрипцию
, нажмите Показать дополнительные параметры — некоторые параметры должны быть сняты.
Если вы являетесь носителем английского языка и не знакомы с международным фонетическим алфавитом, вы можете выбрать вариант Преобразовать в фонетическое написание .
Этот инструмент будет служить в качестве руководства по произношению на английском языке и поможет вам сэкономить время. Вам больше не нужно искать произношение слова в словаре. Если вы регулярно используете фонетическую транскрипцию в сочетании с английскими аудио- и видеозаписями, ваше произношение и навыки аудирования на английском языке улучшатся.
Чтобы помочь вам тренировать органы речи, мы создали онлайн-тренажеры произношения:
Они позволяют попрактиковаться в произношении наиболее часто встречающихся английских слов, установить скорость воспроизведения и количество повторов каждого слова.
Еще один отличный способ улучшить свое произношение в американском английском — это использовать наш Конструктор видеообъявлений американского английского . Он предназначен для начинающих и имеет английские субтитры для всех уроков, включая фонетическую транскрипцию.
Омографы (слова, которые пишутся одинаково, но по-разному произносятся и имеют разные значения) выделены светло-зеленым цветом. Если вы наведете курсор на эти слова или коснетесь их на мобильном устройстве, вы увидите все возможные варианты произношения.Вы также можете увидеть часть речи для каждого слова.
Варианты произношения (когда носители языка из разных регионов произносят слово по-разному или когда произношение меняется во время быстрой речи) выделены голубым цветом. Вы также можете навести курсор, чтобы увидеть все возможные варианты.
Этот фонетический переводчик поддерживает два наиболее распространенных диалекта английского языка:
При разработке этого переводчика мы использовали информацию из перечисленных ниже онлайн-ресурсов и других источников. Фонетическая транскрипция была взята из этих источников в соответствии с Законом об авторском праве Канады (параграф 29, Добросовестная практика в образовательных целях).
Специальная опция позволяет выделить наиболее часто встречающиеся английские слова . Вы можете выбрать один из двух списков частот:
Если вы хотите провести частотный анализ своего текста и получить подробную статистику, используйте Частотомер английских слов .
Этот переводчик фонетики имеет встроенный словарь английского языка WordNet. После отправки текста щелкните любое слово в результатах, чтобы увидеть его определение. Эта функция работает, только если включено отображение транскрипции над каждым словом (это опция по умолчанию).
Вы также можете создавать свои собственные списки слов. Для этого, после того как вы отправили свой текст, щелкните любое слово, а затем нажмите кнопку «+ к списку слов». Вам будет предложено ввести значение / перевод (необязательно) и выбрать транскрипцию. Когда вы закончите добавлять слова в свой список слов, вы можете экспортировать его в файл (Word, Excel, обычный текст).
Хотя мы использовали несколько источников для создания этого фонетического переводчика, когда дело доходит до американского английского, мы всегда используем словарей Merriam-Webster для подтверждения правильного произношения. Их словарь Advanced Learner’s Dictionary — один из лучших, что мы когда-либо видели.
Проверьте наш конвертер английских фонетических субтитров и получите что-то вроде этого:
Американский английский, британский английский, английский, английская фонетика, английское произношение, IPA, таблица IPA, переводчик IPA, словарь, изучение языков, фонетический словарь, фонетическая транскрипция, конвертер субтитров
A
а, о, выше, поперек, действовать, активный, активность, добавить, испуганный, после, снова, возраст, назад, согласен, воздух, все, один, вместе, уже, всегда, я, количество, и, злой , другой, ответ, любой, кто угодно, что угодно, в любое время, появиться, яблоко, площадь, рука, армия, вокруг, прибыть, искусство, как, спросить, атака, тетя, осень, прочь.
Б
ребенок, база, спина, плохо, сумка, мяч, банка, корзина, ванна, быть, боб, медведь, красиво, пиво, кровать, спальня, вести себя, прежде, начинать, сзади, колокольчик, внизу, кроме того, лучше, лучше , между, большой, птица, рождение, день рождения, бит, укус, черный, кровотечение, блокировать, кровь, удар, синий, доска, лодка, тело, кипение, кость, книга, граница, рожденный, заимствовать, оба, бутылка, дно , чаша, ящик, мальчик, ветка, храбрый, хлеб, перерыв, завтрак, дышать, мост, яркий, принести, брат, коричневый, кисть, строить, сжечь, бизнес, автобус, занят, но, купить, мимо.
в темпе, который меньше обычного, желательного или ожидаемого
шел медленно к звонящему телефону
вяло,
неторопливо,
pokily,
slow,
sluggishly,
tardily
carefully,
cautiously,
deliberately,
purposefully
heavily,
ploddingly
immediately,
posthaste ,
предварительно,
быстро,
пронто,
с готовностью,
скоро
порывисто,
импульсивно,
rashly,
recklessly
abruptly,
suddenly
apace,
briskly,
fast,
fleetly,
full tilt,
hastily,
meteorically,
quick ,
быстро,
быстро,
быстро,
быстро,
быстро,
быстро
См. словарь Определение0008 медленно
Опубликуйте больше слов для медленно на Facebook
Поделитесь другими словами для медленно в Твиттере
Путешественник во времени для медленно
Первое известное использование
медленно было
в 14 веке
Другие слова из того же века
Тезаурус Записи рядом с
медленно
медлительный
медленно
медлительность
Просмотреть другие записи поблизости
Процитировать эту запись
«Медленно». Merriam-Webster.com Тезаурус , Merriam-Webster, https://www.merriam-webster.com/thesaurus/slowly. По состоянию на 21 сентября 2022 г.
Стиль: MLA
Merriam-Webster. com Thesaurus, Merriam-Webster, https://www.merriam-webster.com/thesaurus/slowly. По состоянию на 21 сентября 2022 г.»> MLA
Merriam-Webster.com Тезаурус, с.в. «медленно», по состоянию на 21 сентября 2022 г., https://www.merriam-webster.com/thesaurus/slowly.»>Chicago.
Тезаурус Merriam-Webster.com. Получено 21 сентября 2022 г. с https://www.merriam-webster.com/thesaurus/slowly»>APA.
Merriam-Webster.com Thesaurus, https://www.merriam-webster.com/thesaurus/slowly. Доступно 9/21/2022.»>Merriam-Webster
Больше от Merriam-Webster на slow
Нглиш: перевод slow для говорящих на испанском языке
Britannica English: Перевод slow для говорящих на арабском языке3 01056
СЛОВО ДНЯ
проницательный
См. Определения и примеры »
Получайте ежедневно по электронной почте Слово дня!
Проверьте свой словарный запас
Странные привычки и причуды
Что из следующего лучше всего описывает легко раздражающегося человека?
кричащий
поверхностный
раздражительный
общительный
Проверьте свои знания и, возможно, узнаете что-нибудь по пути.
ПРОЙДИТЕ ТЕСТ
Ежедневное задание для любителей кроссвордов.
ПРОЙДИТЕ ТЕСТ
Подпишитесь на крупнейший словарь Америки и получите тысячи дополнительных определений и расширенный поиск без рекламы!
Merriam-Webster без сокращений
Слова в игре
«Дундерхед» и другие «приятные» способы сказать «глупый»
На примере некоторых очень умных щенков
10 слов из географических названий
Бикини, бурбон и бадминтон заняли первые места
«Гордость»: слово, которое превратилось из порока в силу
Вы гордитесь Прайдом?
Когда впервые были использованы слова?
Найдите любой год, чтобы узнать
Спросите у редакторов
Буквально
Как использовать слово, которое (буквально) приводит некоторых людей в. ..
«Все интенсивные цели» или «Все намерения и цели»?
Мы намерены разобраться
Лэй против лжи
Редактор Эмили Брюстер разъясняет разницу.
горячий беспорядок
«Публика в беспорядке»
Игра слов
Любимые новые слова в словаре
Повысьте свой словарный запас с помощью этих новых слов…
Пройдите тест
Мега-викторина «Назови эту вещь»!
Проверьте свой визуальный словарный запас!
Пройди тест
Правда или ложь?
Проверьте свои знания и, возможно, узнаете что-то новое. ..
Пройдите тест
Орфографическая викторина
Сможете ли вы превзойти прошлых победителей национального конкурса Spelli…
Примите участие в викторине
python — Анализ адресов «От» из текста электронной почты
спросил
Изменено
4 года, 4 месяца назад
Просмотрено
11 тысяч раз
Я пытаюсь извлечь адреса электронной почты из текстовой расшифровки электронных писем.
Я собрал немного кода, чтобы найти сами адреса, но я не знаю, как заставить его различать их; прямо сейчас он просто выдает все адреса электронной почты в файле. Я хотел бы сделать так, чтобы он выдавал только адреса, которым предшествует «От:» и несколько подстановочных знаков, и которые заканчиваются на «>» (поскольку электронные письма настроены как From [имя] <[email]> ).
Вот код:
import re #позволяет программе использовать регулярные выражения
адрес электронной почты = []
#это пустой список
mailsrch = re.compile(r'[\w\-][\w\-\.]+@[\w\-][\w\-\.]+[a-zA-Z]{1,4 }')
#в настоящее время не знаю точного значения этого выражения, но предполагаю
#это означает что-то вроде "[вещи]@[вещи][вещи1-4 буквы]"
# "line" - это переменная, для которой задана одна строка, прочитанная из файла
# ("текст.txt"):
для строки в open("text.txt"):
foundemail.extend (mailsrch.findall (строка))
# это расширяет ранее названный список через переменную "mailsrch"
#которое было названо раньше
распечатать основное письмо
К сожалению, он находит только первое электронное письмо в каждой строке, потому что ожидает строки заголовка, но, может быть, это нормально?
1
импорт электронной почты
msg = email.message_from_string(str)
# или же
# f = открыть (файл)
# msg = email.message_from_file(f)
сообщение ['от']
# и необязательно
из email.utils импортировать parseaddr
адрес = parseaddr(msg['от'])
Если вашей целью является извлечение адресов электронной почты из текста, вам следует использовать библиотеку, созданную для этой цели. Регулярные выражения плохо подходят для сопоставления произвольных адресов электронной почты.
Но если вы делаете это как упражнение, чтобы лучше понять регулярные выражения, я бы выбрал подход расширения используемого вами выражения, чтобы включить дополнительный текст, который вы хотите сопоставить. Итак, сначала позвольте мне объяснить, что делает это регулярное выражение:
[\w\-][\w\-\.]+@[\w\-][\w\-\.]+[a-zA-Z ]{1,4}
[\w\-] соответствует любому символу «слова» (букве, цифре или символу подчеркивания), или дефису
[\w\-\.]+ совпадений (любой символ слова или дефис или точка) один или несколько раз
@ соответствует буквальному символу ‘@’
[\w\-] соответствует любому символу слова или дефису
[\w\-\.]+ совпадений (любой символ слова или дефис или точка) один или несколько раз
[a-zA-Z]{1,4} соответствует 1, 2, 3 или 4 строчным или прописным буквам
Таким образом, это соответствует последовательности «слова», которое может содержать дефисы или точки, но не начинается с точки, за которой следует цифра 9.Знак 0330 @ , за которым следует другое «слово» (в том же смысле, что и раньше), которое заканчивается буквой.
Теперь, чтобы изменить это для ваших целей, давайте добавим части регулярного выражения, чтобы соответствовать «From», имени и угловым скобкам:
[\w\s]+? соответствует одному или нескольким последовательным символам слова или пробелам. Знак вопроса делает сопоставление нежадным, поэтому оно будет соответствовать как можно меньшему количеству символов, при этом позволяя сопоставляться всему регулярному выражению (в данном случае это, вероятно, не обязательно, но делает сопоставление более эффективным, поскольку то, что сразу после этого не является символом слова или символом пробела).
< соответствует буквальному знаку меньше (открывающая угловая скобка)
То же регулярное выражение, что и раньше, теперь заключено в круглые скобки. Это делает его группой захвата , поэтому вы можете вызвать m. group(1) , чтобы получить текст, соответствующий этой части регулярного выражения.
> соответствует буквальному знаку больше чем
Поскольку в регулярном выражении теперь используются группы захвата, ваш код также необходимо немного изменить:
импорт повторно
адрес электронной почты = []
mailsrch = re.compile(r'From: [\w\s]+?<([\w\-][\w\-\.]+@[\w\-][\w\-\.] +[a-zA-Z]{1,4})>')
для строки в open("text.txt"):
foundemail.extend([m.group(1) для m в mailsrch.finditer(строка)])
распечатать основное письмо
Код [m.group(1) для m в mailsrch.finditer(line)] создает список из первой группы захвата (помните, что это была часть в круглых скобках) из каждого совпадения, найденного регулярным выражением .
[\w-] : любой символ слова (буквенно-цифровой плюс подчеркивание) или тире
[\w-. ]+ : любой символ слова, тире или точка/ точка, один или несколько раз
@ : литерал @ символ
[\w-][\w-.]+ : любое слово char или тире, за которым следует любое слово char, тире или точка один или больше раз.
9From:\s+.*<([\w\-][\w\-\.]+@[\w\-][\w\-\.]+[a-zA-Z]{1,4 })>', re.I | рем)
foundemail.extend(mailsrch.findall(open('text.txt').read()))
распечатать основное письмо
Используйте пакеты электронной почты и почтового ящика для анализа текстовой версии сообщения электронной почты. Это преобразует его в объект, который позволит извлечь все адреса в поле «От».
Вы также можете выполнить множество других анализов сообщения, если вам нужно обработать другие поля заголовка или тело сообщения.
В качестве быстрого примера следующий (непроверенный) код должен прочитать все сообщения в почтовом ящике в стиле unix и распечатать все заголовки «от».
импортировать почтовый ящик
импорт электронной почты
mbox = mailbox. PortableUnixMailbox(open(имя файла, 'rU'), email.message_from_file)
для сообщения в mbox:
от = сообщение['От']
распечатать из
Грубо говоря можно:
из email.utils импортировать parseaddr
адрес электронной почты = []
для строки в open("text.txt"):
если не line.startswith("From:"): продолжить
n, e = parseaddr(строка)
baseemail.append(e)
распечатать основное письмо
При этом используется встроенная функция python parseaddr для анализа адреса вне строки (как показано в других ответах) без дополнительных затрат на анализ всего сообщения (например, с использованием более полнофункциональных пакетов электронной почты и почтовых ящиков) . Сценарий здесь просто пропускает все строки, которые не начинаются с «От:». Имеют ли значение накладные расходы для вас, зависит от того, насколько велик ваш ввод и как часто вы будете выполнять эту операцию.
, если вы можете быть уверены, что строки, содержащие эти адреса электронной почты, начинаются с пробела, за которым следует «От:», вы можете просто сделать это:
addresslines = []
для строки в open("text. txt"):
если line.strip().startswith("From:"):
addresslines.append(строка)
затем позже - или при добавлении их в список - вы можете уточнить элементы адресной строки, чтобы выдать именно то, что вы хотите
1
"[stuff]@[stuff][stuff1-4 letter]" почти верно, но если вы хотите, вы можете расшифровать регулярное выражение, используя трюк, о котором я только что узнал, здесь. Выполните compile() в интерактивном сеансе Python следующим образом:
в
категория категория_слово
буквально 45
max_repeat 1 65535
в
категория категория_слово
буквально 45
буквально 46
буквально 64
в
категория категория_слово
буквально 45
max_repeat 1 65535
в
категория категория_слово
буквально 45
буквально 46
max_repeat 1 4
в
диапазон (97, 122)
диапазон (65, 90)
Который, если вы немного привыкнете, покажет вам, как именно работает RE.
1
Зарегистрируйтесь или войдите в систему
Зарегистрируйтесь с помощью Google
Зарегистрироваться через Facebook
Зарегистрируйтесь, используя адрес электронной почты и пароль
Рабочая группа по голосовому браузеру стремилась разработать стандарты, обеспечивающие доступ в Интернет с помощью голосового взаимодействия. Спецификация языка разметки синтеза речи является одним из этих стандартов и предназначена для предоставления богатого языка разметки на основе XML для помощи в создании синтетической речи в веб-приложениях и других приложениях. Основная роль языка разметки состоит в том, чтобы предоставить авторам синтезируемого контента стандартный способ управления такими аспектами речи, как произношение, громкость, высота тона, скорость и т. д. на различных платформах, поддерживающих синтез.
В этом разделе описывается состояние этого документа на момент его публикации. Этот документ может быть заменен другими документами. Список текущих публикаций W3C и последнюю редакцию этого технического отчета можно найти в указателе технических отчетов W3C по адресу http://www.w3.org/TR/.
Это Рекомендация «Языка разметки синтеза речи (SSML) версии 1.1».
Он был произведен компанией
Рабочая группа голосового браузера,
который является частью
Голосовая активность в браузере.
Комментарии приветствуются на [email protected] (архив).
См. список рассылки и архив W3C.
рекомендации по использованию.
Дизайн SSML 1.1 был широко рассмотрен (см.
расположение комментариев)
и удовлетворяет техническим требованиям Рабочей группы. Список реализаций включен в Отчет о внедрении SSML 1.1,
вместе с соответствующим набором тестов.
Рабочая группа внесла несколько редакционных изменений в 23 февраля 2010 г. Предлагаемая рекомендация в ответ на комментарии.
Изменения по сравнению с предлагаемой рекомендацией можно найти в
Приложение Г.
Также отличается от SSML 1.0, включая примечание об обратной совместимости.
к SSML 1.0 можно найти в
Приложение F.
Этот документ расширяет SSML 1.0 [SSML], чтобы обеспечить лучшую поддержку более широкого набора естественных (человеческих) языков. Определить, каким образом, если таковые имеются, SSML ограничен своей конструкцией в отношении поддержки языков, которые находятся на крупных коммерческих или развивающихся рынках технологий синтеза речи, но для которых участие носителей языка или экспертов было ограниченным или отсутствовало во время разработки. SSML 1.0, W3C провел три семинара по интернационализации SSML. Первый семинар [WS] в Пекине, КНР, в октябре 2005 г. был посвящен в основном китайскому, корейскому и японскому языкам, а второй [WS2] на Крите, Греция, в мае 2006 г. был посвящен в основном арабскому, индийскому, и восточноевропейских языков. Третий семинар [WS3] в Хайдарабаде, Индия, в январе 2007 г. был посвящен индийским и ближневосточным языкам. Информация, собранная во время этих семинаров, использовалась для разработки документа с требованиями [REQS11]. Изменения по сравнению с SSML 1.0 мотивированы этими требованиями.
Этот документ был проверен членами W3C, программным обеспечением
разработчиками, а также другими группами W3C и заинтересованными сторонами, и
одобрен директором в качестве рекомендации W3C. Это стабильный
документа и может использоваться в качестве справочного материала или цитироваться из другого
документ. Роль W3C в разработке Рекомендации заключается в привлечении
внимание к спецификации и способствовать ее широкому распространению
развертывание. Это повышает функциональность и совместимость
паутина.
Этот документ был подготовлен группой, работающей в соответствии с Патентной политикой W3C от 5 февраля 2004 года. W3C ведет общедоступный список любых раскрытий патентов, сделанных в связи с результатами работы группы; эта страница также содержит инструкции по раскрытию патента. Лицо, имеющее фактическую информацию о патенте, который, по его мнению, содержит существенные пункты формулы изобретения, должно раскрыть информацию в соответствии с разделом 6 Патентной политики W3C.
Разделы в основной части этого документа являются нормативными.
если не указано иное. Приложения к этому документу
информативный, если иное прямо не указано.
Содержание
1. Введение
1.1 Концепции дизайна
1.2 Этапы процесса синтеза речи
1.3 Генерация документов, приложения и контексты
1.4 Платформозависимое поведение вывода содержимого SSML
1.5 Терминология
2.SSML-документы
2.1 Форма документа
2.2 Соответствие
2.2.1 Согласование фрагментов языка разметки синтеза речи
2. 2.2 Соответствие документам языка разметки автономного синтеза речи
2.2.3 Использование SSML с другими пространствами имен
2.2.4 Соответствующие процессоры языка разметки синтеза речи
2.2.5 Профили
2.2.6 Соответствующий агент пользователя
2.3 Интеграция с другими языками разметки
2.3.1 СМИЛ
2.3.2 ACSS
2.3.3 VoiceXML
2.4 Получение документов SSML
3. Элементы и атрибуты
3.1 Структура документа, обработка текста и произношение
3.1.1 Основной элемент «говорить»
3.1.1.1 Атрибуты обрезки
3.1.2 Язык: атрибут "xml:lang"
3.1.3 Базовый URI: атрибут "xml:base"
3.1.3.1 Разрешение относительных URI
3.1.4 Идентификатор: атрибут "xml:id"
3.1.5 Документы лексикона
3.1.5.1 "лексикон" Элемент
3.1.5.2 Элемент «поиск»
3. 1.6 «мета» Элемент
3.1.7 «метаданные» Элемент
3.1.8 Структура текста
3.1.8.1 Элементы "p" и "s"
3.1.8.2 Элементы «токен» и «w»
3.1.9 "утверждать как" Элемент
3.1.10 Элемент "фонема"
3.1.10.1 Реестр алфавитов произношения
3.1.11 «Подэлемент»
3.1.12 "язык" Элемент
3.1.13 Ошибка речи: атрибут onlangfailure
3.2 Просодия и стиль
3.2.1 Элемент «голос»
3.2.2 Элемент "акцент"
3.2.3 Элемент «разрыв»
3.2.4 "Просодия" Элемент
3.3 Другие элементы
3.3.1 Элемент "аудио"
3.3.1.1 Атрибуты обрезки
3.3.1.2 Атрибут "soundLevel"
3.3.1.3 Атрибут "скорость"
3.3.2 "метка" Элемент
3.3.3 "Desc" Элемент
4. Ссылки
5. Благодарности
Приложение A. Форматы аудиофайлов (обязательное)
Приложение B. Интернационализация (обязательное)
Приложение C. Типы носителей и файловые суффиксы (обязательное)
Приложение D. Схема языка разметки синтеза речи (нормативное)
Приложение E. Пример SSML (информативный)
Приложение F. Изменения по сравнению с SSML 1.0 (справочное)
Приложение G. Изменения по сравнению с последним проектом (справочное)
1. Введение
Эта спецификация W3C известна как спецификация языка разметки речи (SSML) и основана на спецификациях JSGF и/или JSML, принадлежащих Sun Microsystems, Inc., Калифорния, США. Спецификацию JSML можно найти по адресу [JSML ].
SSML является частью большого набора спецификаций разметки для голосовых браузеров, разработанных в рамках открытых процессов W3C. Он предназначен для предоставления богатого языка разметки на основе XML, помогающего генерировать синтетическую речь в веб-приложениях и других приложениях. Основная роль языка разметки состоит в том, чтобы дать авторам синтезируемого контента стандартный способ управления такими аспектами речевого вывода, как произношение, громкость, высота тона, скорость и т. д., на различных платформах, поддерживающих синтез. Связанной с этим инициативой по созданию стандартной системы для разметки ввода текста является SABLE [SABLE], которая пыталась интегрировать множество различных XML-разметок для синтеза речи в новую. Деятельность, выполненная в SABLE, также использовалась в качестве основной отправной точки для определения требований к разметке синтеза речи для языков разметки речи [REQS]. С тех пор сама SABLE дальнейшего развития не претерпела.
Целью использования SSML является улучшение качества синтезируемого контента. Различные элементы разметки влияют на разные этапы процесса синтеза (см. раздел 1.2). Разметка может создаваться либо автоматически, например, с помощью XSLT или CSS3 из документа XHTML, либо с помощью человека. Разметка может присутствовать в полном документе SSML (см. Раздел 2.2.2) или как часть фрагмента (см. Раздел 2.2.1), встроенного в другой язык, хотя взаимодействие с другими языками не указано как часть самого SSML. Большая часть разметки, включенной в SSML, подходит для использования большинством разработчиков контента; однако некоторые расширенные функции, такие как фонема и просодия (например, для проектирования контуров речи), могут потребовать специальных знаний.
1.1 Концепции дизайна
Процесс разработки и стандартизации основывался на Требованиях к разметке синтеза речи для языков разметки речи [REQS].
Ключевыми критериями проектирования были следующие пункты.
Согласованность: обеспечивают предсказуемый контроль речевого вывода на разных платформах и в реализациях синтеза речи.
Совместимость: поддерживает использование вместе с другими спецификациями W3C, включая (но не ограничиваясь) VoiceXML, звуковые каскадные таблицы стилей и SMIL.
Универсальность: поддерживает вывод речи для широкого спектра приложений с разнообразным речевым содержанием.
Интернационализация: Включить вывод речи на большом количестве языков внутри или между документами.
Создание и читаемость: Поддержка автоматического создания и ручного создания документов. Документы должны быть понятны человеку.
Реализуемость: Спецификация должна быть реализуема с помощью существующей общедоступной технологии, а количество необязательных функций должно быть минимальным.
1.2 Этапы процесса синтеза речи
Система преобразования текста в речь (процессор синтеза), поддерживающая SSML, будет отвечать за воспроизведение документа в виде голосового вывода и за использование информации, содержащейся в разметке, для воспроизведения документа в соответствии с намерениями автора.
Создание документа: Текстовый документ, предоставленный в качестве входных данных для процессора синтеза, может быть создан автоматически, авторским трудом или с помощью комбинации этих форм. SSML определяет форму документа.
Обработка документов: Ниже приведены шесть основных этапов обработки, выполняемых процессором синтеза для преобразования размеченного текстового ввода в автоматически генерируемый голосовой вывод. Язык разметки спроектирован так, чтобы быть достаточно богатым, чтобы позволить контролировать каждый из шагов, описанных ниже, чтобы автор документа (человек или машина) мог контролировать окончательный голосовой вывод. Хотя каждый шаг ниже разделен на «поддержку разметки» и «поведение без разметки», фактическое поведение обычно представляет собой смесь двух и зависит от тега. Процессор имеет высшие полномочия по обеспечению того, чтобы то, что он производит, было произносимым (и в идеале разборчивым). В общем, разметка позволяет автору сделать просодическую и другую информацию доступной для процессора, обычно информацию, которую процессор не может получить самостоятельно. Затем процессор должен определить, использовать ли информацию и каким образом.
Анализ XML: Анализатор XML используется для извлечения дерева документа и содержимого из входящего текстового документа. Структура, теги и атрибуты, полученные на этом шаге, влияют на каждый из следующих шагов.
Структурный анализ: Структура документа влияет на способ его чтения. Например, есть общие модели речи, связанные с абзацами и предложениями.
Поддержка разметки: Элементы p и s, определенные в SSML, явно указывают структуры документа, влияющие на вывод речи.
Поведение без разметки: В документах и частях документов, где эти элементы не используются, процессор синтеза отвечает за вывод структуры путем автоматического анализа текста, часто с использованием пунктуации и других данных, зависящих от языка.
Нормализация текста: Все письменные языки имеют специальные конструкции, которые требуют преобразования письменной формы (орфографической формы) в устную форму. Нормализация текста — это автоматизированный процесс процессора синтеза, который выполняет это преобразование. Например, для английского языка, когда в документе появляется «200 долларов», это может быть произнесено как «двести долларов». Точно так же «1/2» может произноситься как «половина», «второе января», «первое февраля», «один из двух» и так далее. К концу этого шага произносимый текст полностью преобразуется в токены. Точные детали того, что представляет собой токен, зависят от языка. В английском языке токены обычно разделяются пробелом и обычно представляют собой слова. Для языков с различным поведением токенизации термин «слово» в этой спецификации предназначен для обозначения подходящей сопоставимой единицы. Токены в SSML не могут охватывать теги разметки, за исключением элементов token и w. Простой английский пример: «cupboard»; вне токенов и элементов w процессор синтеза будет рассматривать это как два токена «чашка» и «доска», а не как один токен (слово) с паузой в середине. Такое разбиение одного токена на несколько токенов, скорее всего, повлияет на то, как его обрабатывает процессор.
Поддержка разметки: Элемент say-as можно использовать во входном документе для явного указания наличия и типа этих конструкций и устранения неоднозначностей. Набор конструкций, которые можно пометить, еще не определен, но может включать даты, время, числа, аббревиатуры, суммы в валюте и многое другое. Обратите внимание, что многие акронимы и аббревиатуры могут быть обработаны автором путем прямой замены текста или использования подэлемента, например. «BBC» можно записать как «BBC», а «AAA» можно записать как «triple A». Эти заменяющие письменные формы, вероятно, будут произноситься так же, как хотелось бы, чтобы произносились исходные аббревиатуры. В случае японского текста, если у вас есть процессор синтеза, который поддерживает и кандзи, и кана, вы можете использовать подэлемент, чтобы определить, следует ли произносить 今日は как きょうは ("кёу ва" = "сегодня"). или こんにちは ("конничива" = "привет").
Поведение без разметки: Для текстового содержимого, которое не помечено элементом say-as, ожидается, что процессор синтеза приложит разумные усилия для автоматического обнаружения и преобразования этих конструкций в озвучиваемую форму. Из-за присущей неоднозначности (например, в приведенном выше примере «1/2») и из-за широкого диапазона возможных конструкций на любом языке этот процесс может привести к ошибкам в речевом выводе и может привести к тому, что разные процессоры будут отображать один и тот же документ по-разному.
Преобразование текста в фонему: После того, как процессор синтеза определил набор лексем для произнесения, он должен получить произношение для каждой лексемы. Произношение может быть удобно описано как последовательность фонем, которые представляют собой звуковые единицы языка, служащие для различения одного слова от другого. Каждый язык (а иногда и каждый национальный или диалектный вариант языка) имеет определенный набор фонем: например, в большинстве диалектов американского английского языка около 45 фонем, в гавайском — от 12 до 18 (в зависимости от того, кого вы спрашиваете), а в некоторых языках есть более 100! Это преобразование осложняется рядом проблем. Одна из проблем заключается в том, что существуют различия между письменными и устными формами языка, и эти различия могут привести к неопределенности или двусмысленности в произношении письменных слов. Например, по сравнению с их устной формой, слова на иврите и арабском языке обычно пишутся без гласных или с указанием только нескольких гласных. Во многих языках одно и то же письменное слово может иметь множество устных форм. Например, в английском языке «read» может произноситься как «reed» (я буду читать книгу) или «red» (я прочитал книгу). И говорящие люди, и процессоры синтеза могут правильно произносить эти слова в контексте, но могут испытывать трудности без контекста (см. «Поведение без разметки» ниже). Другой проблемой является обработка слов с нестандартным написанием или произношением. Например, у процессора синтеза английского языка часто возникают проблемы с определением того, как произносить некоторые имена неанглоязычного происхождения, например. «Колледж Кая» (произносится «колледж ключей») и президент Тито (произносится «сутто»), президент Республики Кирибати (произносится «кирибасс»).
Поддержка разметки: Элемент фонемы позволяет предоставить фонематическую последовательность для любого токена или последовательности токенов. Это дает создателю контента явный контроль над произношением. Элемент say-as может также использоваться для указания того, что текст является именем собственным, что может позволить процессору синтеза применять специальные правила для определения произношения. Элементы словаря и поиска могут использоваться для ссылки на внешние определения произношения. Эти элементы могут быть особенно полезны для акронимов и аббревиатур, которые процессор не может разрешить с помощью собственной нормализации текста и к которым нельзя обратиться с помощью прямой подстановки текста или подэлемента (см. параграф 3 выше).
Поведение без разметки: При отсутствии элемента фонемы процессор синтеза ДОЛЖЕН применять автоматизированные возможности для определения произношения. Обычно это достигается путем поиска токенов в словаре произношений (который может зависеть от языка) и применения правил для определения других произношений. Процессоры синтеза предназначены для преобразования текста в фонемы, поэтому большинство слов большинства документов могут обрабатываться автоматически. В качестве альтернативы использованию процессора авторы могут сами выполнить некоторые преобразования перед кодированием в SSML. Написанные слова с неопределенным или двусмысленным произношением могли быть заменены словами с однозначным произношением; например, в случае «прочитать», «я прочитаю книгу». Однако авторы должны знать, что результирующий документ SSML может быть неоптимальным для визуального отображения.
Анализ просодии: Просодия — это набор характеристик вывода речи, который включает высоту тона (также называемую интонацией или мелодией), синхронизацию (или ритм), паузу, темп речи, выделение слов и многие другие характеристики. Создание человекоподобной просодии важно для естественного звучания речи и для правильной передачи смысла разговорной речи.
Поддержка разметки: Элемент выделения, элемент разрыва и элемент просодии могут использоваться создателями документов для управления процессором синтеза при создании соответствующих просодических признаков в речевом выводе.
Поведение без разметки: В отсутствие этих элементов процессоры синтеза умеют (но не идеально) автоматически генерировать подходящую просодию. Это достигается за счет анализа структуры документа, синтаксиса предложений и другой информации, которую можно вывести из введенного текста.
В то время как большинство элементов SSML можно считать высокоуровневыми, поскольку они обеспечивают либо содержание для произнесения, либо логическое описание стиля, элементы прерывания и просодии, упомянутые выше, действуют на более позднем этапе процесса и, следовательно, должны сосуществовать с использованием элемента выделения и с собственными определениями процессора просодического поведения. Если не указано иное в соответствующих разделах, детали взаимодействий между собственными определениями процессора и данными, предоставленными автором на этом уровне, зависят от процессора. Авторам рекомендуется не смешивать случайно или произвольно эти два уровня контроля.
Производство формы волны: Фонемы и просодическая информация используются процессором синтеза при создании звуковой волны. Существует много подходов к этому этапу обработки, поэтому могут быть значительные различия в зависимости от процессора.
Поддержка разметки: Элемент voice позволяет создателю документа запрашивать определенный голос или определенные качества голоса (например, молодой мужской голос). Элемент audio позволяет вставлять записанные аудиоданные в выходной поток с дополнительным контролем продолжительности, уровня звука и скорости воспроизведения записи. Рендеринг может быть ограничен подмножеством документа с помощью атрибутов обрезки в элементе speak.
Поведение без разметки: Громкость/уровень звука, скорость и высота тона/частота по умолчанию для голосов и записанного звука в документе соответствуют неизмененным сигналам, независимо от того, являются ли они голосами или записями.
1.3 Генерация документов, приложения и контексты
Существует много классов создателей документов, которые будут создавать размеченные документы для озвучивания процессором синтеза. Не все создатели документов (включая человека и машину) имеют доступ к информации, которую можно использовать во всех элементах или на каждом этапе обработки, описанном в предыдущем разделе. Ниже приведены некоторые распространенные случаи.
Создатель документа не имеет доступа к информации для разметки текста. Все этапы обработки в процессоре синтеза должны выполняться полностью автоматически на необработанном тексте . Документу требуется только содержащий элемент speak, чтобы указать, что контент должен быть произнесен.
Когда выделенный текст генерируется программно, создатель может иметь определенные знания о структуре и/или специальных текстовых конструкциях в части или во всем документе. Например, программа для чтения электронной почты может отмечать время и дату получения электронной почты. Такие приложения могут использовать элементы, влияющие на структуру, нормализацию текста, просодию и, возможно, преобразование текста в фонему.
Некоторые создатели документов прилагают значительные усилия, чтобы пометить как можно больше деталей документа, чтобы обеспечить одинаковое качество речи на разных платформах и более точно указать качество вывода. В этих случаях разметка может использовать любой или все доступные элементы для жесткого управления выводом речи. Например, подсказки, генерируемые в приложениях телефонии и голосового браузера, могут быть точно настроены, чтобы максимизировать эффективность всей системы.
Наиболее продвинутые создатели документов могут пропустить разметку более высокого уровня (структура, нормализация текста, преобразование текста в фонемы и анализ просодии) и создать разметку синтеза речи низкого уровня для сегментов документов или для целых документов. Обычно для этого требуются инструменты для создания последовательностей фонем, а также информация о высоте тона и времени. Например, инструменты, выполняющие «синтез копирования» или «трансплантацию просодии», пытаются имитировать человеческую речь, копируя свойства записей.
Ниже приведены важные примеры архитектур или проектов, на основе которых будут генерироваться размеченные документы синтеза. Дизайн языка предназначен для облегчения каждого из этих подходов.
Язык диалога : Требуется, чтобы СЛЕДУЕТ включать документы, помеченные SSML, в документ описания диалога, который должен быть подготовлен рабочей группой голосового браузера.
Совместимость со звуковым CSS (ACSS) : Любой HTML-процессор с поддержкой звукового CSS может создавать SSML. ACSS рассматривается в разделе 19 спецификации каскадных таблиц стилей уровня 2 (CSS2) [CSS2 §19]. Такое использование синтеза речи облегчает доступ к существующему содержимому HTML и XHTML.
Обработка таблицы стилей для конкретного приложения : Как упоминалось выше,
существуют классы приложений, которые имеют информацию о текстовом содержимом, которое нужно произнести, и которые могут быть включены в разметку синтеза речи для улучшения визуализации документа. Во многих случаях ожидается, что приложение будет использовать таблицы стилей для преобразования существующих XML-документов в SSML. Это эквивалентно использованию ACSS с HTML, и снова SSML является результирующим представлением, которое должно быть передано процессору синтеза. В этом контексте SSML можно рассматривать как надмножество ACSS [CSS2§19] возможности, за исключением пространственного звука.
1.4 Платформозависимое поведение вывода содержимого SSML
SSML предоставляет стандартный способ определения грубых свойств синтезированной речи, таких как произношение, громкость, высота тона, скорость и т. д. Однако точная спецификация поведения синтезированной речи на разных процессорах выходит за рамки этого документа.
Если не указано иное, значения наценки являются просто указаниями, а не абсолютными значениями. Например, автор может явно указать продолжительность текстового сегмента, а также явно указать продолжительность подмножества этого текстового сегмента. Если две длительности приводят к текстовому сегменту, который процессор синтеза не может разумно воспроизвести, процессору разрешается изменять длительности по мере необходимости для воспроизведения текстового сегмента.
1.5 Терминология
Условия требований
Ключевые слова «ДОЛЖЕН», «НЕ ДОЛЖЕН», «ТРЕБУЕТСЯ», «ДОЛЖЕН», «НЕ ДОЛЖЕН», «СЛЕДУЕТ», «НЕ ДОЛЖЕН», «РЕКОМЕНДУЕТСЯ», «МОЖЕТ» и «ДОПОЛНИТЕЛЬНО» в этом документе должны интерпретироваться, как описано в [RFC2119]. Однако для удобочитаемости эти слова не отображаются в этой спецификации заглавными буквами.
По выбору пользователя
Соответствующий процессор синтеза МАЙ или ДОЛЖЕН (в зависимости от модального глагола в предложении) вести себя, как описано; если да, то он ДОЛЖЕН предоставить пользователям средства для включения или отключения описанного поведения.
Ошибка
Результаты не определены. Соответствующий процессор синтеза МОЖЕТ обнаружить и сообщить об ошибке и МОЖЕТ устранить ее.
Тип носителя
A тип носителя (определено в [RFC2045] и [RFC2046]) указывает характер связанного ресурса. Типы носителей нечувствительны к регистру. Список зарегистрированных типов носителей доступен для загрузки [TYPES].
См. Приложение C для получения информации о типах мультимедиа для SSML.
Синтез речи
Процесс автоматического создания речевого вывода из входных данных, который может включать обычный текст, размеченный текст или бинарные объекты.
Процессор синтеза
Система преобразования текста в речь, которая принимает документы SSML в качестве входных данных и воспроизводит их в виде речевого вывода.
Преобразование текста в речь
Процесс автоматического создания речевого вывода из текста или аннотированного ввода текста.
URI: универсальный идентификатор ресурса
Глобальный идентификатор в контексте Всемирной паутины [WEB-ARCH]. URI определяется как любой допустимый примитив anyURI , как определено в XML-схеме, часть 2: типы данных [SCHEMA2 §3.2.17]. Только в информационных целях, [RFC3986] и [RFC2732] могут быть полезны для понимания структуры, формата и использования URI. Обратите внимание, что IRI (см. [RFC3987]) разрешены в рамках приведенного выше определения URI. Любая относительная ссылка URI ДОЛЖНА разрешаться в соответствии с правилами, приведенными в Разделе 3.1.3.1. В этой спецификации URI предоставляются как атрибуты элементов, например, в элементах audio и lexicon.
Голосовой браузер
Устройство, которое интерпретирует (голосовой) язык разметки и способно генерировать голосовой вывод и/или интерпретировать голосовой ввод и, возможно, другие способы ввода/вывода.
2. Документы SSML
2.1 Форма документа
Официальный автономный документ языка разметки синтеза речи ДОЛЖЕН иметь допустимый XML-пролог [XML 1.0 или XML 1.1, соответственно, §2.8].
За прологом XML следует корневой элемент speak. Подробную информацию об этом элементе см. в разделе 3.1.1.
Элемент Speak ДОЛЖЕН обозначать пространство имен SSML. Этого можно добиться, объявив атрибут xmlns или атрибут с префиксом «xmlns». Подробности см. в [XMLNS 1.0 или XMLNS 1.1, соответственно, §2]. Обратите внимание, что когда 9Атрибут 0330 xmlns используется отдельно, он устанавливает пространство имен по умолчанию для элемента, на котором он появляется, и для любых дочерних элементов. Пространство имен для SSML определено как http://www.w3.org/2001/10/ Synthese.
РЕКОМЕНДУЕТСЯ , чтобы элемент говорить также указывал местоположение соответствующей схемы SSML (см. Приложение D) через атрибут xsi:schemaLocation из [SCHEMA1 §2.6.3]. Хотя такое указание не требуется, для его поощрения в этом документе такое указание содержится во всех примерах. Если этот атрибут не задан, основной профиль [раздел 2.2.5] ДОЛЖЕН приниматься .
Ниже приведены два примера допустимых заголовков SSML:
Мета, метаданные и элементы лексики ДОЛЖНЫ располагаться перед всеми другими элементами и текстом, содержащимся в корневом элементе speak. Других ограничений порядка элементов в этой спецификации нет.
2.2. Соответствие
2.2.1 Согласование фрагментов языка разметки синтеза речи
2.2.1.1 Согласование основных фрагментов языка разметки синтеза речи
Фрагмент документа представляет собой фрагмент языка разметки , соответствующий стандарту Core Speech Synthesis Markup Language 9.0009 если:
он соответствует критериям соответствия документам языка разметки для автономного базового синтеза речи после:
, за исключением xml:lang и xml:base , все элементы и атрибуты пространства имен, не являющиеся синтезом, и все атрибуты xmlns , которые относятся к элементам пространства имен, не являющимся синтезом, удаляются из документа,
и, если элемент speak еще не обозначает пространство имен синтеза с помощью xmlns , затем к элементу добавляется xmlns="http://www.w3.org/2001/10/synchronous" .
2.2.1.2 Соответствие расширенным фрагментам языка разметки синтеза речи
Фрагмент документа является фрагментом языка разметки расширенного синтеза речи , соответствующим , если:
он соответствует критериям соответствия документам языка разметки для автономного расширенного синтеза речи после:
за исключением xml:lang и xml:base , все элементы и атрибуты пространства имен, не являющиеся синтезом, и все атрибуты xmlns , которые относятся к элементам пространства имен, не являющимся синтезом, удаляются из документа,
и, если элемент speak еще не обозначает пространство имен синтеза с помощью атрибута xmlns , то к элементу добавляется xmlns="http://www.w3.org/2001/10/ Synthetic" .
2.2.2 Соответствие документам языка разметки автономного синтеза речи
2.2.2.1 Соответствие документам языка разметки автономного базового синтеза речи
Документ является документом , соответствующим стандарту автономного базового языка разметки синтеза речи , если он соответствует обоим следующим условиям:
Это правильно сформированный XML-документ [XML 1. 0 или XML 1.1 §2.1], соответствующий Пространствам имен в XML (1.0 [XMLNS 1.0] или 1.1 [XMLNS 1.1] соответственно).
Это действительный XML-документ [XML 1.0 или XML 1.1 §2.8], который соответствует спецификации, описанной в этом документе (Спецификация языка разметки синтеза речи), включая ограничения, выраженные в базовой схеме (см. Приложение D), и имеет XML-пролог. и произнесите корневой элемент, как указано в Разделе 2.1.
2.2.2.2 Соответствие автономным документам языка разметки расширенного синтеза речи
Документ является документом , соответствующим стандарту автономного языка разметки расширенного синтеза речи , если он соответствует обоим следующим условиям:
Это правильно сформированный XML-документ [XML 1.0 или XML 1.1 §2.1], соответствующий Пространствам имен в XML (1.0 [XMLNS 1.0] или 1.1 [XMLNS 1.1] соответственно).
Это действительный XML-документ [XML 1.0 или XML 1.1 §2.8], который соответствует спецификации, описанной в этом документе (Спецификация языка разметки синтеза речи), включая ограничения, выраженные в расширенной схеме (см. Приложение D), и имеет XML-пролог. и произнесите корневой элемент, как указано в Разделе 2.1.
Спецификация SSML и эти критерии соответствия не предусматривают установленных ограничений размера для любого аспекта сводных документов. Не существует максимальных значений количества элементов, количества символьных данных или количества символов в значениях атрибутов.
2.2.3 Использование SSML с другими пространствами имен
Пространство имен синтеза МОЖЕТ использоваться с другими пространствами имен XML в соответствии с соответствующими пространствами имен в Рекомендации XML (1.0 [XMLNS 1.0] или 1.1 [XMLNS 1.1], в зависимости от используемой версии XML). Ожидается, что будущая работа W3C будет направлена на определение соответствия документов, включающих несколько пространств имен. Элементы и атрибуты, зависящие от языка (т. е. не относящиеся к SSML), могут быть вставлены в SSML с использованием соответствующего пространства имен. Однако такой контент будет отображаться только процессором синтеза, который поддерживает пользовательскую разметку. Вот пример того, как можно вставлять элементы Ruby [RUBY] в SSML:
2.2.4 Соответствующие процессоры языка разметки синтеза речи
В процессоре языка разметки синтеза речи, соответствующем стандарту , синтаксический анализатор XML ДОЛЖЕН иметь возможность анализировать и обрабатывать все конструкции XML, определенные XML 1. 0 [XML 1.0] и XML 1.1 [XML 1.1], а также соответствующие версии пространств имен в XML (1.0 [XMLNS 1.0] и 1.1 [XMLNS 1.1]). Этот синтаксический анализатор XML не требуется для проверки документа SSML в соответствии с его схемой или DTD; это означает, что при обработке документа SSML это ДОПОЛНИТЕЛЬНО , чтобы применить или расширить ссылки на внешние объекты, определенные во внешнем DTD.
Соответствующий процессор языка разметки синтеза речи ДОЛЖЕН соответствовать следующим требованиям для обработки естественных (человеческих) языков:
Соответствующий процессор языка разметки синтеза речи ТРЕБУЕТСЯ для успешного анализа всех допустимых объявлений естественного языка.
Соответствующий процессор языка разметки синтеза речи может применять семантику языков разметки, которые относятся к более чем одному естественному языку. Когда процессор может поддерживать каждый естественный язык в наборе, но не может обрабатывать их одновременно, он СЛЕДУЕТ информировать хост-среду. Когда набор включает один или несколько естественных языков, которые не поддерживаются процессором, он СЛЕДУЕТ информировать об этом среду размещения.
Соответствующий процессор языка разметки синтеза речи МАЙ реализует естественные языки путем приблизительных замен в соответствии с задокументированным поведением, зависящим от процессора. Например, процессор синтеза английского языка США может обрабатывать входные данные британского английского языка.
Отсутствуют требования соответствия в отношении характеристик производительности процессора языка разметки речи. Например, не требуется никаких заявлений относительно точности, скорости или других характеристик речи, воспроизводимой процессором. Не делается никаких заявлений относительно размера ввода, который должен поддерживать процессор языка разметки речи.
2.2.4.1 Соответствие базовым процессорам языка разметки синтеза речи
Процессор основного языка разметки речи — это соответствующий процессор языка разметки речи, который может анализировать и обрабатывать документы, соответствующие автономному базовому языку разметки речи.
Соответствующий базовому процессору языка разметки синтеза речи ДОЛЖЕН правильно понимать и применять семантику элементов и атрибутов базового профиля, как описано в этом документе.
Когда соответствующий базовый процессор языка разметки синтеза речи обнаруживает элементы или атрибуты, отличные от тех, которые включены в базовый профиль, это МАЙ :
игнорировать нестандартные элементы и/или атрибуты
или обработать нестандартные элементы и/или атрибуты
или отклонить документ, содержащий эти элементы и/или атрибуты
2.
2.4.2 Соответствующие процессоры языка разметки расширенного синтеза речи
Процессор расширенного языка разметки речи — это соответствующий процессор языка разметки речи, который может анализировать и обрабатывать документы, соответствующие автономному языку разметки расширенного синтеза речи.
A Соответствующий процессор языка разметки расширенного синтеза речи ДОЛЖЕН правильно понимать и применять семантику элементов и атрибутов расширенного профиля, как описано в этом документе.
Когда соответствующий процессор языка разметки расширенного синтеза речи обнаруживает элементы или атрибуты, отличные от тех, которые включены в расширенный профиль, это МАЙ :
игнорировать нестандартные элементы и/или атрибуты
или обработать нестандартные элементы и/или атрибуты
или отклонить документ, содержащий эти элементы и/или атрибуты
2.
2.5 Профили
Профиль SSML — это набор элементов и атрибутов SSML. В этом документе определены только два профиля:
.
Основной профиль
Основной профиль состоит из всех элементов и атрибутов, определенных в этой спецификации, за исключением атрибутов clipBegin , clipEnd , RepeatCount , RepeatDur , soundLevel и speed атрибутов аудиоэлемента.
Расширенный профиль
Расширенный профиль состоит из всех элементов и атрибутов, определенных в данной спецификации.
2.2.6 Соответствующий агент пользователя
Агент пользователя, соответствующий стандарту , представляет собой соответствующий процессор языка разметки синтеза речи, способный принимать документ SSML в качестве входных данных и создавать голосовой вывод, используя информацию, содержащуюся в разметке, для воспроизведения документа в соответствии с намерениями автора. Соответствующий пользовательский агент ДОЛЖЕН поддерживать хотя бы один естественный язык.
Поскольку нельзя гарантировать, что выходные данные будут правильным представлением всей разметки, содержащейся во входных данных, требования соответствия в отношении точности отсутствуют. Однако тест на соответствие МАЙ требует некоторых примеров правильного синтеза справочного документа для определения соответствия.
2.3 Интеграция с другими языками разметки
2.3.1 СМИЛ
Синхронизированный язык интеграции мультимедиа (SMIL, произносится как «улыбка») [SMIL3] позволяет легко создавать интерактивные аудиовизуальные презентации. SMIL обычно используется для «мультимедийных»/мультимедийных презентаций, которые объединяют потоковое аудио и видео с изображениями, текстом или любым другим типом мультимедиа. SMIL — это простой в освоении HTML-подобный язык, и многие презентации SMIL написаны с использованием простого текстового редактора. См. примеры интеграции SMIL/SSML в Приложении E.
2.3.2 ACSS
Каскадные таблицы стилей
[CSS2 §19] используются для дополнения стандартных визуальных форм документов (таких как HTML) дополнительными элементами, помогающими синтезировать текст в звук. По сравнению с SSML документы, сгенерированные с помощью ACSS, способны к более сложным спецификациям звуковой последовательности, включая обозначение трехмерного местоположения источника звука. Многие другие элементы ACSS перекрывают функциональные возможности SSML, особенно в спецификации типа/качества голоса. SSML можно рассматривать как расширенный набор возможностей ACSS, за исключением пространственного звука.
2.3.3 VoiceXML
Расширяемый язык разметки голоса [VXML] обеспечивает веб-разработку и доставку контента для интерактивных голосовых приложений (см. голосовой браузер ). VoiceXML поддерживает синтез речи, запись и воспроизведение оцифрованного звука, распознавание речи, ввод DTMF, управление телефонными вызовами и диалоговые окна смешанных инициатив на основе форм. VoiceXML 2.0 расширяет SSML для разметки синтезируемого текста. Пример интеграции VoiceXML и SSML см. в Приложении F.
2.4 Получение документов SSML
Поведение при извлечении и кэшировании документов SSML определяется средой, в которой работает процессор синтеза. Например, в контексте интерпретатора VoiceXML политика кэширования определяется интерпретатором VoiceXML.
3. Элементы и атрибуты
В этой спецификации определены следующие элементы и атрибуты.
3.1 Структура документа, обработка текста и произношение
3.1.1 «говорить» корневой элемент
3.1.1.1 Атрибуты обрезки
3.1.2 Язык: атрибут «xml:lang»
3.1.3 Базовый URI: атрибут «xml:base»
3.1.3.1 Разрешение относительных URI
3.1.4 Идентификатор: атрибут «xml:id»
3.1.5 Документы лексикона
3.1.5.1 «лексикон» Элемент
3.1.5.2 Элемент «поиск»
3. 1.6 «мета» Элемент
3.1.7 «метаданные» Элемент
3.1.8 Структура текста
3.1.8.1 Элементы «p» и «s»
3.1.8.2 Элементы «токен» и «w»
3.1.9 «утверждать как» Элемент
3.1.10 Элемент «фонема»
3.1.10.1 Реестр алфавитов произношения
3.1.11 «Подэлемент»
3.1.12 «язык» Элемент
3.1.13 Ошибка речи: атрибут onlangfailure
3.2 Просодия и стиль
3.2.1 «голос» Элемент
3.2.2 Элемент «акцент»
3.2.3 Элемент «разрыв»
3.2.4 «Просодия» Элемент
3.3 Другие элементы
3.3.1 Элемент «аудио»
3.3.1.1 Атрибуты обрезки
3.3.1.2 Атрибут «уровень звука»
3.3.1.3 Атрибут «скорость»
3.3.2 «метка» Элемент
3.3.3 «Desc» Элемент
3.1 Структура документа, обработка текста и произношение
3.
1.1 Корневой элемент Speak
Язык разметки синтеза речи представляет собой XML-приложение. Корневой элемент — это говорить.
xml:lang — это НЕОБХОДИМЫЙ атрибут, определяющий язык корневого документа.
xml:base — это НЕОБЯЗАТЕЛЬНЫЙ атрибут , определяющий базовый URI корневого документа.
onlangfailure — это НЕОБЯЗАТЕЛЬНЫЙ атрибут , определяющий желаемое поведение при сбое речи.
Атрибут версии является НЕОБХОДИМЫМ атрибутом , который указывает версию спецификации, которая будет использоваться для документа, и ДОЛЖЕН иметь значение «1.1».
Атрибуты обрезки указаны в подразделе ниже.
Перед выполнением элемента говорить процессор синтеза ДОЛЖЕН выбрать голос по умолчанию. Обратите внимание, что сбой при воспроизведении языка (см. Раздел 3.1.13) произойдет, как только будет встречен первый текст, если язык текста является тем, на котором голос по умолчанию не может говорить. Это предполагает, конечно, что голос не был изменен до встречи с текстом.
Элемент говорить может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, лексикон, поиск, отметка, мета, метаданные, р, фонема, просодия, скажи-как, суб, с, токен, голос, ж.
3.1.1.1 Атрибуты обрезки
Атрибуты обрезки определяют диапазон документа, который будет
предоставлено. И начало, и конец промежутка в содержании выступления можно указать с помощью меток.
Для Speak определены следующие атрибуты обрезки:
Имя
Обязательно
Тип
Значение по умолчанию
Описание
стартовая метка
ложь
тип xsd:токен [СХЕМА2 §3.3.2]
нет
Метка, используемая для определения начала рендеринга.
метка
ложь
тип xsd:токен [СХЕМА2 §3.3.2]
нет
Метка, используемая для определения окончания рендеринга.
Стартовая метка 9Атрибуты 0331 и endmark задают имя, которое ссылается на маркер, назначенный атрибутом name элемента mark. Только маркеры, определенные один раз в документе, т. е. уникальные, разрешены в качестве значения либо startmark , либо endmark . Диапазон визуализируемого документа определяется следующим образом:
Если указана начальная метка , рендеринг начинается с начальной метки . Если начальная метка не указан,
рендеринг начинается в начале
документ.
Если указана конечная метка , то рендеринг заканчивается на конечной метке . Если конечная метка не указана, рендеринг завершается.
в конце документа.
Если начальная метка находится после конечной метки , то звук не генерируется.
Ошибка, если значение, указанное для startmark или endmark , не является допустимой меткой в документе.
Примеры
Если атрибуты обрезки не указаны, то весь документ
рендерится:
Атрибут xml:lang , как определено XML [XML 1.0 или XML 1.1, соответственно, §2.12], МОЖЕТ использоваться в SSML для указания естественного языка письменного содержимого элемента, в котором он встречается . BCP47 [BCP47] может помочь понять, как использовать этот атрибут.
Информация о языке наследуется вниз по иерархии документа, т. е. ее нужно указать только один раз, если весь документ на одном языке, а языковая информация вложена, т. е. внутренние атрибуты перезаписывают внешние атрибуты.
xml:lang — это определенный атрибут для элементов speak, lang, desc, p, s, token и w.
xml:lang разрешено для p, s, token и w только потому, что на этих уровнях принято менять язык.
Процессору синтеза СЛЕДУЕТ использовать значение атрибута xml:lang , чтобы помочь ему определить наилучший способ визуализации содержимого элемента, в котором оно встречается. Когда процессор синтеза сталкивается с текстом, он не знает, как говорить, процессор должен решить, что делать (см.0330 onlangfailure атрибут). Одним из источников информации, который может использоваться для принятия решения, является значение атрибута xml:lang .
Процессор синтеза может также использовать значение атрибута xml:lang , чтобы помочь ему определить язык содержимого, что, конечно, может повлиять на то, как голос будет произносить содержимое. Например, » Французское слово для кошки - это чат, а не чат. » Если автору документа требуется новый голос, который лучше адаптирован к новому языку, то процессор синтеза может быть явно запрошен для выбора нового голоса с помощью элемента voice. Дополнительная информация о выборе голоса содержится в Разделе 3.2.1.
На этап обработки нормализации текста может повлиять вложенный язык. Это верно как для поддержки разметки элементом say-as, так и для поведения без разметки. В следующем примере тот же текст «01.02.2000» может быть прочитан как «February first two тысяч» в первом предложении, в соответствии с правилами произношения американского английского, но как «the second of January two тысяч» во втором, который следует итальянским правилам предварительной обработки.
org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Сегодня, 1 февраля 2000 г.Встреча, 1 февраля 2000 г.
говорить>
3.1.3 Базовый URI:
xml:base Атрибут
Относительные URI разрешаются в соответствии с базовым URI , который может поступать из различных источников. Объявление базового URI позволяет авторам явно указывать базовый URI документа. Подробную информацию о разрешении относительных URI см. в разделе 3.1.3.1.
Объявление базового URI разрешено, но НЕОБЯЗАТЕЛЬНО . Два элемента, затронутые им, равны
.
аудио
НЕОБЯЗАТЕЛЬНЫЙ Атрибут src может указывать относительный URI.
лексикон
Атрибут uri может указывать относительный URI.
Атрибут xml:base
Объявление базового URI следует за [XML-BASE] и указывается атрибутом xml:base в корневом элементе speak.
example.com/another-base-file-path">
3.1.3.1 Разрешение относительных URI
Пользовательские агенты ДОЛЖНЫ вычислять базовый URI для разрешения относительных URI в соответствии с [RFC3986]. Ниже описано, как RFC3986 применяется к сводным документам.
Пользовательские агенты ДОЛЖНЫ вычислять базовый URI в соответствии со следующими приоритетами (от наивысшего приоритета к низшему):
Базовый URI задается атрибутом xml:base элемента speak (см. раздел 3.1.3).
Базовый URI задается метаданными, обнаруженными во время взаимодействия протокола, такими как заголовок HTTP (см. [RFC2616]).
По умолчанию базовым URI является URI текущего документа. Не все документы синтеза имеют базовый URI (например, действительный документ синтеза может появиться в электронном письме и может не обозначаться URI). Ошибка, если такие документы содержат относительные URI.
3.1.4 Идентификатор:
xml:id Атрибут
Атрибут xml:id [XML-ID] МОЖЕТ использоваться в SSML для присвоения элементу идентификатора, уникального для документа, что позволяет ссылаться на элемент из других документов.
xml:id — это определенный атрибут для элементов lexicon, p, s, token и w.
3.1.5 Lexicon Documents: словарь и элементы поиска
Документ SSML 9 МАЯ0009 ссылка на один или несколько документов лексикона. Документ лексикона расположен по URI с типом носителя ДОПОЛНИТЕЛЬНЫЙ , и ему присваивается имя, уникальное в документе SSML.
3.1.5.1 Элемент словаря
Любое количество элементов лексикона МАЯ встречаются как непосредственные дочерние элементы элемента speak.
Элемент словаря ДОЛЖЕН иметь атрибут uri , определяющий URI, который идентифицирует местоположение документа словаря.
Элемент словаря ДОЛЖЕН иметь атрибут xml:id , который присваивает имя документу словаря. Имя ДОЛЖНО быть уникальным для текущего документа SSML. Область действия этого имени — текущий документ SSML.
Элемент словаря МОЖЕТ иметь атрибут типа , который указывает тип носителя документа словаря. Значение по умолчанию атрибута типа : application/pls+xml , тип носителя, связанный с документами Спецификации лексикона произношения [PLS], как определено в [RFC4267].
Элемент лексикона МОЖЕТ иметь атрибут fetchtimeout , который указывает время ожидания для выборки. Значение представляет собой обозначение времени. Значение по умолчанию зависит от процессора.
Элемент словаря МОЖЕТ иметь атрибут maxage , указывающий, что документ готов использовать содержимое, возраст которого не превышает указанного времени (см. «max-age» в HTTP 1.1 [RFC2616]). Значение равно xsd:nonNegativeInteger [СХЕМА2 §3.3.20]. Документ не хочет использовать устаревшее содержимое, если также не указано maxstale .
Элемент лексикона МОЖЕТ иметь атрибут maxstale , указывающий, что документ готов использовать содержимое, срок действия которого истек (см. «max-stale» в HTTP 1.1 [RFC2616]). Значение представляет собой xsd:nonNegativeInteger [SCHEMA2 §3.3.20]. Если maxstale присвоено значение, то документ готов принять содержимое, срок действия которого истек не более чем на указанный период времени.
Элемент словаря является пустым элементом.
Если при извлечении или анализе документа лексикона возникает ошибка, процессор синтеза ДОЛЖЕН уведомить хост-среду о возникновении такой ошибки. Процессор МОЖЕТ немедленно уведомить хост-среду об асинхронном событии, или процессор МОЖЕТ сделать уведомление об ошибке через свою систему регистрации. Процессор ДОЛЖЕН включать информацию об ошибке там, где это возможно; например, если лексикон не может быть получен из-за ошибки http 404, этот код ошибки может быть включен в уведомление. После уведомления процессор ДОЛЖЕН продолжать обработку, как если бы был загружен пустой действительный словарь.
Детали атрибута типа
Примечание. В описании и таблице ниже используется воображаемый тип лексикона, зависящий от поставщика, x-vnd.example.lexicon . Это предназначено для представления любого формата, возвращаемого/доступного, в зависимости от ситуации.
Ресурс словаря, указанный ссылкой URI, может быть доступен в одном или нескольких типах носителей. Автор SSML может указать предпочтительный тип носителя с помощью тип атрибут. Когда содержимое, представленное URI, доступно во многих форматах данных, процессор синтеза MAY использует предпочтительный тип, чтобы влиять на то, какой из множества форматов используется. Например, на сервере, реализующем согласование содержимого HTTP, процессор может использовать тип для упорядочивания предпочтений при согласовании.
При доставке ресурс, указанный ссылкой URI, может рассматриваться с точки зрения двух типов. объявил тип носителя — это предполагаемое значение ресурса, а фактический тип носителя — это истинный формат его содержимого. Фактический тип должен совпадать с объявленным типом, но это не всегда так (например, неправильно настроенный HTTP-сервер может вернуть text/plain для документа, следующего за специфичным для поставщика x-vnd.example.lexicon формат ). Конкретная схема URI может требовать, чтобы владелец ресурса всегда, иногда или никогда не возвращал тип мультимедиа. Всякий раз, когда тип возвращается, он считается авторитетным. Объявленный тип мультимедиа определяется значением, возвращаемым владельцем ресурса, или, если ничего не возвращается, предпочтительным типом мультимедиа, указанным в документе SSML.
Могут возникнуть три особых случая. Заявленный тип может не поддерживаться процессором; это ошибка. Объявленный тип может поддерживаться, но фактический тип может не совпадать; это тоже ошибка. Наконец, тип носителя не может быть объявлен; поведение зависит от конкретной схемы URI и возможностей процессора синтеза. Например, HTTP 1.1 допускает самоанализ документа (см. [RFC2616 §7.2.1]), схема данных возвращается к типу носителя по умолчанию, а доступ к локальным файлам не определяет никаких правил. В следующей таблице приведены некоторые информативные примеры:
Примеры типов носителей
HTTP 1.1 запрос
Локальный доступ к файлам
Тип носителя, возвращенный владельцем ресурса
текстовый/обычный
x-vnd. example.lexicon
<нет>
<нет>
Предпочтительный тип носителя из документа SSML
Не применимо; возвращаемый тип является авторитетным.
x-vnd.example.lexicon
приложение/пожалуйста+xml
Заявленный тип носителя
текстовый/обычный
x-vnd.example.lexicon
x-vnd.example.lexicon
<нет>
Поведение для фактического типа носителя x-vnd.example.lexicon
Этот ДОЛЖЕН обрабатываться как текстовый/обычный. Это вызовет ошибку, если text/plain не поддерживается или если документ не соответствует ожидаемому формату.
Объявленный и фактический типы совпадают; успех, если x-vnd.example.lexicon
поддерживается процессором синтеза; иначе ошибка.
Специально для схемы; процессор синтеза может проанализировать документ, чтобы определить его тип.
3.1.5.2 Элемент поиска
Элемент поиска ДОЛЖЕН иметь атрибут ref . Атрибут ref задает имя, которое ссылается на документ словаря, назначенный xml:id атрибут элемента словаря.
Ссылочный лексикон может содержать информацию (например, произношение) для лексем, которые могут появляться в тексте, подлежащем отображению. Для документов лексикона PLS информация, содержащаяся в документе PLS , ДОЛЖНА использоваться процессором синтеза при отображении токенов, которые появляются в контексте элемента поиска. Для документов лексикона, не относящихся к PLS, информация, содержащаяся в документе лексикона, СЛЕДУЕТ может использоваться процессором синтеза при отображении маркеров, которые появляются в содержимом элемента поиска, хотя процессор МОЖЕТ не использовать информацию, если она считается несовместимой с содержимым документа SSML. Например, лексикон поставщика может использоваться только для определенных значений атрибута интерпретировать как элемента say-as или для определенного набора голосов. Поставщики ДОЛЖНЫ задокументировать ожидаемое поведение процессора синтеза, когда содержимое SSML ссылается на лексикон, не относящийся к PLS.
Элемент поиска МАЯ содержит другие элементы поиска. Когда элемент поиска содержит другие элементы поиска, дочерние элементы поиска имеют более высокий приоритет. Приоритет означает, что токен сначала ищется в лексиконе с наивысшим приоритетом. Только если лексема не найдена в этом лексиконе, она затем ищется в лексиконе со следующим более низким приоритетом, и так далее, пока лексема не будет успешно найдена или пока все лексиконы не будут использованы для поиска. Предполагается, что процессор синтеза уже имеет один или несколько встроенных системных словарей, которые будут рассматриваться как имеющие более низкий приоритет, чем заданные с помощью элементов словаря и поиска. Обратите внимание, что если токен не входит в область действия хотя бы одного элемента поиска, то этот токен можно искать только во встроенных системных словарях.
Элемент поиска может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, п, фонема, просодия, произнесение, суб, с, токен, голос, ш.
<говорить версия="1.1"
xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
<поиск ref="pls">
токены здесь ищутся в lexicon.pls
<поиск ref="sw">
лексемы здесь сначала ищутся в странно-словах. файле, а затем, если не найдены, в lexicon.pls
токены здесь ищутся в lexicon.pls
токены здесь не ищутся в лексических документах
...
говорить>
3.1.6 метаэлемент
Метаданные и метаэлементы — это контейнеры, в которые можно поместить информацию о документе. Элемент метаданных обеспечивает более общую и мощную обработку информации метаданных, чем мета, за счет использования схемы метаданных.
Мета-объявление связывает строку с объявленным мета-свойством или объявляет содержимое «http-equiv». Атрибут name или http-equiv равен REQUIRED . Неправильно предоставлять оба name и http-equiv атрибуты. Атрибут содержимого равен REQUIRED . Свойство seeAlso является единственным определенным именем мета-свойства. Он используется для указания ресурса, который может предоставлять дополнительные метаданные о содержимом. Это свойство смоделировано на основе свойства seeAlso спецификации схемы Resource Description Framework (RDF) 1.0 [RDF-SCHEMA §5.4.1]. Атрибут http-equiv имеет особое значение, когда документы извлекаются через HTTP. Хотя предпочтительным методом предоставления информации заголовка HTTP является использование полей заголовка HTTP, содержимое «http-equiv» МОЖЕТ использоваться в ситуациях, когда автор документа SSML не может настроить поля заголовка HTTP, связанные с его документом на исходном сервере, например, информацию об управлении кешем. Обратите внимание, что HTTP-серверы и кэши не обязаны самостоятельно анализировать содержимое метаданных в документах SSML и, таким образом, переопределять значения заголовков, которые они отправляли бы в противном случае.
Информативный: это пример того, как метаэлементы могут быть включены в документ SSML, чтобы указать ресурс, который предоставляет дополнительные сведения о метаданных, а также указать, что документ не должен кэшироваться.
Элемент метаданных — это контейнер, в который может быть помещена информация о документе с использованием схемы метаданных. Хотя с метаданными можно использовать любую схему метаданных, РЕКОМЕНДУЕТСЯ , чтобы синтаксис XML структуры описания ресурсов (RDF) [RDF-XMLSYNTAX] использовался в сочетании с общими свойствами метаданных, определенными в Инициативе по метаданным Dublin Core [DC ].
Формат описания ресурсов [RDF] является декларативным языком и предоставляет стандартный способ использования XML для представления метаданных в виде утверждений о свойствах и отношениях элементов в Интернете. Создатели контента должны обращаться к рекомендациям W3C по метаданным [RDF-XMLSYNTAX] и [RDF-SCHEMA], когда решают, какую RDF-схему метаданных использовать в своих документах. Создателям контента также следует обращаться к Инициативе метаданных Dublin Core [DC], которая представляет собой набор общеприменимых основных свойств метаданных (например, Название, Создатель, Тема, Описание, Права и т. д.).
Свойства документа, объявленные с помощью элемента метаданных, могут использовать любую схему метаданных.
Информативно: это пример того, как метаданные могут быть включены в документ SSML с использованием схемы RDF Dublin Core версии 1.0 [DC], описывающей общую информацию о документе, такую как заголовок, описание, дата и т. д.:
Элемент метаданных может иметь произвольное содержимое, хотя никакое содержимое не будет отображаться процессором синтеза.
3.1.8 Структура текста
3.1.8.1 Элементы p и s
Элемент p представляет абзац. Элемент s представляет предложение.
xml:lang , xml:id и onlangfailure являются определенными атрибутами элементов p и s.
<р>
Это первое предложение абзаца.Вот еще одно предложение.
говорить>
Использование элементов p и s ДОПОЛНИТЕЛЬНО . Если текст встречается без охватывающего его элемента p или s, процессор синтеза СЛЕДУЕТ попытаться определить структуру, используя специфические для языка знания о формате открытого текста.
Элемент p может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, фонема, просодия, скажи-как, суб, с, токен, голос, ш.
Элемент s может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, фонема, просодия, произнесение, суб, токен, голос, w.
3.1.8.2 токен и элементы w
Элемент маркера позволяет автору указать, что его содержимое является маркером, и устранить неоднозначность сегментации маркера (слова) процессора синтеза.
Элемент маркера необходим для отображения языков
, которые не используют пробелы в качестве идентификатора границы маркера, например китайский, тайский и японский
, которые используют пробелы для сегментации слогов, например вьетнамский
, которые используют пробелы для других целей, например урду
Использование этого элемента может привести к улучшению подсказок для управления просодией (например, паузы) и может помочь процессору синтеза в выборе правильного произношения для омографов. Другие элементы, такие как разрыв, отметка и просодия, разрешены в токене, чтобы разрешить аннотацию на уровне подтокена (например, слог, мора или любые другие единицы, приемлемые для текущего языка). Процессоры синтеза ТРЕБУЮТСЯ для разбора этих аннотаций и МОЖЕТ отображать их так, как они могут.
Текстовое содержимое элемента токена и его подэлементов вместе считается одним токеном для целей лексического поиска следующим образом:
Вся разметка в элементе токена удаляется (остается содержимое разметки).
Весь оставшийся текст объединяется в том порядке, в котором он появляется в документе.
Из этого отдельного блока текста удаляются начальные и конечные пробелы.
Несколько смежных пробельных символов преобразуются в один пробел.
Результат обрабатывается как один токен для лексического поиска.
Таким образом, «happy» и « hap py» будут относиться к токенам «happy» и «счастливый» соответственно. Обратите внимание, что это отличается от того, как обрабатываются текст и разметка за пределами элемента токена (см. «Нормализация текста» в разделе 1.2).
Использование элементов токена ДОПОЛНИТЕЛЬНО . Если текст встречается без вмещающего элемента маркера, процессор синтеза СЛЕДУЕТ попытаться определить сегментацию маркера, используя специфические для языка знания формата открытого текста.
xml:lang — это определенный атрибут в элементе маркера для определения письменного языка содержимого.
xml:id — это определенный атрибут элемента токена.
onlangfailure — это НЕОБЯЗАТЕЛЬНЫЙ атрибут , определяющий желаемое поведение при сбое речи.
роль является НЕОБЯЗАТЕЛЬНЫМ определенным атрибутом элемента токена. Атрибут роли принимает в качестве значения одно или несколько QName, разделенных пробелами (как определено в Разделе 4 Пространств имен в XML (1.0 [XMLNS 1.0] или 1.1 [XMLNS 1.1], в зависимости от используемой версии XML)). QName
в содержимом атрибута раскрывается в расширенное имя
используя объявления пространства имен в области действия для содержащего токен элемента.
Таким образом, каждое QName предоставляет ссылку на конкретный элемент в
указанное пространство имен. Во втором примере ниже QName в пределах атрибут роли расширяется до элемента «VV0» в
Пространство имен http://www.example.com/claws7tags.
Этот механизм позволяет ссылаться на определенные таксономии слов.
классы с расчетом на то, что они документированы в
указанный URI пространства имен.
Атрибут роли предназначен для использования при синхронизации с другими спецификациями, например, для описания дополнительной информации, помогающей выбрать наиболее подходящее произношение для текста, содержащегося во внешнем словаре (см. документы словаря).
Элемент маркера может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, отметка, фонема, просодия, произнесение, суб.
Элемент токена может содержаться только в следующих элементах: аудио, выделение, язык, поиск, просодия, речь, р, с, голос.
Элемент w является псевдонимом элемента token.
Вот пример, показывающий использование элемента token.
南京市长江大桥
南京市长江大桥
上海是个大都会
上海人大都会那么说
говорить>
В следующем примере показано использование атрибута роли . Первый документ ниже представляет собой образец словаря (PLS) для китайского слова «处». Второй ссылается на этот лексикон и показывает, как можно использовать атрибут роли для выбора подходящего произношения китайского слова «处» в диалоговом окне.
Элемент say-as позволяет автору указать информацию о типе текстовой конструкции, содержащейся в элементе, и помочь указать уровень детализации для отображения содержащегося текста.
Определение полного набора типов текстовых форматов затруднено из-за разнообразия языков, которые необходимо учитывать, и из-за врожденной гибкости письменных языков. SSML определяет только элемент say-as, его атрибуты и их назначение. Он не перечисляет возможные значения атрибутов. Рабочая группа планирует подготовить отдельный документ, в котором будут определены стандартные значения и связанное с ними нормативное поведение для этих значений. Приведенные здесь примеры предназначены только для иллюстрации назначения элемента и атрибутов.
Элемент say-as имеет три атрибута: интерпретировать как , форматировать и подробно . Атрибут интерпретировать как всегда равен REQUIRED ; два других атрибута: ДОПОЛНИТЕЛЬНО . Допустимые значения атрибута формата зависят от значения атрибута интерпретировать как .
Элемент say-as может содержать только текст, подлежащий отображению.
интерпретируется как и формат атрибуты
Атрибут интерпретировать как указывает тип содержимого содержащейся текстовой конструкции. Указание типа содержимого помогает процессору синтеза различать и интерпретировать текстовые конструкции, которые могут отображаться по-разному в зависимости от того, какой тип информации предназначен. Кроме того, атрибут ДОПОЛНИТЕЛЬНЫЙ формат может дать дополнительные подсказки о точном форматировании содержащегося текста для типов контента, которые могут иметь неоднозначные форматы.
Когда указано, значения интерпретировать как и формата должны интерпретироваться процессором синтеза как подсказки, предоставленные автором документа разметки для облегчения нормализации текста и произношения.
Во всех случаях текст, заключенный в любой элемент say-as, должен быть стандартной орфографической формой языка, используемого в данный момент. Процессор синтеза СЛЕДУЕТ поддерживать общие орфографические формы указанного языка для каждого типа контента, который он поддерживает.
Когда значение атрибута интерпретировать как неизвестно или не поддерживается процессором, он ДОЛЖЕН отображать содержащийся текст, как если бы значение интерпретировать как не было указано.
Когда значение атрибута формата неизвестно или не поддерживается процессором, он ДОЛЖЕН отображать содержащийся текст, как если бы значение формата не было указано, и СЛЕДУЕТ отображать его с использованием значения интерпретировать как что указано.
Когда содержимое элемента say-as содержит дополнительный текст рядом с содержимым в указанном формате и типе интерпретировать как , тогда этот дополнительный текст ДОЛЖЕН отображаться. Процессор МОЖЕТ сделать отображение дополнительного текста зависимым от типа элемента, в котором он появляется. Когда содержимое элемента say-as не содержит содержимого в указанном интерпретировать как или формат , процессор ДОЛЖЕН отображать содержимое либо так, как если бы атрибут формата не присутствовал, либо как если бы атрибут интерпретировать как не присутствовал, или как если бы ни формат , ни Присутствовало атрибутов интерпретации как . Процессор ДОЛЖЕН также уведомить среду о несоответствии.
Указание типа или формата содержимого не обязательно влияет на способ произнесения информации. Процессор синтеза СЛЕДУЕТ произносить содержащийся текст в манере, в которой такой контент обычно создается для данного языка.
Деталь
Атрибут
Атрибут detail является НЕОБЯЗАТЕЛЬНЫМ атрибутом , который указывает уровень детализации, который должен быть прочитан вслух или воспроизведен. Каждое значение подробного атрибута ДОЛЖНО отображать все информационное содержание в содержащемся тексте; однако конкретные значения для детали 9Атрибут 0331 можно использовать для рендеринга содержимого, которое обычно не является информативным в бегущем тексте, но может быть важно для рендеринга в определенных целях. Например, процессор синтеза обычно воспроизводит знаки препинания посредством соответствующих изменений в просодии. Установка более высокого уровня детализации может использоваться для явного произнесения знаков препинания, например. для считывания закодированных номеров деталей или фрагментов программного кода.
Атрибут Detail может использоваться для всех типов , интерпретируемых как .
Если атрибут подробностей не указан, уровень детализации, создаваемый процессором синтеза, зависит от текстового содержимого и языка.
Когда значение атрибута подробностей неизвестно или не поддерживается процессором, ДОЛЖЕН отображать содержащийся текст, как если бы для атрибута подробностей не было указано значение.
3.1.10 Элемент фонемы
Элемент фонемы обеспечивает фонематическое/фонетическое произношение содержащегося в нем текста. Элемент фонемы МАЙ быть пустым. Однако РЕКОМЕНДУЕТСЯ , чтобы элемент содержал удобочитаемый текст, который можно использовать для неречевой визуализации документа. Например, контент может отображаться визуально для пользователей с нарушениями слуха.
Атрибут ph является НЕОБХОДИМЫМ атрибутом , который определяет строку фонемы/телефона.
Этот элемент предназначен исключительно для фонематических и фонетических обозначений и предназначен для обеспечения произношения слов или очень коротких фраз. Фонематическая/фонетическая строка не подвергается нормализации текста и не обрабатывается как маркер для поиска в лексиконе (см. Раздел 3.1.5), в то время как значения в say-as и sub могут подвергаться и тому, и другому. Вкратце, фонематические цепочки состоят из фонем, языково-зависимых речевых единиц, характеризующих лингвистически значимые различия в языке; грубо говоря, фонемы представляют все звуки, необходимые для отличия одного слова от другого в данном языке. С другой стороны, фонетические цепочки состоят из звуков, речевых единиц, которые характеризуют способ (дуновение воздуха, щелчок, вокализация и т. д.) и место (спереди, посередине, сзади и т. д.) артикуляции в голосовом тракте человека и являются таким образом, не зависит от языка; телефоны представляют реализованные различия в воспроизведении человеческой речи.
Атрибут алфавита является НЕОБЯЗАТЕЛЬНЫМ атрибутом , который определяет алфавит фонематического/фонетического произношения. Алфавит произношения в этом контексте относится к набору символов для представления звуков одного или нескольких человеческих языков. Единственными допустимыми значениями для этого атрибута являются « ipa » (см. следующий абзац), значения, определенные в реестре алфавитов произношения, и определенные поставщиком строки в форме « x-organization » или « x-organization-alphabet ". Например, Японская ассоциация производителей электроники и информационных технологий [JEITA] может поощрять использование алфавита, такого как "x-JEITA" или "x-JEITA-IT-4002" для их фонемный алфавит [JEIDAALPHABET].
Процессоры синтеза СЛЕДУЕТ поддерживать значение для алфавита " ipa ", соответствующее представлению фонетических символов Unicode, разработанному Международной фонетической ассоциацией [IPA]. В дополнение к исчерпывающему набору символов гласных и согласных этот набор символов поддерживает разделитель слогов, многочисленные диакритические знаки, символы ударения, символы лексического тона, интонационные маркеры и многое другое. Для этого алфавита допустимо 9Значения 0330 ph представляют собой строки значений, указанных в Приложении 2 [IPAHNDBK]; обратите внимание, что транскрипция IPA может содержать пробелы для удобства чтения, которые не влияют на произношение. Информативные таблицы сопоставлений IPA-Unicode можно найти в [IPAUNICODE1] и [IPAUNICODE2]. Обратите внимание, что не все символы IPA доступны в Unicode. Для процессоров, поддерживающих этот алфавит,
Процессор ДОЛЖЕН синтаксически принимать все допустимые ph значения.
Процессор ДОЛЖЕН производить вывод, когда он получает коды Unicode IPA, которые можно разумно считать принадлежащими текущему языку.
Производство вывода, когда заданы другие коды, полностью зависит от процессора.
Ошибка, если значение для алфавита , который неизвестен или не может быть применен процессором синтеза. Поведение по умолчанию, когда атрибут алфавита не указан, зависит от процессора.
Атрибут типа является необязательным атрибутом, который указывает дополнительную информацию о том, как следует интерпретировать информацию о произношении. Единственными допустимыми значениями для этого атрибута являются « default », который не имеет значения, и « ruby », который указывает, что информация о произношении взята из текста ruby [RUBY]. Значение по умолчанию для этого атрибута: " по умолчанию ".
Сам элемент фонемы может содержать только текст (без элементов).
3.1.10.1 Реестр алфавитов произношения
Ссылки на реестр Pronunciation Alphabet Registry можно найти на странице пространства имен SSML по адресу http://www. w3.org/2001/10/synchronous.
3.1.11, подэлемент
Подэлемент используется для указания того, что текст в значении атрибута alias заменяет содержащийся текст для произношения. Это позволяет документу содержать как устную, так и письменную форму. ТРЕБУЕТСЯ Атрибут псевдонима указывает строку, которая будет произнесена вместо заключенной строки. Процессору СЛЕДУЕТ применить нормализацию текста к значению псевдонима .
Подэлемент может содержать только текст (без элементов).
W3C
говорить>
3.
1.12 элемент языка
Элемент lang используется для указания естественного языка содержимого.
xml:lang — это НЕОБХОДИМЫЙ атрибут, определяющий язык корневого документа.
onlangfailure — это НЕОБЯЗАТЕЛЬНЫЙ атрибут , определяющий желаемое поведение при сбое речи.
Этот элемент МОЖЕТ использоваться при изменении естественного языка. Нет текстовой структуры, связанной с изменением языка, указанным элементом lang. Это МОЖЕТ использоваться для указания языка содержимого на уровне, отличном от уровня абзаца, предложения или слова. Когда изменение языка должно быть связано со структурой текста, рекомендуется использовать атрибут xml:lang для соответствующего элемента p, s, token или w.
1" xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Французское слово для кошки — chat.
Он предпочитает есть пасту al dente.
говорить>
Элемент lang может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, р, фонема, просодия, произнесение, суб, с, токен, голос, ш.
3.1.13 Ошибка речи:
onlangfailure Атрибут
Атрибут onlangfailure является НЕОБЯЗАТЕЛЬНЫМ атрибутом , который содержит одно значение из следующего пронумерованного списка, описывающего желаемое поведение процессора синтеза при сбое распознавания языка. Соответствующий процессор синтеза ДОЛЖЕН сообщить о сбое речи в дополнение к выполнению действий, описанных ниже.
changevoice - если существует голос, который может говорить на этом языке, процессор синтеза переключится на этот голос и произнесет содержимое. В противном случае процессор выбирает другое поведение (либо ignoretext, либо ignorelang).
ignoretext - процессор синтеза не будет пытаться визуализировать текст, который находится на сбойном языке.
ignorelang - процессор синтеза проигнорирует изменение языка и будет говорить так, как если бы содержимое было на предыдущем языке.
CPUChoice - Процессор синтеза выбирает поведение (либо changevoice, ignoretext, либо ignorelang).
Сбой речи возникает всякий раз, когда процессор синтеза решает, что выбранный в данный момент голос (см. раздел 3.2.1) не может говорить на заявленном языке текста. Это может произойти, когда процессор синтеза встречает новый xml:lang значение или символы или последовательности символов, которые голос не знает, как обработать.
Значение этого атрибута наследуется вниз по иерархии документа, т.е. его нужно указать только один раз, если желаемое поведение для всего документа одинаково, и настройки этого значения вложены друг в друга, т.е. внутренние атрибуты перезаписывают внешние атрибуты. Значение по умолчанию верхнего уровня для этого атрибута — «выбор процессора». Другие языки со встроенными фрагментами SSML (без элемента speak) ДОЛЖЕН объявить значение по умолчанию верхнего уровня для этого атрибута.
onlangfailure разрешен для всех элементов, которые могут содержать xml:lang , поэтому это определенный атрибут для элементов speak, lang, desc, p, s, token и w.
3.2 Просодия и стиль
3.2.1 голосовой элемент
Голосовой элемент — это производственный элемент, который запрашивает изменение голоса. Существует два типа атрибутов для голосового элемента: те, которые указывают желаемые характеристики голоса, и те, которые управляют поведением. Атрибуты голосовых функций:
пол : ДОПОЛНИТЕЛЬНЫЙ атрибут, указывающий предпочтительный пол голоса для произнесения содержащегося текста. Перечисленные значения: " мужской ", " женский ", " нейтральный " или пустая строка "".
age : НЕОБЯЗАТЕЛЬНЫЙ атрибут, указывающий предпочтительный возраст в годах (с момента рождения) голоса для произнесения содержащегося текста. Допустимые значения имеют тип xsd:nonNegativeInteger 9.0555 [SCHEMA2 §3.3.20] или пустая строка "".
вариант : НЕОБЯЗАТЕЛЬНЫЙ атрибут, указывающий предпочтительный вариант других характеристик голоса для произнесения содержащегося текста. (например, второй мужской детский голос). Допустимые значения варианта имеют тип xsd:positiveInteger [SCHEMA2 §3. 3.25] или пустую строку "".
имя : ДОПОЛНИТЕЛЬНЫЙ атрибут, указывающий имя голоса процессора для произнесения содержащегося текста. Значение МОЖЕТ быть списком имен, разделенных пробелами, упорядоченных сверху вниз, или пустой строкой "". В результате имя НЕ ДОЛЖНО содержать пробелы.
языков : ДОПОЛНИТЕЛЬНЫЙ атрибут, указывающий список языков, на которых должен говорить голос. Значение ДОЛЖНО быть либо пустой строкой "", либо списком языков, разделенным пробелами, с НЕОБЯЗАТЕЛЬНЫМ указанием акцента для каждого языка. Каждая пара язык/акцент имеет форму " язык "или" язык : акцент ", где оба язык и акцент ДОЛЖНЫ быть расширенным языковым диапазоном [BCP47, Сопоставление языковых тегов §2. 2], за исключением того, что значения "und" и "zxx".
голос задокументирован (см. Описание голоса) как чтение/говорение на языке, который соответствует расширенному языковому диапазону, заданному язык в соответствии с алгоритмом сопоставления расширенной фильтрации [BCP47, Сопоставление языковых тегов §3.3.2] и
, если указан акцент , голос документируется (см. Описание голоса) как читающий/говорящий на указанном выше языке с акцентом, который соответствует расширенному языковому диапазону, заданному акцентом в соответствии с алгоритмом сопоставления расширенной фильтрации [BCP47, Matching языковых тегов §3.3.2], за исключением того, что вложенные теги сценария и расширения акцент ДОЛЖЕН игнорироваться процессором синтеза. Авторам и поставщикам голосовых услуг рекомендуется не использовать вложенные теги сценариев или расширений для акцентов, поскольку они не имеют отношения к разговорной речи.
Например, значение "en:pt fr:ja" для языков может по закону соответствовать любому голосу, который может читать как по-английски (говоря с португальским акцентом), так и по-французски (говоря с японским акцентом). . Таким образом, будет совпадать голос, который поддерживает только «en-US» с акцентом «pt-BR» и «fr-CA» с акцентом «ja». В качестве другого примера, если у нас есть и нет голоса, поддерживающего французский язык с португальским акцентом, произойдет сбой выбора голоса. Обратите внимание, что если для языка не указан акцент, то допустим любой голос, говорящий на этом языке, независимо от акцента. Также обратите внимание, что авторский контроль над языковой поддержкой во время выбора голоса не зависит от значения 9.0330 xml:lang в тексте.
Для приведенных выше атрибутов функции пустое строковое значение указывает, что любой голос будет удовлетворять этой функции. Значением по умолчанию верхнего уровня для всех атрибутов объекта является «», пустая строка.
Атрибуты управления поведением голоса:
обязательный : НЕОБЯЗАТЕЛЬНЫЙ атрибут, определяющий набор функций по их соответствующим именам атрибутов. Этот набор функций используется описанным ниже алгоритмом выбора голоса. Допустимые значения обязательные представляют собой список, разделенный пробелами, состоящий из значений из списка имен функций: « имя », « языки », « пол », « возраст », « вариант » или пустой строки «». Значение по умолчанию для этого атрибута — «языки».
упорядочение : НЕОБЯЗАТЕЛЬНЫЙ атрибут, определяющий приоритетное упорядочение функций. Допустимые значения , упорядоченные по , представляют собой список, разделенный пробелами, состоящий из значений из списка имен функций: » имя «, « языки «, « пол «, « возраст «, « вариант » или пустая строка «», где функции, названные ранее в списке, имеют более высокий приоритет. Значение по умолчанию для этим атрибутом является «языки». Функции, не перечисленные в списке , упорядочивающие , имеют одинаковый приоритет друг с другом, но ниже, чем у последней функции в списке. функции имеют одинаковый приоритет
onvoicefailure : НЕОБЯЗАТЕЛЬНЫЙ атрибут, содержащий одно значение из следующего пронумерованного списка, описывающего желаемое поведение процессора синтеза при сбое выбора голоса. Значение по умолчанию для этого атрибута — «priorityselect».
priorityselect — процессор синтеза использует значения всех атрибутов голосовых функций для выбора голоса по приоритету признаков, где начальный набор кандидатов представляет собой набор всех доступных голосов.
keepexisting — голос не меняется.
Выбор процессора — Процессор синтеза выбирает поведение (или выбор приоритета, или сохранение существования).
ДОЛЖЕН использоваться следующий алгоритм выбора голоса :
Идентифицируются все доступные голоса, для которых совпадают значения всех атрибутов голосовых функций, перечисленных в требуемом значении атрибута . Когда значение обязательный атрибут — это пустая строка «», любые и все голоса считаются успешными совпадениями. Если один или несколько голосов идентифицированы, выбор считается успешным; в противном случае произойдет сбой выбора голоса.
Если успешный выбор идентифицирует только один голос, процессор синтеза ДОЛЖЕН использовать этот голос.
Если успешный выбор идентифицирует более одного голоса, оставшиеся функции (те, которые не перечислены в , требуются ) используются для выбора голоса по приоритету функции, где начальный набор кандидатов представляет собой набор всех идентифицированных голосов.
Если имеется ошибка выбора голоса, соответствующий процессор синтеза ДОЛЖЕН сообщить об ошибке выбора голоса в дополнение к действию(ям), выраженному значением атрибута onvoicefailure .
Чтобы выбрать голос по приоритету функции, каждая функция берется по очереди, начиная с функции с наивысшим приоритетом, контролируемой заказ атрибут.
Если хотя бы один голос соответствует значению текущего атрибута функции голоса, то все голоса, не соответствующие этому значению, удаляются из набора кандидатов . Если в наборе кандидатов остается один голос, процессор синтеза должен использовать его. Если в наборе кандидатов из остается более одного голоса, то для набора кандидатов из проверяется функция следующего приоритета.
Если ни один голос не соответствует значению текущего атрибута голосовой функции, то для 9 проверяется функция следующего приоритета. 0008 набор кандидатов .
После изучения всех атрибутов функций в списке упорядочивания , если в наборе кандидатов остается несколько голосов , процессор синтеза ДОЛЖЕН использовать любой из них.
Хотя каждый атрибут по отдельности является необязательным, если при использовании голосового элемента атрибуты не указаны, возникает ошибка.
У Мэри был ягненок,
<голосовой пол="женский" вариант="2">
Его руно было белым, как снег.
голос>
Я хочу быть как Майк.
говорить>
Голосовые описания
Для каждого голоса, доступного для процессора синтеза, поставщик голоса должен задокументировать следующее:
список языковых тегов [BCP47, теги для определения языков], представляющих языки, которые может читать голос.
для каждого языка, языковой тег [BCP47, Теги для определения языков], представляющий акцент, который голос использует при чтении языка.
Хотя указание языка (используя xml:lang ) и выбор голоса (с использованием голоса) независимы, нет требования, чтобы процессор синтеза поддерживал все возможные комбинации этих двух значений. Однако процессор синтеза ДОЛЖЕН документировать ожидаемое поведение рендеринга для каждой возможной комбинации. См. атрибут onlangfailure для получения информации о том, что происходит, когда процессор сталкивается с текстовым содержимым, которое не может быть произнесено голосом.
голосовых атрибута наследуются вниз по дереву, включая внутренние элементы, изменяющие язык. Значения по умолчанию, описанные для каждого атрибута, применяются только на верхнем уровне (документа) и переопределяются явным использованием автором элемента voice. Кроме того, изменения голоса ограничены и применяются только к содержимому элемента, в котором произошло изменение. Когда обработка достигает конца содержимого голосового элемента, т. е. закрывающего тега , голос, действовавший до начала тега, восстанавливается.
Аналогичным образом, если голос изменяется процессором в результате языкового сбоя, предыдущий голос восстанавливается, когда этот голос снова может говорить контент. Обратите внимание, что всегда есть активный голос, поскольку процессор синтеза должен выбрать голос по умолчанию перед началом выполнения документа (см. раздел 3.1.1).
w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Здесь любой женский голос.
<голос возраст="6">
Здесь женский детский голос.
язык>
голос>
голос>
говорить>
Относительные изменения просодических параметров СЛЕДУЕТ переноситься через изменения голоса. Однако разные голоса имеют разные естественные значения по умолчанию для высоты тона, скорости речи и т. д., поскольку они представляют разные личности, поэтому абсолютные значения просодических параметров могут различаться в зависимости от изменений голоса.
Качество вывода аудио или голоса может пострадать, если в предложении запрашивается изменение голоса.
Элемент voice может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, р, фонема, просодия, произнесение, суб, с, токен, голос, ш.
3.2.2 упор Элемент
Элемент выделения требует, чтобы содержащийся в нем текст произносился с выделением (также называемым выделением или ударением). Процессор синтеза определяет, как сделать выделение, поскольку характер выделения различается в зависимости от языка, диалекта или даже голоса. Атрибуты:
уровень : атрибут ДОПОЛНИТЕЛЬНО уровня указывает силу акцента, который необходимо применить. Определенные значения: «сильный» , «умеренный» , «нет» и «умеренный» . По умолчанию уровень равен «умеренный» . Значение «сильный» и «умеренный» ударение интерпретируется в соответствии с языком, на котором говорят (языки указывают ударение, используя возможную комбинацию изменения высоты тона, изменения времени, громкости и других акустических различий). «уменьшенный» уровень фактически противоположен подчеркиванию слова. Например, когда фраза «собираюсь» сокращена, ее можно произнести как «собираюсь». «none» Уровень используется для предотвращения выделения процессором синтеза слов, которые он обычно выделяет. Значения «нет» , «умеренный» и «сильный» монотонно не уменьшаются по силе.
Это большая машина!
Это огромное
банковский счет!
говорить>
Элемент выделения может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, фонема, просодия, произнесение, суб, токен, голос, ш.
3.2.3 Разрыв Элемент
Элемент break — это пустой элемент, управляющий паузой или другими просодическими границами между токенами. Использование элемента разрыва между любой парой токенов НЕОБЯЗАТЕЛЬНО . Если элемент отсутствует между токенами, ожидается, что процессор синтеза автоматически определит разрыв на основе лингвистического контекста. На практике элемент прерывания чаще всего используется для переопределения типичного автоматического поведения процессора синтеза. Атрибуты этого элемента:
Strength : атрибут Strength является ДОПОЛНИТЕЛЬНЫМ атрибутом , имеющим одно из следующих значений: «нет» , «x-weak» , «слабый» значение), «strong» или «x-strong» . Этот атрибут используется для указания силы просодической паузы в речевом выводе. Значение «нет» указывает, что не следует выводить границу просодического разрыва, что можно использовать для предотвращения просодического разрыва, который в противном случае создавал бы процессор. Другие значения указывают на монотонно неубывающую (концептуально увеличивающуюся) прочность на разрыв между жетонами. Более сильные границы обычно сопровождаются паузами. x-weak «и» x-strong » являются мнемонимами для «сверхслабых» и «сверхсильных» соответственно.
time : атрибут time является НЕОБЯЗАТЕЛЬНЫМ атрибутом , указывающим продолжительность паузы, которая должна быть вставлена в вывод в секундах или миллисекундах. Он следует формату значения времени из Рекомендации по каскадным таблицам стилей уровня 2 [CSS2], например. «250 мс», «3 с».
Атрибут force используется для указания просодической силы разрыва. Например, разрывы между абзацами обычно намного сильнее, чем разрывы между словами внутри предложения. Процессор синтеза МАЙ вставить паузу как часть реализации просодического разрыва. Паузу определенной длины также можно вставить с помощью атрибута time .
Если элемент разрыва не используется ни с атрибутами сила , ни с атрибутами время , процессор будет создавать разрыв с просодической силой большей, чем та, которую процессор в противном случае использовал бы, если бы не был предоставлен элемент разрыва.
Если оба сила и время атрибуты, процессор вставит паузу с продолжительностью, указанной атрибутом время , с другими просодическими изменениями в выводе на основе значения атрибута сила .
w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Сделайте глубокий вдох
затем продолжить.
Нажмите 1 или дождитесь звукового сигнала. <время перерыва="3с"/>
Я не слышал тебя! Пожалуйста, повторите.
говорить>
3.2.4 Элемент просодии
Элемент просодии позволяет управлять высотой тона, скоростью речи и громкостью вывода речи. Атрибуты, все ДОПОЛНИТЕЛЬНО , следующие:
шаг : базовый шаг для содержащегося текста. Хотя точное значение «базовой высоты тона» будет варьироваться в зависимости от процессора синтеза, увеличение/уменьшение этого значения обычно увеличивает/уменьшает приблизительную высоту звука на выходе. Допустимые значения: число, за которым следует «Гц», относительное изменение или 9.0554 «х-низкий» , «низкий» , «средний» , «высокий» , «х-высокий» или «по умолчанию» . Метки «x-low» по «x-high» представляют собой последовательность монотонно не уменьшающихся уровней основного тона.
контур : устанавливает фактический контур высоты тона для содержащегося текста. Формат указан в контуре высоты тона ниже.
диапазон : диапазон высоты тона (изменчивость) для содержащегося текста. Хотя точное значение «диапазона высоты тона» будет варьироваться в зависимости от процессора синтеза, увеличение/уменьшение этого значения обычно увеличивает/уменьшает динамический диапазон выходной высоты тона. Допустимые значения: число, за которым следует «Гц», относительное изменение или 9.0554 «х-низкий» , «низкий» , «средний» , «высокий» , «х-высокий» или «по умолчанию» . Метки «x-low» по «x-high» представляют собой последовательность монотонно неубывающих диапазонов основного тона.
rate : изменение скорости речи для содержащегося текста. Допустимые значения: неотрицательный процент или «x-slow» , «slow» , «medium» , «fast» , «x-fast» или «по умолчанию» . Метки от «x-slow» до «x-fast» представляют собой последовательность монотонно неубывающей скорости речи. Когда значение представляет собой неотрицательный процент, оно действует как множитель ставки по умолчанию. Например, значение 100 % означает отсутствие изменений в скорости речи, значение 200 % означает, что скорость речи в два раза превышает скорость по умолчанию, а значение 50 % означает скорость речи, равную половине скорости по умолчанию. Скорость по умолчанию для голоса зависит от языка и диалекта, а также от индивидуальности голоса. Ставка по умолчанию для голоса СЛЕДУЕТ быть таким, чтобы он воспринимался как нормальная скорость речи для голоса при чтении вслух текста. Поскольку голоса зависят от процессора, скорость по умолчанию также будет такой же.
продолжительность : значение в секундах или миллисекундах для желаемого времени, необходимого для чтения содержащегося текста. Соответствует формату значения времени из Рекомендации по каскадным таблицам стилей уровня 2 [CSS2], например. «250 мс», «3 с».
том : том для содержащегося текста. Допустимые значения: число, которому предшествует «+» или «-» и сразу после которого следует «дБ»; или «тихий» , «х-мягкий» , «мягкий» , «средний» , «громкий» , «х-громкий» или «по умолчанию» . По умолчанию +0,0 дБ. Указание значения «тихий» эквивалентно указанию децибелов (дБ) минус бесконечность. Ярлыки «тихо» по «х-громко» представляют собой последовательность монотонно не уменьшающихся уровней громкости. Когда значение представляет собой число со знаком (дБ), оно определяет отношение квадратов амплитуды нового сигнала ( 1 ) и амплитуда тока (a 0 ), и определяется в дБ:
громкость (дБ) = 20 log 10 (a 1 / a 0 )
Обратите внимание, что все числовые уровни громкости (в дБ) относятся к текущему уровню и всегда имеют знак (включая ноль). Также обратите внимание, что как только текущий уровень громкости установлен на «без звука» , все относительные изменения дочерних элементов также приводят к тишине. Элемент детской просодии МАЙ использовать метку «по умолчанию» для сброса текущего уровня громкости.
Так что для значения:
«тихий» , содержащийся текст читается молча;
‘-6.0dB’, содержащийся текст читается примерно с половиной амплитуды текущей амплитуды сигнала;
‘-0dB’, содержащийся текст читается без относительного изменения громкости;
‘+6. 0dB’, содержащийся текст читается примерно с удвоенной амплитудой текущей амплитуды сигнала.
Обратите внимание, что поведение этого атрибута для значений меток может отличаться от поведения числовых значений. Использование числового значения приводит к прямому изменению формы сигнала, в то время как использование значения метки может привести к просодическим изменениям, которые более точно отражают то, как человек увеличивает или уменьшает воспринимаемую громкость своей речи, например, по-разному регулируя частоту и мощность для различные звуковые единицы.
Хотя каждый атрибут в отдельности является необязательным, если атрибуты не указаны при использовании элемента просодии, возникает ошибка. x- foo «имена значений атрибутов предназначены для использования в качестве мнемоники для «extra foo «. Все единицы («Hz», «st») чувствительны к регистру. Также обратите внимание, что обычные уровни высоты тона и стандартные диапазоны высоты тона могут значительно различаться в зависимости от языка, как и значения помеченных значений для целей и диапазонов тангажа.
Вот пример использования атрибута тома :
<говорить версия="1.1"
xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Я говорю это с громкостью по умолчанию для этого голоса.<просодия громкости="+6дБ">
Я говорю это примерно в два раза больше исходной амплитуды сигнала.
просодия>
Я говорю это примерно на половине исходной амплитуды сигнала.
просодия>
говорить>
Номер
Число — это простое положительное значение с плавающей запятой без экспонент. Допустимые форматы: «n», «n.», «.n» и «n.n», где «n» — последовательность из одной или нескольких цифр.
Неотрицательный процент
Неотрицательный процент — это число без знака, за которым сразу следует «%».
Относительные значения
Можно указать относительные изменения для указанных выше атрибутов
в процентах (число, которому предшествует «+» или «-» и за которым следует «%»), например. «+15,2%», «-8,0%» или
как относительное число:
Для атрибутов шага и диапазона относительные изменения могут быть указаны в полутонах (число, которому предшествует «+» или «-» и за которым следует «st») или в герцах (число, которому предшествует «+» или «-», а затем «Гц»): «+0,5 ст», «+ 5 ст», «-2 ст», «+10 Гц», «-5,5 Гц». Полутон — это половина тона (полутона) стандартной диатонической гаммы.
Цена XYZ составляет $45просодия>
говорить>
Контур шага
Контур основного тона определяется как набор целей, разделенных пробелами, в определенных временных позициях в речевом выводе. Алгоритм интерполяции между целями зависит от процессора. В каждой паре формы (время, цель) первое значение представляет собой процент периода содержащегося текста (число, за которым следует «%»), а второе значение — значение атрибута шага . (число, за которым следует «Гц», относительное изменение или значение метки). Значения положения времени вне диапазона от 0% до 100% игнорируются. Если значение шага не определено для 0% или 100%, то копируется ближайший целевой шаг. Все относительные значения высоты тона относятся к значению высоты тона непосредственно перед содержащимся текстом.
Атрибут длительность имеет приоритет над атрибутом ставка атрибут. Атрибут контур имеет приоритет над атрибутами шага и диапазона .
Значение по умолчанию для всех просодических атрибутов не изменяется. Например, отсутствие атрибута rate означает, что скорость внутри элемента такая же, как и снаружи.
Элемент просодии может содержать только текст, подлежащий рендерингу, и следующие элементы: аудио, разрыв, выделение, язык, поиск, отметка, р, фонема, просодия, скажи-как, суб, с, токен, голос, ш.
Ограничения
Все просодические значения атрибутов являются ориентировочными. Если процессор синтеза не может точно воспроизвести документ, как указано (например, пытается установить высоту тона 1 МГц или скорость речи 1 000 000 слов в минуту), он ДОЛЖЕН приложить все усилия, чтобы продолжить обработку, наложив ограничение. или замену указанного неподдерживаемого значения и МОЖЕТ информировать хост-среду о превышении таких ограничений.
В некоторых случаях процессоры синтеза МАЙ выбрать игнорирование данной просодической разметки, если процессор определяет, например, что указанное значение является избыточным, неправильным или ошибочным. В частности, синтетические речевые системы каскадного типа, в которых используются большие акустические единицы, отбрасывают модифицирующие просодию элементы разметки, если они являются избыточными по отношению к просодии данной акустической единицы (единиц) или иначе приводят к ухудшению качества речи.
3.3 Другие элементы
3.3.1 Аудио Элемент
Элемент audio поддерживает вставку записанных аудиофайлов (см. Приложение A для форматов REQUIRED ) и вставку других аудиоформатов в сочетании с выводом синтезированной речи. Аудиоэлемент МОЖЕТ быть пустым. Если элемент audio не пуст, то содержимое должно быть размеченным текстом, который будет произнесен, если аудиодокумент недоступен. Альтернативное содержимое МАЯ включает в себя текст, речевую разметку, элементы desc или другие аудиоэлементы. Альтернативный контент МОЖЕТ также использоваться при рендеринге документа для неслышимого вывода и для доступности (см. элемент desc). В дополнение к НЕОБЯЗАТЕЛЬНЫМ атрибутам , описанным в подразделах ниже, аудио имеет следующие атрибуты:
Имя
Обязательно
Тип
Значение по умолчанию
Описание
источник
ложь
URI
Нет
URI документа с соответствующим типом носителя. Если элемент audio отсутствует, он ведет себя так, как будто присутствует src с допустимым URI, но документ не может быть извлечен.
тайм-аут выборки
ложь
Обозначение времени
В зависимости от процессора
Время ожидания выборки.
fetchhint
ложь
Значение «предварительная выборка» или значение «безопасный»
предварительная выборка
Сообщает процессору синтеза, может ли он попытаться оптимизировать визуализацию путем предварительной выборки звука. Это значение позволяет с уверенностью сказать, что аудио извлекается только тогда, когда оно необходимо, а не раньше; или предварительная выборка, чтобы разрешить, но не требовать от процессора предварительной выборки звука.
максидж
ложь
xsd: nonNegativeInteger
Нет
Указывает, что документ готов использовать содержимое, возраст которого не превышает указанного времени (см. «max-age» в HTTP 1.1 [RFC2616]). Документ не хочет использовать устаревшее содержимое, если также не указано maxstale .
Максстейл
ложь
xsd: nonNegativeInteger
Нет
Указывает, что документ готов использовать содержимое, срок действия которого истек (см. «max-stale» в HTTP 1.1 [RFC2616]). Если maxstale присвоено значение, то документ готов принять содержимое, срок действия которого истек не более чем на указанный период времени.
Пожалуйста, произнесите свое имя после сигнала. <аудио src="beep.wav"/>
<аудио src="welcome.wav">
Добро пожаловать на голосовой портал.
аудио>
говорить>
Если указанный источник звука не воспроизводится, рендеринг альтернативного содержимого
Кроме того, если процессор может определить, что требуется только текстовый вывод, он МОЖЕТ отобразить альтернативное содержимое
При попытке воспроизвести источник звука возникает ряд различных проблем. могут возникнуть, например, несоответствие типов носителей или неверная информация заголовка
о СМИ. Как правило, процессор синтеза делает все возможное, чтобы воспроизвести указанный носитель, а в случае неудачи процессор ДОЛЖЕН играть
альтернативный контент. Обратите внимание, что процессор НЕ ДОЛЖЕН отображать все
или часть упомянутых СМИ и все или часть упомянутых
альтернативное содержание. Если какой-либо из упомянутых носителей обрабатывается и
отображается, то воспроизведение считается успешным в течение
контекст этого раздела. Если возникает ошибка, вызывающая
альтернативный контент, который будет отображаться вместо упомянутого медиа
процессор ДОЛЖЕН уведомить хост-среду о том, что такая ошибка
произошел. Процессор МАЙ уведомить среду размещения
немедленно с асинхронным событием, или процессор МОЖЕТ уведомить
среду размещения только в конце воспроизведения, когда она сигнализирует
среда размещения, которая завершила обработку запроса, или процессор МОЖЕТ сделать уведомление об ошибке посредством регистрации
система. Процессор ДОЛЖЕН включать информацию об ошибке
где возможно; например, если медиа-ресурс не может быть получен
из-за ошибки http 404 этот код ошибки может быть включен в
уведомление.
Элемент audio может содержать только текст для рендеринга и следующие элементы: audio, break, desc, выделение, lang, lookup, mark, p, phoneme, prosody, say-as, sub, s, token, voice, w.
3.3.1.1 Атрибуты обрезки
Атрибуты обрезки определяют диапазон аудио, который будет
предоставлено. Как начало, так и конец промежутка в аудиосодержимом можно указать с помощью временных смещений. Продолжительность интервала, включая повторения, также можно указать с помощью атрибутов повторения. Поддержка процессором синтеза этих атрибутов равна 9.1207 ТРЕБУЕТСЯ в Расширенном профиле.
Для аудио определены следующие атрибуты обрезки:
Имя
Обязательно
Тип
Значение по умолчанию
Описание
clipBegin
ложь
Обозначение времени
0 с
смещение от начала мультимедиа до начала рендеринга. Это смещение
измеряется в нормальном времени воспроизведения мультимедиа с начала
СМИ.
клипконец
ложь
Обозначение времени
Нет
смещение от начала мультимедиа до конца рендеринга. Это смещение
измеряется в нормальном времени воспроизведения мультимедиа с начала
СМИ.
число повторений
ложь
положительный реальный номер
1
число итераций медиа для рендеринга. Дробное значение описывает часть визуализируемого мультимедиа.
повторение Дюр.
ложь
Обозначение времени
Нет
общая продолжительность для повторного рендеринга мультимедиа. Эта продолжительность измеряется в нормальном времени воспроизведения мультимедиа с начала мультимедиа.
Расчет продолжительности визуализации и взаимодействие с другими временными параметрами
свойства следуют за SMIL Вычисление активной продолжительности, где
аудио — контейнер времени
Значения обозначения времени для clipBegin , clipEnd и repeatDur являются подмножеством SMIL Clock-value
Если длина аудиоклипа заранее неизвестна, то он считается неопределенным. Следовательно, RepeatCount не будет иметь никакого эффекта.
Если clipEnd находится после окончания аудио, то рендеринг заканчивается в конце аудио.
Если clipBegin находится после clipEnd , звук воспроизводиться не будет.
RepeatDur имеет приоритет над RepeatCount при определении общего времени рендеринга мультимедиа.
Обратите внимание, что не все функции синхронизации SMIL поддерживаются.
Реальные числа
Вещественные и целые числа указываются только в десятичной системе счисления.
Целое число состоит из одной или нескольких цифр от «0» до «9».
Вещественное число может быть целым числом или состоять из нуля или более цифр, за которыми следует точка (.), за которой следует одна или несколько цифр. И целым, и действительным числам может предшествовать «-» или «+» для обозначения знака.
Обозначение времени
Обозначения времени состоят из неотрицательного действительного числа, за которым следует идентификатор единицы времени. Идентификаторы единиц времени:
Обратите внимание, что если продолжительность «radio.wav» меньше 20 секунд, значение clipEnd игнорируется, а конец рендеринга устанавливается равным фактическому концу носителя.
В следующем примере продолжительность звука ограничена RepeatCount :
говорить>
Будет воспроизводиться только первая половина клипа; активная продолжительность будет 1,5 секунды.
В следующем примере звук будет повторяться в общей сложности 7 секунд. Он будет воспроизводиться полностью два раза, а затем дробная часть продолжительностью 2 секунды. Это эквивалентно RepeatCount , равному 2,8.
говорить>
В следующем примере активная продолжительность звука будет 4 секунды. Воспроизведение начнется с 1 секунды в аудио (как указано значением clipBegin ), а затем будет воспроизводиться в течение 1 секунды (поскольку clipEnd указано как 2 секунды), а затем этот интервал будет повторяться, так что общая продолжительность равна 4 секунд (как указано repeatDur ). Обратите внимание, что значение RepeatDur имеет приоритет над значением RepeatCount .
говорить>
Эти атрибуты могут взаимодействовать с визуализацией, заданной атрибутами обрезки речи:
Начальная метка и конечная метка позволяют воспроизводить только клип «15second_music.mp3». Фактическая продолжительность звука составляет 5 секунд: клип начинается через 2 секунды после начала звука и заканчивается через 7 секунд, следовательно, продолжительность составляет 5 секунд.
секунды.
3.3.1.2
уровень звука Атрибут
Атрибут soundLevel указывает относительную громкость упомянутого звука. Он вдохновлен одноименным атрибутом в SMIL [SMIL3]. Поддержка процессором синтеза этого атрибута равна 9.1207 ТРЕБУЕТСЯ в Расширенном профиле.
Имя
Обязательно
Тип
Значение по умолчанию
Описание
уровень звука
ложь
Номера CSS2 со знаком («+» или «-«), за которыми сразу следует «dB»
Значение по умолчанию +0,0 дБ.
Значения в децибелах интерпретируются как отношение квадратов новой амплитуды сигнала ( 1 ) и амплитуда тока (a 0 ) и определяются в дБ: soundLevel (дБ) = 20 log 10 (a 1 ∕ a 0 9). Установка большого отрицательного значения эффективно воспроизводит медиа без звука. Значение «-6,0 дБ» будет воспроизводить медиаданные примерно с половиной амплитуды текущей амплитуды сигнала. Точно так же значение «+6,0 дБ» будет воспроизводить медиаданные с амплитудой, примерно вдвое превышающей амплитуду текущего сигнала (с учетом аппаратных ограничений). Абсолютный уровень звука воспринимаемого медиа также зависит от системных настроек громкости, которыми нельзя управлять с помощью этого атрибута.
Вот пример использования атрибута soundLevel :
<говорить версия="1.1"
xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www. w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез-расширенный.xsd"
xml:lang="en-US">
Это исходная, неизмененная форма сигнала:
<аудио источник="сообщение.wav"/>
Это тот же звук, амплитуда сигнала примерно в два раза выше:
Это тот же звук примерно с половинной амплитудой исходного сигнала:
говорить>
3.3.1.3
скорость Атрибут
Атрибут speed управляет скоростью воспроизведения упомянутого звука, чтобы ускорить или замедлить эффективную скорость воспроизведения относительно исходной скорости сигнала. Значение аргумента не определяет абсолютную скорость воспроизведения, а относится к скорости воспроизведения исходного сигнала. Процессор синтеза поддерживает этот атрибут , НЕОБХОДИМЫЙ в расширенном профиле.
Имя
Обязательно
Тип
Значение по умолчанию
Описание
скорость
ложь
x% (где x — положительное действительное значение)
Значение по умолчанию — 100 %, что соответствует скорости немодифицированного звукового сигнала.
Скорость воспроизведения упомянутого звука относительно исходной скорости. : Скорость задана в процентах от скорости исходного сигнала.
Изменение значения атрибута speed изменит скорость воспроизведения записанных сэмплов. Обратите внимание, что это повлияет на высоту тона.
Вот пример использования атрибута скорости :
<говорить версия="1.1"
xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www. w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез-расширенный.xsd"
xml:lang="en-US">
Это исходная, неизмененная форма сигнала:
<аудио источник="сообщение.wav"/>
Это тот же звук с удвоенной скоростью:
<звуковая скорость="200%" src="message.wav"/>
Это то же самое аудио со скоростью, вдвое меньшей исходной:
<звуковая скорость="50%" src="message.wav"/>
говорить>
3.3.2 знак Элемент
Элемент метки — это пустой элемент, который помещает маркер в последовательность текста/тегов. Он имеет один атрибут REQUIRED , name , который имеет тип xsd:token [SCHEMA2 §3.3.2]. Элемент mark можно использовать для ссылки на определенное место в последовательности текста/тегов, а также для вставки маркера в выходной поток для асинхронного уведомления. При обработке элемента метки процессор синтеза ДОЛЖЕН выполнить одно или оба из следующих действий:
сообщить среде размещения значение атрибута name и информацию, позволяющую платформе получить соответствующую позицию в отображаемом выводе.
, когда аудиовыход документа SSML достигает отметки, выдается событие, включающее атрибут REQUIRED name элемента. Среда размещения определяет назначение мероприятия.
Элемент mark не влияет на процесс вывода речи.
Переходите от здесь к там!
говорить>
3.3.3 desc Элемент
Элемент desc может встречаться только в содержимом элемента audio. Когда источник звука, указанный в аудио, не является речью, например. звуковые обои или звуковые знаки препинания, они должны содержать элемент desc, текстовое содержание которого представляет собой описание источника звука (например, «хлопанье дверью»). Если процессор синтеза производит только текстовый вывод, содержимое элемента(ов) desc СЛЕДУЕТ воспроизводиться вместо другого альтернативного содержимого в аудио. НЕОБЯЗАТЕЛЬНЫЙ Атрибут xml:lang может использоваться для указания того, что содержимое элемента находится на языке, отличном от языка содержимого, окружающего элемент. Атрибут ДОПОЛНИТЕЛЬНО onlangfailure можно использовать для указания желаемого поведения при сбое речи.
Главы государств часто допускают ошибки, говоря на иностранном языке.
Одним из самых известных примеров является пример Джона Ф. Кеннеди:
Элемент desc может содержать только описательный текст.
4. Каталожные номера
4.
1 Нормативные ссылки
[BCP47]
Теги для идентификации языков и Сопоставление языковых тегов , А. Филлипс и М. Дэвис, редакторы. IETF, сентябрь 2009 г. Доступно по адресу http://www.rfc-editor.org/bcp/bcp47.txt.
[CSS2]
Каскадные таблицы стилей, уровень 2: спецификация CSS2 , Б. Бос и др., редакторы. Консорциум World Wide Web, 12 мая 19 г.98. Эта версия Рекомендации CSS2 находится по адресу http://www.w3.org/TR/1998/REC-CSS2-19980512/. Последняя версия CSS2 доступна по адресу http://www.w3.org/TR/CSS2/.
Обратите внимание, что эта ссылка может быть изменена, когда
Речевой модуль CSS3
становится рекомендацией W3C.
[ИПАНДБК]
Справочник Международной фонетической ассоциации , Международная фонетическая ассоциация, редакторы. Издательство Кембриджского университета, июль 1999 г. Информация о Руководстве доступна по адресу: http://www.langsci.ucl.ac.uk/ipa/handbook. html.
[ПОЖАЛУЙСТА]
Спецификация лексикона произношения (PLS), версия 1.0 , П. Баггиа, редактор. Консорциум World Wide Web, 14 октября 2008 г. Эта версия Рекомендации PLS находится по адресу http://www.w3.org/TR/2008/REC-pronunciation-lexicon-20081014/. Последняя версия PLS доступна по адресу http://www.w3.org/TR/pronunciation-lexicon/.
[RFC1521]
MIME (многоцелевые расширения почты Интернета), часть первая: механизмы определения и описания формата тел сообщений Интернета , Н. Боренштейн и Н. Фрид, редакторы. IETF, сентябрь 1993 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc1521.txt.
[RFC2045]
Многоцелевые расширения почты Интернета (MIME), часть первая: формат тел сообщений Интернета. , Н. Фрид и Н. Боренштейн, редакторы. IETF, ноябрь 1996 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc2045.txt.
[RFC2046]
Многоцелевые расширения почты Интернета (MIME), часть вторая: типы носителей , Н. Фрид и Н. Боренштейн, редакторы. IETF, ноябрь 1996 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc2046.txt.
[RFC2119]
Ключевые слова для использования в RFC для указания уровней требований , С. Браднер, редактор. IETF, март 1997 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc2119.txt.
[RFC3986]
Унифицированный идентификатор ресурса (URI): общий синтаксис , T. Berners-Lee et al., Editors. IETF, январь 2005 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc39.86.текст.
[RFC3987]
Интернационализированные идентификаторы ресурсов (IRI) , M. Duerst и M. Suignard, Editors. IETF, январь 2005 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc3987.txt.
[RFC4267]
Типы носителей W3C Speech Interface Framework: application/voicexml+xml, application/ssml+xml, application/srgs, application/srgs+xml, application/ccxml+xml и application/pls+xml , M. Froumentin, Редактор. IETF, ноябрь 2005 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc4267.txt.
[СХЕМА1]
XML Schema Part 1: Structures Second Edition , H. S. Thompson, et al., Editors. Консорциум World Wide Web, 28 октября 2004 г. Эта версия рекомендации XML Schema Part 1 находится по адресу http://www.w3.org/TR/2004/REC-xmlschema-1-20041028/. Последняя версия XML-схемы 1 доступна по адресу http://www.w3.org/TR/xmlschema-1/.
[СХЕМА2]
XML-схема, часть 2: типы данных, второе издание , P.V. Бирон и А. Малхотра, редакторы. Консорциум World Wide Web, 28 октября 2004 г. Настоящая версия Рекомендации по XML-схеме, Часть 2, находится по адресу http://www.w3.org/TR/2004/REC-xmlschema-2-20041028/. Последняя версия XML-схемы 2 доступна по адресу http://www.w3.org/TR/xmlschema-2/.
[СМИЛ3]
Синхронизированный язык интеграции мультимедиа (SMIL 3.0) , Д. Балтерман и др., редакторы. Консорциум World Wide Web, 1 декабря 2008 г. Эта версия Рекомендации SMIL 3 находится по адресу http://www.w3.org/TR/2008/REC-SMIL3-20081201/. Последняя версия SMIL3 доступна по адресу http://www.w3.org/TR/SMIL3/. Этот документ находится в стадии разработки.
[ТИПЫ]
Типы носителей MIME , IANA. Этот постоянно обновляемый список типов мультимедиа, зарегистрированных в IANA, доступен по адресу http://www.iana.org/assignments/media-types/index.html.
[XML 1.0]
Extensible Markup Language (XML) 1.0 (пятое издание) , T. Bray et al., Editors. Консорциум World Wide Web, 26 августа 2008 г. Эта версия Рекомендации XML 1.0 находится по адресу http://www.w3.org/TR/2008/REC-xml-20081126/. Последняя версия XML 1.0 доступна по адресу http://www.w3.org/TR/xml/.
[XML 1.1]
Extensible Markup Language (XML) 1.1 (Second Edition) , T. Bray et al., Editors. Консорциум World Wide Web, 16 августа 2006 г. Эта версия Рекомендации XML 1.1 находится по адресу http://www.w3.org/TR/2006/REC-xml11-20060816/. Последняя версия XML 1.1 доступна по адресу http://www.w3.org/TR/xml11/.
[XML-БАЗА]
База XML (второе издание) , Дж. Марш и Р. Тобин, редакторы. Консорциум World Wide Web, 28 января 2009 г. Эта версия рекомендации XML Base находится по адресу http://www.w3.org/TR/2009/REC-xmlbase-200
/. Последняя версия XML Base доступна по адресу http://www.w3.org/TR/xmlbase/.
[XML-ID]
xml:id Version 1.0 , J. Marsh et al., Editors. Консорциум World Wide Web, 9 сентября 2005 г. Эта версия рекомендации xml:id находится по адресу http://www.w3.org/TR/2005/REC-xml-id-200509.09/. Последняя версия xml:id доступна по адресу http://www.w3.org/TR/xml-id/.
[XMLNS 1.0]
Пространства имен в XML 1.0 (третье издание) , Т. Брей и др., редакторы. Консорциум World Wide Web, 8 декабря 2009 г. Эта версия Рекомендации XML Namespaces 1. 0 находится по адресу http://www.w3.org/TR/2009/REC-xml-names-200/. Последняя версия XML Namespaces 1.0 доступна по адресу http://www.w3.org/TR/REC-xml-names/.
[XMLNS 1.1]
Пространства имен в XML 1.1 (Второе издание) , T. Bray et al., Editors. Консорциум World Wide Web, 16 августа 2006 г. Эта версия Рекомендации XML Namespaces 1.1 находится по адресу http://www.w3.org/TR/2006/REC-xml-names11-20060816/. Последняя версия XML Namespaces 1.1 доступна по адресу http://www.w3.org/TR/xml-names11/.
4.2 Информативные ссылки
[постоянный ток]
Инициатива по метаданным Dublin Core. См. http://dublincore.org/
[HTML]
Спецификация HTML 4.01 , D. Raggett et al., Editors. Консорциум World Wide Web, 24 декабря 1999 г. Эта версия Рекомендации HTML 4 находится по адресу http://www.w3.org/TR/1999/REC-html401-199/. Последняя версия HTML 4 доступна по адресу http://www. w3.org/TR/html4/.
[ИПС]
Международная фонетическая ассоциация . См. http://www.langsci.ucl.ac.uk/ipa/ для веб-сайта организации.
[IPAUNICODE1]
Международный фонетический алфавит , Дж. Эслинг. Эта таблица символов IPA в Unicode доступна по адресу http://web.uvic.ca/ling/resources/ipa/charts/unicode_ipa-chart.htm.
[IPAUNICODE2]
Международный фонетический алфавит в Юникоде , Дж. Уэллс. Эта таблица значений Unicode для символов IPA доступна по адресу http://www.phon.ucl.ac.uk/home/wells/ipa-unicode.htm.
[ДЖЕЙДААЛФАВИТ]
JEIDA-62-2000 Алфавит фонем . ДЖЕЙТА. Резюме этого документа (на японском языке) доступно по адресу http://it.jeita.or.jp/document/publica/standard/summary/JEIDA-62-2000.pdf.
[ДЖЕЙТА]
Японская ассоциация производителей электроники и информационных технологий . См. http://www.jeita.or.jp/.
Требования к разметке Pronunciation Lexicon , P. Baggia и F. Scahill, Editors. Консорциум всемирной паутины, 29Октябрь 2004 г. Этот документ находится в стадии разработки. Эта версия требований Lexicon находится по адресу http://www.w3.org/TR/2004/WD-lexicon-reqs-20041029/. Последняя версия требований Lexicon доступна по адресу http://www.w3.org/TR/lexicon-reqs/.
[РДФ]
RDF Primer , F. Manola and E. Miller, Editors. Консорциум World Wide Web, 10 февраля 2004 г. Эта версия RDF Primer Рекомендации находится по адресу http://www.w3.org/TR/2004/REC-rdf-primer-20040210/. Последняя версия RDF Primer доступна по адресу http://www.w3.org/TR/rdf-primer/.
[RDF-XMLSYNTAX]
Спецификация синтаксиса RDF/XML , Д. Беккет, редактор. Консорциум World Wide Web, 10 февраля 2004 г. Эта версия Рекомендации по синтаксису RDF/XML находится по адресу http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/. Последняя версия синтаксиса RDF XML доступна по адресу http://www.w3.org/TR/rdf-syntax-grammar/.
[RDF-СХЕМА]
Словарь описания RDF 1.0: Схема RDF , Д. Брикли и Р. Гуха, редакторы. Консорциум World Wide Web, 10 февраля 2004 г. Эта версия Рекомендации схемы RDF находится по адресу http://www.w3.org/TR/2004/REC-rdf-schema-20040210/. Последняя версия схемы RDF доступна по адресу http://www.w3.org/TR/rdf-schema/.
[ЗАПРОСЫ]
Требования к разметке синтеза речи для языков голосовой разметки , А. Хант, редактор. Консорциум World Wide Web, 23 декабря 1999 г. Работа над этим документом еще не завершена. Эта версия требований к синтезу находится по адресу http://www.w3.org/TR/1999/WD-voice-tts-reqs-199
/. Последняя версия требований к синтезу доступна по адресу http://www.w3.org/TR/voice-tts-reqs/.
[REQS11]
Speech Synthesis Markup Language Version 1.1 Требования , Д. Бернетт и З. Шуан, редакторы. Консорциум World Wide Web, 11 июня 2007 г. Работа над этим документом еще не завершена. Эта версия требований SSML 1.1 находится по адресу http://www.w3.org/TR/2007/WD-ssml11reqs-20070611/. Последняя версия требований SSML 1.1 доступна по адресу http://www.w3.org/TR/ssml11reqs/.
[RFC2616]
Протокол передачи гипертекста — HTTP/1.1 , Р. Филдинг и др., редакторы. IETF, июнь 1999 г. Этот RFC доступен по адресу http://www.ietf.org/rfc/rfc2616.txt.
[RFC2732]
Формат буквальных IPv6-адресов в URL-адресах , Р. Хинден и др., редакторы. IETF, декабрь 1999 г. Этот RFC доступен по адресу http://www. ietf.org/rfc/rfc2732.txt.
[РУБИН]
Рубин Аннотация ,
Марчин Савицки и др., Редакторы. Консорциум World Wide Web, 31 мая 2001 г. Эта версия Рекомендации Ruby
http://www.w3.org/TR/2001/REC-ruby-20010531/.
Последняя версия доступна на http://www.w3.org/TR/ruby/.
[СОБОЛЬ]
«SABLE: стандарт разметки TTS», Ричард Спроат и др. Материалы Международной конференции по обработке разговорной речи , Р. Маннелл и Дж. Роберт-Рибес, редакторы. Causal Productions Pty Ltd (Аделаида), 1998. Vol. 5, стр. 1719-1722. С материалами конференции можно ознакомиться у издателя на сайте http://www.causalproductions.com/.
[SSML]
Язык разметки синтеза речи (SSML), версия 1.0 ,
Дэниел С. Бернетт и др., Редакторы. Консорциум World Wide Web, 7 сентября 2004 г. Эта версия Рекомендации SSML 1.0
http://www.w3.org/TR/2004/REC-speech- Synthetic-20040907/.
Последняя версия доступна по адресу http://www.w3.org/TR/speech- synthetic/.
[ЮНИКОД]
Стандарт Unicode . Консорциум Юникод. Информацию о стандарте Unicode и его версиях можно найти по адресу http://www.unicode.org/standard/standard.html.
[ВЕБ-АРКА]
Архитектура всемирной паутины, первая версия , И. Джейкобс, Н. Уолш, редакторы. Консорциум World Wide Web, 15 декабря 2004 г. Эта версия архитектуры WWW находится по адресу http://www.w3.org/TR/2004/REC-webarch-20041215/. Последняя версия архитектуры WWW доступна по адресу http://www.w3.org/TR/webarch/.
[VXML]
Расширяемый язык разметки голоса (VoiceXML), версия 2.0 , S. McGlashan, et al., Editors. Консорциум World Wide Web, 16 марта 2004 г. Эта версия Рекомендации VoiceXML 2.0 находится по адресу http://www.w3.org/TR/2004/REC-voicexml20-20040316/. Последняя версия VoiceXML 2 доступна по адресу http://www.w3.org/TR/voicexml20/.
[ВС]
Протокол , Семинар W3C по интернационализации языка разметки синтеза речи, 2–3 ноября 2005 г. Повестка дня и протокол доступны по адресу
http://www.w3.org/2005/08/SSML/ssml-workshop-agenda.html.
[WS2]
Протокол , Семинар W3C по интернационализации языка разметки синтеза речи, 30–31 мая 2006 г. Программа доступна на http://www.w3.org/2006/02/SSML/agenda.html. Протоколы доступны по адресу
http://www.w3.org/2006/02/SSML/minutes.html.
[WS3]
Протокол , Семинар W3C по интернационализации языка разметки синтеза речи, 13-14 января 2007 г. Программа доступна на http://www.w3.org/2006/10/SSML/agenda.html. Протоколы доступны по адресу
http://www.w3.org/2006/10/SSML/minutes.html.
5. Благодарности
Этот документ был написан при участии следующих участников рабочей группы W3C Voice Browser и других рабочих групп W3C (перечислены в алфавитном порядке фамилий) :
芦村 和幸 (Казуюки Ашимура), W3C Max Froumentin, W3C (на момент участия) 黄力行 (Lixing Huang), Китайская академия наук (на момент участия) участия) 今竹 渉 (Ватару Иматакэ), приглашенный эксперт Ричард Исида, W3C Джим Ларсон, приглашенный эксперт (бывший сотрудник Intervoice) Вай-Кит Ло, Китайский университет Гонконга (на момент участия) Марк Уолкер, Intel (на момент участия)
Редакторы также хотели бы поблагодарить членов Рабочей группы W3C по интернационализации, которые внесли существенный вклад в SSML 1. 0 и 1.1.
Это приложение является нормативным.
SSML требует, чтобы платформа поддерживала воспроизведение аудиоформатов, указанных ниже.
Тип мультимедиа «аудио/базовый» обычно используется с форматом заголовка «au», а также с 8-битным 8-битным форматом 8 кГц без заголовка. Если этот тип носителя указан для воспроизведения, ДОЛЖЕН использоваться формат mu-law . Для воспроизведения с типом носителя «аудио/базовый» процессоры ДОЛЖЕН поддерживать формат mu-law, а МОЖЕТ поддерживать формат au.
Приложение B: Интернационализация
Это приложение является нормативным.
SSML является приложением XML [XML 1.0 или XML 1.1] и поэтому поддерживает [UNICODE], который определяет стандартный универсальный набор символов.
SSML предоставляет механизм управления разговорным языком с помощью атрибута xml:lang . Языковые изменения могут происходить так же часто, как и токен (слово), хотя чрезмерные языковые изменения могут снизить качество выходного звука. SSML также обеспечивает более точный контроль над выходным произношением с помощью элементов лексики и фонемы, функции, которые могут помочь смягчить некачественные словари по умолчанию для языков с минимальной коммерческой поддержкой сегодня.
Приложение C. Типы носителей и файловые суффиксы
Это приложение является нормативным.
Тип носителя, связанный со спецификацией языка разметки синтеза речи, — «application/ssml+xml», а суффикс имени файла — «.ssml», как определено в [RFC4267].
Приложение D: Схема для языка разметки синтеза речи
Это приложение является нормативным.
Схема синтеза для основного профиля (раздел 2.2.5) находится по адресу http://www.w3.org/TR/speech- Synthetic11/ Synthetic.xsd, а схема для расширенного профиля (раздел 2.2. 5) находится по адресу http://www. w3.org/TR/speech- Synthetic11/ Synthetic-Extended.xsd.
Примечание. Схемы синтеза включают схемы без пространства имен для основного и расширенного профилей, расположенные соответственно по адресу http://www.w3.org/TR/speech- Synthese11/ Synthese-nonamespace.xsd и http://www.w3. .org/TR/speech- Synthesis11/ Synthetic-nonamespace-extended.xsd, который МАЯ можно использовать в качестве основы для определения фрагментов языка разметки синтеза речи (раздел 2.2.1), встроенных в схемы пространства имен, не являющиеся синтезом.
Также для стабильности РЕКОМЕНДУЕТСЯ использовать следующие датированные URI для вышеуказанных файлов схемы:
http://www.w3.org/TR/2010/REC-speech- Synthetic11-20100907/ Synthetic.xsd
(для http://www.w3.org/TR/speech- Synthetic11/ Synthetic.xsd)
http://www.w3.org/TR/2010/REC-speech- Synthetic11-20100907/ Synthetic-extended.xsd
(для http://www. w3.org/TR/speech- Synthetic11/ Synthetic-Extended.xsd)
http://www.w3.org/TR/2010/REC-speech- Synthetic11-20100907/ Synthese-nonamespace.xsd
(для http://www.w3.org/TR/speech- Synthetic11/ Synthese-nonamespace.xsd)
http://www.w3.org/TR/2010/REC-speech- Synthetic11-20100907/ Synthese-nonamespace-extended.xsd
(для http://www.w3.org/TR/speech- Synthetic11/ Synthetic-nonamespace-extended.xsd)
Это приложение является информативным.
Ниже приведен пример чтения заголовков сообщений электронной почты. Элементы p и s используются для обозначения структуры текста. Элемент паузы помещается перед временем и помечает время как важную информацию, на которую слушатель должен обратить внимание. Элемент просодии используется для замедления темпа речи в теме электронного письма, чтобы у пользователя было дополнительное время для прослушивания и записи деталей.
<говорить версия="1.1"
xmlns="http://www. w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
<р>
У вас есть 4 новых сообщения.Первое письмо пришло от Стефани Уильямс в 15:45.
<с>
Тема: <просодия rate="-20%">лыжная прогулкапросодия>
говорить>
В следующем примере аудиофайлы и различные голосовые сообщения объединяются для предоставления информации о музыкальной коллекции.
<говорить версия="1.1"
xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
<р>
<голосовой пол="мужской">
Сегодня мы анонсируем новейшую романтическую музыку из Example.Узнайте, что говорится в обзорах программного обеспечения о новейшем хите Example.
голос>
<р>
<голосовой пол="женский">
Он поет о проблемах, которые касаются всех нас.
голос>
<р>
<голосовой пол="мужской">
Вот пример.
Хотите купить?
голос>
говорить>
Часто бывает так, что автор хочет включить в приложение фрагмент иностранного текста (скажем, название фильма) без необходимости переключения языков (например, с помощью элемента lang). Здесь показан простой способ сделать это. В этом примере процессор синтеза будет отображать название фильма, используя правила произношения контейнерного языка (в данном случае «en-US»), аналогично тому, как читатель, не знающий иностранного языка, может попытаться прочитать (и произнести ) Это.
org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Название фильма:
"Жизнь и красота"
(Жизнь прекрасна),
режиссер Роберто Бениньи.
говорить>
При некоторой дополнительной работе качество вывода может быть значительно улучшено либо путем создания пользовательского произношения во внешнем лексиконе (см. Раздел 3.1.5), либо с помощью элемента фонемы, как показано в следующем примере.
Стоит отметить, что поддержка алфавита IPA является НЕОБЯЗАТЕЛЬНОЙ функцией и что фонемы для внешнего языка могут отображаться с некоторым приближением (подробности см. в Разделе 3.1.5). В следующем примере используются только фонемы, характерные для американского английского языка.
1" xmlns="http://www.w3.org/2001/10/синтез"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/10/синтез
http://www.w3.org/TR/речевой-синтез11/синтез.xsd"
xml:lang="en-US">
Название фильма:
<фонема алфавит="ипа"
ph="ˈlɑ ˈviːɾə ˈʔeɪ ˈbɛlə">
La vita и bella фонема>
(Жизнь прекрасна),
которым руководит
<фонема алфавит="ипа"
ph="ɹəˈbɛːɹɾoʊ bɛˈniːnji">
Роберто Бениньи
говорить>
Пример интеграции SMIL
Язык SMIL [SMIL3] — это язык управления мультимедиа на основе XML. Он особенно хорошо подходит для описания динамических мультимедийных приложений, включающих синтетический речевой вывод.
SMIL Пример 2: Изображение логотипа W3C появляется, затем нажатие на изображение приводит к его исчезновению и воспроизведению последовательности речи. Файл ‘greetings.smil’ содержит следующее:
Ниже приведен пример SSML в VoiceXML (см. Раздел 2.3.3) для приложений голосового браузера. Стоит отметить, что пространство имен VoiceXML включает в себя элементы и атрибуты пространства имен SSML. Подробности см. в Приложении O к [VXML].
<версия vxml="2.0" xmlns="http://www.w3.org/2001/vxml"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
xsi:schemaLocation="http://www.w3.org/2001/vxml
http://www.w3.org/TR/voicexml20/vxml.xsd">
<форма>
<блок>
<приглашение>
Добро пожаловать в Магазин кормов для птиц.
У нас есть 250-килограммовые бочки с семенами чертополоха для
29 долларов9,95
плюс доставка и обработка в этом месяце.
приглашение>
блок>
форма>
Приложение F: Изменения по сравнению с SSML 1.0
Это приложение является информативным.
В случае изменения документа, совместимого с SSML 1.0, для
процессор синтеза, поддерживающий только SSML 1. 1, авторы документа
сообщил следующее примечание о совместимости:
Элементы, совместимые с SSML 1.0, не требующие изменений для SSML 1.1
являются: , , , ,, , , и частично <просодия> (исключая атрибуты rate и volume)
Элементы с измененными атрибутами в SSML 1.1:
. Их синтаксис и семантика SSML 1.0 совместимы с SSML 1.1
.
Элементы с измененным синтаксисом и/или семантикой между SSML 1.0 и SSML 1.1: , и частично <просодия> (только атрибуты rate и volume)
Новые элементы в SSML 1.1: , и /
Ниже приведен сводный список всех изменений, начиная с SSML 1.0.
В версии 3.1.7 добавлен элемент для обозначения границ слова. Добавлен в качестве псевдонима для .
Добавлен атрибут роли в элемент , чтобы обеспечить более явную связь со словарями PLS.
В версии 3. 1.2 xml:lang определен для описания языка текстового содержимого и добавлен в новый элемент .
Добавлен атрибут xml:id (новый раздел после 3.1.3 xml:base) в элементы ,
, , и для улучшения внешних ссылок в содержимом SSML.
В лексикон версии 3.1.5 добавлен элемент для управления используемыми лексиконами. теперь только определяет, какие словари используются в документе.
Удален общий текст, описывающий, как текст может быть сопоставлен с записями в лексиконе.
Типом по умолчанию теперь является «application/pls+xml», как определено в спецификации PLS 1.0.
Введено понятие реестра алфавитов произношения, который будет поддерживать список зарегистрированных значений для атрибута алфавита элемента .
Удален атрибут xml:lang из элемента , чтобы избежать путаницы.
Добавлен элемент , позволяющий устанавливать xml:lang для произвольного текстового содержимого.
В описании <голоса> пояснено, что индикация языка и голоса независимы, процессор синтеза не требуется для поддержки всех их комбинаций, и процессоры должны документировать поведение для каждой их комбинации.
3.1.5: Теперь предписывается, что если ссылочный словарь является документом PLS, то информация в нем должна использоваться процессором.
3.1.5.2: разъяснено, что процессор уже имеет встроенные системные словари, значения которых переопределяются с помощью элементов и .
Весь документ обновлен для поддержки XML и XMLNS 1.1 в дополнение к 1.0. В определении URI уточнено, что IRI разрешены, и добавлена информативная ссылка на RFC39.87.
Полностью изменен способ выбора голоса и управления речью. В версии 3.2.1 добавлены атрибуты «languages», «required», «ordering» и «onvoicefailure», представлен новый алгоритм выбора голоса. Выбор голоса теперь ограничен. Добавлен новый атрибут onlangfailure (новый раздел 3. 1.13) для всех элементов, которые принимают атрибут xml:lang: , , ,
, , и .
Добавлены атрибуты обрезки для (раздел 3.1.1) для соответствия ожидаемым потребностям VoiceXML 3.
В версии 3.3.1 к добавлены атрибуты обрезки, soundLevel и скорости для удовлетворения ожидаемых потребностей VoiceXML 3. В 1.2 сделана ссылка на новые возможности элемента .
Пересмотрен текст ошибки в описании <аудио>, чтобы лучше объяснить соответствующее поведение уведомлений.
В версии 2.2.3 добавлен пример использования Ruby в SSML. Добавлена информативная ссылка на Ruby.
Многие экземпляры слова «слово» заменены на «токен», чтобы уточнить, когда спецификация относится к токенам; это особенно актуально при обсуждении синтаксического анализа и связи с лексиконами.
Добавлен текст в разделе состояния, объясняющий мотивацию и предысторию SSML 1.1. Также в раздел информативных ссылок добавлен документ с требованиями и семинары.
Применены стили к релевантным использованиям ключевых слов RFC2119.
В разделе состояния уточнено, что речь идет о естественных (человеческих) языках. В 3.1.2 поясняется, что xml:lang указывает язык *написанного* контента.
Перемещен абзац из 3.1.5 в 3.1.5.2, поясняющий, когда следует использовать информацию из словарного документа.
В 1.2 поясняется, что токены не могут охватывать элементы разметки, за исключением элементов и .
В версии 3.1.10 добавлен новый необязательный атрибут «тип» со значениями «по умолчанию» (по умолчанию) и «ruby».
Разделение на два профиля: основной и расширенный В раздел 2.2.4 добавлен текст, позволяющий изменять соответствие процессора, как указано в отдельных разделах (предназначен для поддержки вариантов профиля). В приложении D теперь есть четыре схемы: без пространства имен и обычные схемы для основного и расширенного профилей. Обновлены все примеры соответственно. Добавлен новый раздел 2.2.5, описывающий два профиля.
В версии 3.1.2 удален список элементов, которые «должны отображаться способом, соответствующим текущему языку», поскольку в нем больше нет необходимости.
В версии 1.2 к шагу 6 добавлен текст, поясняющий громкость/уровень звука по умолчанию, скорость/частоту и высоту/частоту для голосов и записей в документе.
Нумерация раздела 2.2.5 изменена на 2.2.6. Добавлен новый раздел 2.2.5, определяющий профили. Добавлены подразделы к 2.2.1, 2.2.2 и 2.2.4 для двух профилей. Обновлен соответствующий текст в 3.3.1.1, 3.3.1.2 и 3.3.1.4.
В версии 3.2.4 скорректировано определение «volume» <просодия>, чтобы оно лучше соответствовало новому определению атрибута «soundLevel» (теперь логарифмическое управление), а также отмечена потенциальная разница между поведением при использовании меток и поведением при использовании числовых значений. .
В 3.2.4 для атрибута «duration» изменена формулировка о содержащихся элементах, чтобы она соответствовала другим атрибутам («содержащийся текст»).
В версии 3.2.4 изменено определение неотрицательного процента, теперь оно представляет собой число без знака, за которым следует «%».
В версии 3.2.4 описание атрибута «скорость» обновлено для использования «неотрицательного процента» вместо «относительного значения».
В версии 3.3.1.2 ссылка на SMIL изменена на SMIL3 и добавлена SMIL3 в качестве нормативной ссылки в разделе ссылок.
В 3.1.5.1 (лексикон) и 3.3.1 (аудио) добавлены атрибуты maxage и maxstale.
В версии 2.1 поясняется, что если xsi:schemaLocation не задано, предполагается профиль Core.
В версии 3.2.1 добавлена ссылка на атрибут onlangfailure. Также добавлен раздел «Голосовое описание» и ссылки на него из описания атрибута «языки».
Все ссылки на RFC4647 изменены на «BCP 47, сопоставление языковых тегов». BCP47 теперь является нормативной ссылкой.
Удалена устаревшая ссылка на RFC3066.
В версии 3.1.2 добавлен текст, объясняющий взаимосвязь между xml:lang, onlangfailure и тем, как голос будет произносить текст.
В версии 3.3.1 «src» сделан необязательным и добавлены атрибуты «fetchhint» и «fetchtimeout» к элементу .
В версии 3.1.5.1 к элементу добавлен атрибут fetchtimeout. Также добавлен текст, поясняющий, что следует ожидать в случае сбоя при получении лексикона.
В версии 2.3 разъяснено, что атрибуты, отличные от SSML, также разрешены. Схема была обновлена, чтобы разрешить использование не-SSML-атрибутов во всех элементах SSML и не-SSML-элементов в качестве дочерних элементов всех SSML-элементов.
Удалено DTD (Приложение E), Приложение F (Пример SSML) переименовано в Приложение E, а Приложение G (Изменения по сравнению с SSML 1.0) переименовано в Приложение F.
Добавлена информативная ссылка на «Архитектура Всемирной паутины, том первый». Обновлено определение URI в разделе 1.5, чтобы ссылаться на него.
В версии 3.1.10 отмечено, что в строках IPA могут встречаться пробельные символы, которые не влияют на произношение.
Удален DOCTYPE из раздела 2 и всех примеров, поскольку больше нет DTD для ссылки.
Приложение G: Изменения по сравнению с последним проектом
Это приложение является информативным.
С момента публикации Предлагаемой рекомендации SSML 1.1
спецификации были внесены следующие незначительные редакционные изменения.
добавлено в проект в ответ на комментарии.
В разделе 4 обновлены URI сайтов IPA.
В Приложении D,
измененный URI расположения схемы
из
«http://www.w3.org/TR/2010/PR-речи-синтез11-20100223/»
к
«http://www.w3.org/TR/2010/REC-speech-synchronous11-20100907/».
В Приложении F,
добавлено примечание об обратной совместимости с SSML 1.0.
Исправлены ошибки в
схема без пространства имен
(синтез-nonamespace.xsd).
Как избавиться от индийского акцента и звучать более нейтрально/по-родному
Во-первых, поработав с большим количеством индийцев, пакистанцев и бангладешцев за последние несколько десятилетий, я могу сказать, что в целом у вас очень легкий акцент. Это наводит меня на мысль, что ваши собеседники либо лингвистически наивны (не разговаривали с очень многими носителями языка), либо преднамеренно упрямы (не желают прилагать никаких дополнительных усилий, чтобы понять, о чем вы говорите). Оставив это в стороне, я могу дать вам один большой намек на носителей американского языка: мы говорим с открытым ртом чаще, чем многие носители других языков. Менее снисходительное объяснение состоит в том, что это относится к громкому разговору и привлечению внимания к себе, но давайте не будем слишком отвлекаться. Давайте начнем с простого примера.
Во-первых, я взял на себя смелость расшифровать вашу запись для удобства. Я включаю его здесь:
Привет, ребята,
Прежде всего, спасибо, если вы слушаете это.
Меня зовут Симран, и причина, по которой я записываю этот звук, ммм… может, и глупая, но тем не менее.
Итак, я переехал в Канаду около девяти месяцев назад; и так, я довольно новый здесь.
И, по сути, я чувствовал, что мне приходится пару раз повторяться, когда я разговариваю с нашими коренными канадцами, европейцами или людьми из Штатов, потому что у меня есть немного индийского акцента, и это не помогает с гладкой связи.
Я имею в виду, это не весело, когда тебе приходится повторять себя снова и снова, так что, ммм… да.
Мне просто хотелось бы знать, что я могу изменить, чтобы звук звучал более родным или более понятным для носителей языка.
Ммм, да, это почти все; и я очень жду ваших ответов.
Спасибо.
Хотите верьте, хотите нет, но я могу определить ваш акцент в самой первой строке, когда вы говорите «Привет, ребята». Это очень тонко, но вы меняете дифтонг «aɪ» на «ai» в слове «парни». Чтобы понять звуковые различия между вашим (предположительно хинди/пенджабским) акцентом и типичным нейтральным американским акцентом (AmEng), нам нужно обратиться к некоторым лингвистам. Я не профессиональный лингвист, так что воспринимайте все, что я говорю, с долей скептицизма. Тем не менее, я чувствую, что могу объяснить некоторые ключевые различия всего несколькими концепциями, поэтому, пожалуйста, потерпите меня.
Дифтонги
Если я попытаюсь описать произношение «ребят» в очень точных терминах, то получится примерно так: «г-а-и-з». Фонема /а/ образуется при открытом рте, опущенном языке, неокругленных губах. Маленькая заглавная буква / ɪ / на самом деле представляет собой то, что мы называем коротким звуком i в английском языке («tin», «bin», «win»). В то время как / a / образуется с опущенной челюстью (чтобы рот был открыт), / ɪ / формируется с той же формой рта, но с большей частью закрытой челюстью. Теперь то, как вы произносите это, больше похоже на «г-а-э-э-з». Фонема /i/ — это то, что мы называем длинным звуком e в английском языке («сыр», «пчелы», «колени»). Почти в любом другом языке /i/ произносится как «ee», поэтому IPA использует его именно так. Поскольку «y», используемый в качестве гласного, обычно действует как / i /, естественно и логично произносить его как «ee», и даже американцы во многих случаях поступают так (все суффиксы «-ly»: «в широком смысле», « поспешно» и др.). Но американский английский, как известно, неестественен и нелогичен, поэтому мы также произносим его как /ɪ/ («идиллический») и /aɪ/ («летать», «тиран», «парень»).
Разница между /ɪ/ и /i/ довольно тонкая. Как вы можете видеть в разделе о гласных в справочнике IPA Викисловаря, /i/ является одним из самых «закрытых» гласных, что означает, что ваш рот в основном закрыт при его произнесении. Но / ɪ / чуть менее закрыто. Другое отличие состоит в том, что при произнесении /i/ края рта оттягиваются еще дальше (поэтому мы говорим «сыр», когда фотографируемся: фонема вызывает своего рода улыбку). «Противоположный» звук — /ɑ/ («отец», «ничто»), где рот широко открыт, и нет возможности оттянуть края рта назад, на самом деле.
Это явление повторяется, когда вы говорите: «Спасибо». Я бы расшифровал ваше произношение как «th-eh-ee-n-k», тогда как версия AmEng ближе к «th-eh-n-k». Итак, хотя я отчетливо слышу звук /æ/, он незаметно, но заметно переходит в /i/. Вы, вероятно, можете увидеть здесь начало тенденции: ваше произношение включает больше «закрытых» гласных по сравнению с версией AmEng. И это то, что я имел в виду, когда сказал: «мы больше разговариваем с открытым ртом». Я имел в виду это буквально! 😉
Не для того, чтобы бить дохлую лошадь, но единственное слово, которое я пропустил, когда слушал ваш образец, было «канадцы» в строке 5. Это звучало как «комедианты». Мне было любопытно, почему вы ругаете комиков вообще, пока я не понял, что вы говорите о канадцах. 😉 Опять же, мы можем назвать это дифтонгизацией /æ/ в /æi/. Это будет сложно, но если вы хотите звучать ближе к AmEng, вам нужно перестать превращать большинство гласных в /i/ и буквально оставить рот открытым. При произнесении «канадца» в зеркале второй слог должен изображать открытый рот. Я предполагаю, что ваша челюсть никогда не опускается, когда вы произносите это слово.
Открыть/Закрыть
Опять же, когда вы говорите: «Прежде всего», вы произносите «все» как «у-лл». Говорящие на AmEng слышат ту же гласную, что и в словах «дурак», «бассейн», «двойной», но ожидают услышать гласную, как в словах «торговый центр», «кукла», «звонок». И опять же, /ɑ/ — открытая гласная, а /u/ — закрытая (я бы расшифровал IPA для вашего произношения как /ul/, а AmEng — /ɑl/). Другим признаком того, что ваше произношение «все» нестандартно для AmEng, является то, что я предсказываю, что вы округляете губы, когда произносите это, в то время как говорящий на AmEng говорит с почти открытым ртом, до такой степени, что вы, вероятно, можете видеть прикосновение языка. задняя часть зубов при произнесении «л». Попробуйте сказать это перед зеркалом и посмотрите, насколько я близок.
Артикуляция звуков W и V
Как кто-то упомянул в комментариях, общий артефакт, который я заметил, — это переключение звуков «v» и «w». Самый известный такой пример — это, безусловно, Павел Чехов в «Звездном пути IV», когда его высмеяли за то, что он сказал «ядерный вессель». Вы произносили их стандартно, поэтому для вас это не проблема. Тем не менее, я замечаю это больше, когда слово начинается с «w» или «v», и особенно для менее часто используемых слов. Наверняка слова типа «когда» или «путь» вы слышите очень часто, а вот «победитель» или «варпинг» реже. Согласно этому источнику, один из моих пенджабских друзей часто произносит слово «лоза», говоря о «вине», скорее всего, из-за отсутствия отчетливых звуков «в» и «в» в пенджаби. Если вас просят повторить фразу, которая включает начальную букву «v» или «w», это может быть причиной (особенно если два слова идентичны, за исключением начальной буквы «v» или «w»). «Ты готов к лозе?» может означать: «Я слышал, что на сервисе Vine есть интересное видео» или: «Давай уже начнем счастливый час!». Требуется небольшой анализ контекста, чтобы понять, что есть что. Иногда он избегает путаницы, переходя на итальянский и называя его «вино», в котором нет двусмысленного партнера «w», и обыгрывает тот факт, что «лоза» и «вино» тесно связаны.
Вероятно, самое заметное грамматическое различие между индийским и американским английским языком заключается в использовании определителей («a», «the» и т. д.). Как отмечали другие, индийский английский имеет тенденцию опускать их в тех местах, где AmEng считает их обязательными. В строке 5, когда вы говорите: «…люди из Штатов…», большинство людей поймут, что вы имеете в виду. Но спикеры AmEng ожидают услышать: «… люди из [] Штатов …». Вероятно, нелегко заметить, когда вы сделали это, если только у вас нет приятеля, который постоянно указывает вам на это, чтобы помочь вам научиться.
Я думаю, что практика перед зеркалом и прослушивание произношения в Викисловаре помогут вам усвоить акцент AmEng. Это будет медленный процесс, потому что ваш мозг уже запрограммирован говорить так, как говорите вы. Но чем больше вы видите, как работает ваш язык во время разговора, тем ближе вы, вероятно, становитесь к AmEng. И если вы слышите меньше звука «и» при прослушивании своего голоса, вы, вероятно, тоже делаете успехи. Удачи!
Daily French Pod « Буквально мыслящий
Время от времени мне хочется освежить знания французского, которые я изучал в старшей школе и колледже. Около десяти лет назад я подписался на французскую версию Reader’s Digest на год. Много лет спустя я получил копию «Гарри Поттер и Кубок огня» на французском языке, и теперь я прочитал в ней почти до конца первую главу. Ах, кого я обманываю, используя настоящее совершенное время таким образом? Скажем честно: я прочитал почти до конца первой главы. О, и оглавление, где мне было интересно узнать, что французское слово для волшебная палочка это багет . Моя проблема, когда я читаю по-французски, заключается в том, что я постоянно колеблюсь между тем, чего хочу достичь. Хочу ли я читать только ради смысла, улавливая суть и пропуская слова, которые не могу понять из контекста? Или я хочу пополнить свой словарный запас, уделяя особое внимание именно этим словам? Только для самых коротких текстов можно попытаться выполнить обе цели, а у меня нет красивого, удобного набора коротких французских текстов.
Это не намек на рождественский подарок. Мне не нужен хороший, удобный набор коротких текстов на французском языке, потому что последние пару месяцев я слушал архивные выпуски Daily French Pod.com, «ваша ежедневная доза французского языка, на котором говорят носители языка». ». Эта ежедневная доза французского не предназначена для тех, кто только начинает изучать язык; для этого вы можете попробовать недавно открытый кофе-брейк по-французски от тех же людей, которые принесли вам кофе-брейк по-испански. Но если у вас есть немного французского, который вы хотите освежить и развить, эти подкасты продолжительностью от пяти до десяти минут избавят вас от необходимости выбирать между чтением (или, скорее, прослушиванием) для понимания и сосредоточением внимания на словарном запасе. Большинство из них начинаются с того, что ведущий Луи читает новость из трех-четырех предложений; темы включают науку, бизнес, политику и человеческие интересы. После этого первого чтения Луи просматривает предложения фраза за фразой, объясняя словарный запас, разбирая некоторые глаголы и иногда давая другие выражения, в которых используется данное слово. Большинство его объяснений на французском языке, но иногда он дает английский перевод слова в дополнение к французскому объяснению или вместо него. Наконец, Луи читает текст во второй раз, чтобы вы могли слушать для понимания, уже имея запас словарного запаса. Кроме того, не весь словарный запас, который вы изучаете, получен из чтения; некоторые взяты только из комментария Луи; например, я узнал, что à peu près означает «вот-вот», когда он говорил: «C’est à peu près tout for aujourd’hui» (На сегодня это все).
Краткость элементов позволяет попытаться выучить все новые слова в каждом из них, тем более что вам не нужно искать их самостоятельно. Разнообразие тем делает подкасты интересными, а также предоставляет разнообразную лексику, которая может возникнуть в обычном, содержательном разговоре. Их названия заставляют меня хотеть слушать, просто чтобы узнать, о чем они, независимо от языка. Например: «Он съел свои носки», «Он написал роман на своем мобильном телефоне», «Галапагосская акула в опасности», «Сесилия и ее кредитная карта», «Каннибализм», «Употребление марихуаны». На самом деле, если бы это не была смешанная метафора, я бы сказал, что слушаю их как конфетки.
Не все подкасты в этом формате. Некоторые более короткие состоят из уроков грамматики (например, повторение неправильных форм будущего времени). Другие — «видеословарь». Эти подкасты сопровождаются неподвижным изображением, например, завтрака «шведский стол», велосипеда, салона автомобиля или спортивного стадиона. Указатель перемещается по соответствующим частям изображения, пока Луи дает французские термины. Даже если вы слушаете подкаст в машине, а не смотрите его, пояснения обычно дают понять, о чем говорит Луи.
Помимо уроков грамматики и видео-лексики, есть также несколько более длинные эпизоды «Настоящего французского» и диктанты, которые мне не очень нравятся. Реальный французский состоит из диалогов, которые на самом деле не взяты из реальных разговоров носителей французского языка, хотя они кажутся довольно реалистичными и определенно произносятся намного быстрее, чем тщательно изложенные новостные сводки Луи. Луи проигрывает каждый диалог несколько раз, каждый раз прося слушателя ответить на несколько вопросов на понимание во время прослушивания. Диктант есть диктант. Я нахожу оба этих типа подкастов скучными и недавно удалил их все из своих подкастов DFP в iTunes.
В дополнение ко всем подкастам на веб-сайте DFP доступны другие учебные пособия и форум, но за подписку на них нужно платить, и до сих пор архивные подкасты были достаточно полезны для меня, поэтому я не не смотрел на подписку.
Помимо того факта, что вы можете слушать их, когда занимаетесь чем-то другим (чего нельзя сделать с французским текстом и словарем), еще одним преимуществом аудиоформата является то, что вы можете слышать, как Луи произносит слова. , что обнадеживает, даже если вы уверены, что знаете, как это сделать. Например, вспомнив свое правило «CRFL», я бы произнес tabac ‘табак’ как [табак], и даже не удосужился поискать; теперь я знаю, что финал c , на самом деле, молчит: [таба]. Для другого примера, хотя я могу сообразить, что fonctionnions (второе лицо множественного числа несовершенного слова «функционировать») следует произносить [fɔ̃ksjɔ̃njɔ̃], два [jɔ̃] в быстрой последовательности звучат настолько забавно, что я задаюсь вопросом, Я совершила бы ошибку, если бы не то, что Луи сам так сказал. Я также узнаю, что я действительно плохо представляю, где связь применима, а где нет. Я бы точно произнес les arbres ‘деревья’ как [lezaʁbʁə], в связной речи, произнося s в конце les , но я всегда думал, что если вы произносите слова отдельно в медленной речи, как Луи делает, объясняя текст, вы должны сказать [le], а затем [aʁbʁə], опуская s , как это типично для конечных согласных во французском языке. Неа. Когда Луи делает это, он говорит [le], а затем [zaʁbʁə]. Но, другими словами, Луи не выполняет связь. Услышав это, я побудил меня еще немного изучить этот процесс, чего бы я не хотел делать, читая про себя по-французски, вслух или про себя.
А для действительно фонетически настроенных, вы можете попытаться выяснить, когда именно Луи ставит последний глухой фрикативный звук в конце слова. Когда он произносит гласную переднего ряда среднего или высокого времени, он иногда заканчивается глухим небным фрикативом: Louis может быть [luwiç]; tu может быть [tyç]; mais может быть [meç]. Для высоких напряженных гласных заднего ряда, но не (насколько я слышал) среднего заднего ряда, происходит то же самое, но с глухим заднеязычным фрикативом вместо небного: tout может быть [смокинг]. Он не делает это все время; обычно это происходит, когда он произносит слова изолированно или в конце предложения, но даже в этом случае не всегда. Это был аспект французского произношения, о котором никто из моих учителей никогда не говорил мне, и я никогда не замечал, как они это делают. Является ли это просто идиосинкразией Людовика или это диалект французского языка? Если вы знаете, я жду от вас известий.
Нравится:
Нравится Загрузка…
Эта запись была опубликована 2 ноября 2007 г. в 00:27 и размещена в рубриках Изучение языков, Обзоры.
Вы можете следить за любыми ответами на эту запись через ленту RSS 2.0.
Вы можете оставить отзыв или вернуться со своего сайта.
Ввод штрих-кода — Zebra Technologies TechDocs
Обзор
Параметры ввода штрих-кода в профиле DataWedge определяют аппаратное обеспечение устройства, которое будет использоваться для сканирования, и декодеры, которые будут применяться к полученным данным перед их отправкой на обработку. Декодеры, поддерживаемые DataWedge, описаны ниже, включая часто используемые декодеры: Code39, Code128, Datamatrix, DotCode, EAN13, OCR A, OCR B, PDF417, QRCode, UPCA и UPCE. DataWedge также обеспечивает звуковую и другую обратную связь, чтобы предупредить пользователя о результатах сканирования и типе штрих-кода. Дополнительную информацию см. в разделе «Параметры сканера». .
Ввод штрих-кода используется для указания:
Камеры устройства
1D и 2D и имидж-сканеры
Лазерные сканеры штрих-кода
Сканеры с Bluetooth
USB-сканеры с синхронным последовательным интерфейсом (SSI)
Вход сканера штрих-кода считывает данные со встроенного сканера штрих-кода, встроенного в устройство, или подключенного через кабель или соединение Bluetooth, или выполненного в виде модуля Snap-on. DataWedge поддерживает лазеры, тепловизоры и внутренние камеры. Полученные необработанные данные штрих-кода обрабатываются или форматируются с использованием параметров обработки базового и расширенного форматирования данных, которые находятся рядом с параметрами вывода.
Параметры этой функции можно настроить с помощью API Set Config.
Выбор сканера
При вводе штрих-кода панель выбора сканера определяет, какое сканирующее устройство использовать для сбора данных. Список доступных сканеров основан на устройствах, присутствующих в конфигурируемом устройстве (или подключенных к нему).
Выбор сканера
Авто — это выбор сканера по умолчанию, который автоматически определяет наилучшее сканирующее устройство из списка доступных устройств на основе следующих правил автоматического выбора сканера:
Если установлен модуль сканирования Zebra или модуль сканирования/MSR, выбирается сканер 2D.
Если модуль сканирования не установлен, выбирается камера.
Когда выбрана камера, сканирование выполняется камерой заднего вида.
При выборе 2D Imager сканирование выполняется с использованием установленного модуля Scan или Scan/MSR.
Общий выбор сканера для Bluetooth-сканера Zebra и USB-сканера Zebra: Недавно выпущенные Bluetooth- или USB-сканеры Zebra поддерживаются автоматически (в режиме SSI), но названия конкретных моделей сканеров могут еще не отображаться в списке выбора сканера . В этом случае выбор либо Zebra Bluetooth Scanner , либо Zebra USB Scanner можно использовать в качестве общего варианта сканирования с каждого соответствующего периферийного устройства. Доступность указанной модели сканера зависит от сборки операционной системы (BSP) — см. матрицу функций для совместимости версий и портал поддержки Zebra для загрузки последней сборки.
USB-базы Zebra поддерживает сканеры Bluetooth, сопряженные/подключенные к его USB-базе, подключенной к базовой станции рабочей станции со вставленным устройством Android. Это позволяет сканеру Bluetooth сканировать данные на устройство Android, вставленное в базовую станцию рабочей станции.
Поддержка нескольких сканеров обеспечивает возможность взаимозаменяемого использования более одного сканера в одном профиле DataWedge без необходимости ручной настройки, например, когда требуется внутренний сканер и внешний Bluetooth-сканер. Кроме того, каждый сканер можно индивидуально настроить в рамках одного и того же профиля. Чтобы добавить сканер, в Экран выбора сканера коснитесь верхнего правого меню и выберите Добавить новый сканер. Отображается список доступных сканеров.
Добавить новый сканер
Выберите сканер для добавления из списка. Затем выбранный сканер добавляется в список выбора сканера . Выбранный сканер в списке
Если Выбор сканера устанавливается на Auto , все сканеры удаляются из списка.
Длительное нажатие на категорию сканера на экране Выбор сканера отображает меню с параметрами Настроить триггеры или Удалить. Нажмите на Настроить триггеры , чтобы отобразить список триггеров для настройки; параметры различаются в зависимости от используемого устройства.
Добавить новый сканер
Если выбраны внешний сканер и внутренний сканер (независимо от порядка добавления), внутренний сканер получает все триггеры по умолчанию. Пользователь должен выбрать триггеры для внешнего сканера по мере необходимости. Как только триггер или несколько триггеров назначаются внешнему сканеру, эти триггеры удаляются из внутреннего сканера. Если внешний сканер удаляется из списка сканеров, все триггеры снова передаются внутреннему сканеру. При попытке назначить триггер, который уже назначен другой категории сканера, отображается следующее сообщение:
Настройка предупреждения триггера
Примечание. Использование нескольких сканеров с несколькими учетными записями пользователей Android может привести к неожиданному поведению.
Сканеры Bluetooth SSI
DataWedge поддерживает следующие сканеры Zebra Bluetooth SSI:
DS2278 Сканер Bluetooth
DS3678 Сверхпрочный сканер
DS8178 Сканер Bluetooth
LI3678 Сверхпрочный лазерный сканер
RS507 Беспроводной сканер-кольцо
RS5100 Носимый сканер Bluetooth
RS6000 Кольцевой сканер
Сканеры Bluetooth поддерживаются в соответствии со следующими правилами:
Чтобы первоначально настроить RS507 в профиле, сканер должен быть сопряжен и подключен.
После первоначальной настройки в Профиле можно включить и отключить сканер Bluetooth, даже если он отключен от устройства. Однако для настройки декодеров, параметров считывателя и других настроек сканера необходимо подключить Bluetooth-сканер.
DataWedge не выполняет автоматическое повторное подключение к Bluetooth-сканеру, если этот сканер подключен, когда DataWedge использует другой автоматически выбранный сканер. Чтобы повторно включить сканер Bluetooth, подключите сканер и выберите его в профиле или повторно выберите вариант выбора «Авто».
Автоматический выбор и замена батареи — Если для выбора сканера установлено значение «Авто» и перед заменой батареи был включен RS507, DataWedge продолжит работу с этим сканером RS507 после повторного подключения после замены батареи. Если RS507 не подключается повторно после замены, DataWedge возвращается к текущему сканеру по умолчанию.
Оставить включенным при приостановке — Этот режим поддерживается Bluetooth и подключаемыми сканерами и может привести к более быстрому разряду батареи, чем можно было бы ожидать в режиме приостановки. Примечание. Вычислительное устройство Zebra выходит из режима ожидания при нажатии триггера сканирования любого поддерживаемого сканера .
USB-сканеры SSI
DataWedge поддерживает следующие USB-сканеры Zebra SSI:
DS2208 USB-сканер SSI
DS3608 USB-сканер SSI
DS4608 USB-сканер SSI
DS8108 USB-сканер SSI
DS9308 USB-сканер SSI
DS9908 USB-сканер SSI
LI3608 Сверхпрочный лазерный сканер USB SSI
RS4000 USB-сканер-кольцо SSI
RS5000 USB-сканер-кольцо SSI
Примечания по поддержке :
Сканеры должны быть настроены с использованием SSI через USB CDC.
Сканер подключается одним из следующих способов: док-станция для рабочей станции или USB-порт и кабель.
Важно : Поддержка параметров декодирования может различаться в зависимости от выбранного сканирующего устройства. Замечания по поддержке конкретных устройств см. в Руководстве интегратора, прилагаемом к устройству.
Базовые станции USB SSI
DataWedge поддерживает следующие базовые станции Zebra USB со сканером Bluetooth для сканирования штрих-кодов в режиме SSI:
Базовая станция/сканер
Минимальная версия прошивки
STB3678 (база)
ПААКНС00-005-Р00
CR2278 (база)
ПААДНС00-001-Р04
CR8178 (база)
ПААКИС00-006-Р02
DS3678 (сканер)
PAACKS00-010-R00
DS2278 (сканер)
ПААДФС00-002-Р05
DS8178 (сканер)
PAACXS00-007-R01
DataWedge поддерживает следующие устройства Zebra Android для подключения к поддерживаемой USB-базе (на устройстве Android требуется версия 32. 7.31.0 сканера или более поздняя версия):
EC50 / EC55
ЕТ51 / ЕТ56
Л10АВ
TC52AX
ТС52 / ТС57
ТС52С / ТС57С
ВК8300
Для установления соединения требуется правильная установка и конфигурация.
Конфигурация USB-базы и сканера
USB-база и сканер Zebra должны находиться в режиме «SSI через USB CDC» для работы с DataWedge.
Выполните следующие действия:
Включите USB-базу Zebra, подключив ее к любому ПК.
Сопряжение/подключение сканера Bluetooth путем сканирования штрих-кода сопряжения, напечатанного на USB-базе.
Сканируйте штрих-код «SSI Over USB CDC» с помощью сканера Bluetooth:
Сканер Bluetooth автоматически перезапускается.
И сканер, и USB-база теперь находятся в режиме SSI over USB CDC.
Настройка и подключение к устройству Android
Подключите устройство Android к сканеру Bluetooth через подставку USB:
Включите питание поддерживаемого устройства Zebra Android.
Вставьте устройство в базовую станцию рабочей станции, которая поддерживает соединение USB и подключена к источнику питания.
Вставьте один конец кабеля Ethernet в базовую станцию USB.
Вставьте другой конец кабеля (USB) в базовую станцию рабочей станции. На USB-базе загорается зеленый светодиод.
Выполните сопряжение/подключение поддерживаемого Bluetooth-сканера к USB-базе, отсканировав штрих-код сопряжения Bluetooth, напечатанный на USB-базе. Сканер подключается к USB-базе.
Сканирование теперь можно выполнять с помощью сканера Bluetooth для вывода результатов на устройство Android. Выбор сканера в DataWedge автоматически выбирает Zebra USB Cradle. При сканировании с помощью DWDemo нажмите аппаратную кнопку запуска на сканере Bluetooth или нажмите программную кнопку запуска в приложении DWDemo, чтобы начать сканирование.
Примечание: Описанные выше шаги необходимо выполнять по порядку. Если приложение сканирования открыто до сопряжения/подключения сканера Bluetooth к USB-базе, сканирование не будет работать.
Связь между устройством Zebra Android, подставкой USB и сканером Bluetooth
Аппаратный триггер
Эта функция настраивает DataWedge для включения/отключения использования аппаратного триггера устройства для ввода штрих-кода. Аппаратный триггер включен по умолчанию. Если отключено, сканирующий луч не появляется при нажатии аппаратного триггера. Однако сканирующий луч по-прежнему можно активировать с помощью намерения Soft Scan Trigger DataWedge API. Эта функция позволяет разработчикам приложений принудительно использовать специальные функции приложения при сканировании штрих-кодов и документов в своем приложении.
Примечание. Когда аппаратный триггер отключен, его нельзя использовать для запуска сканирующего луча. Если сканирование инициировано намерением программного триггера API сканирования, нажатие аппаратного триггера отменяет луч.
Автоматическое переключение на значение по умолчанию при событии
Эта функция настраивает DataWedge на выбор внешнего сканера в качестве устройства сканирования по умолчанию сразу после подключения и возврат к встроенному сканеру при отключении внешнего сканера. К внешним сканерам относятся те, которые подключаются через Bluetooth, последовательный кабель или съемный модуль. Если этот параметр включен, SWITCH_SCANNER не следует использовать при подключении/отключении сканера, так как это может привести к неожиданному поведению. Отключено по умолчанию . Доступно, только если на панели выбора сканера выбрано значение «Авто».
Эта функция предназначена для сокращения перерывов в рабочем процессе сканирования, когда подключается сканер Bluetooth и/или он отключается из-за отключения питания или выхода за пределы зоны действия.
Для Сканеры Bluetooth, если устройство ранее не было сопряжено, перед автоматическим подключением отображается штрих-код сопряжения. 0009
Доступные параметры :
Отключено — При подключении или отключении внешнего сканера не происходит переключения сканера (по умолчанию).
При подключении — Выбор внешнего сканера в качестве сканирующего устройства по умолчанию сразу после подключения.
При отключении — Возврат к встроенному сканеру в зависимости от его положения во внутреннем списке сканеров (который зависит от хост-устройства). Обычно это сканер, использовавшийся последним перед внешним подключением (см. примечания ниже).
При подключении/отключении — Выбор внешнего сканера в качестве сканирующего устройства по умолчанию сразу после подключения. После отключения возвращается к сканеру, установленному по умолчанию до внешнего подключения.
Примечания :
Система выбирает сканер по умолчанию на основе состояния подключения и положения сканера в списке сканеров, управляемом внутренними средствами. Если вновь подключенный сканер находится ниже в списке сканеров, чем тот, который в настоящее время выбран в качестве сканера по умолчанию, вновь подключенный сканер становится сканером по умолчанию.
На устройствах только с одним встроенным сканером или имидж-сканером «При отключении» возвращается к этому встроенному сканеру или имидж-сканеру.
Параметры запуска QR-кода
Параметры запуска QR-кода включение/отключение веб-URL для запуска из браузера по умолчанию, когда URL-адрес декодируется из штрих-кода QR-кода. Чтобы включить эту функцию с главного экрана, необходимо настроить профиль DataWedge Launcher. Требования:
Режим сканирования должен быть установлен на Одноместный.
QR-код должен содержать действительный единственный URL-адрес, который начинается с «http» или «https» и не содержит других данных.
Выбранный сканер должен поддерживать сканирование QR-кода, в противном случае параметр запуска QR не будет работать.
Если первые 2 требования не выполняются, отсканированные данные отправляются в приложение без открытия URL-адреса.
Включить QR-код для открытия URL-адреса
Параметры запуска QR-кода
Доступные параметры:
Запуск QR-кодов — настраивает профиль Datawedge для включения или отключения (по умолчанию) возможности открытия URL-адреса при сканировании QR-кода. Если этот параметр включен, отсканированный штрих-код должен иметь тип QR-кода и должен содержать действительный URL-адрес, чтобы браузер по умолчанию мог открыть этот URL-адрес. В противном случае отсканированные данные отправляются в приложение. Запуск QR-кодов должен быть включен для следующих опций:
Включить только декодер QR-кода — если включено (по умолчанию отключено), он декодирует только штрих-коды QR-кода, и если он содержит действительный URL-адрес, URL-адрес запускается в браузере — все другие декодеры, выбранные в профиле, активны. игнорируется. Ограничение декодирования только штрих-кодами QR устраняет необходимость отмены выбора других декодеров, которые могут быть выбраны в профиле. Если этот параметр отключен, другие декодеры помимо QR-кодов могут сканироваться, но только QR-коды с допустимым URL-адресом могут запускать URL-адрес в браузере.
Показать всплывающее окно URL-адреса — , если отключено, при сканировании QR-кода, содержащего действительный URL-адрес, браузер по умолчанию немедленно запускает и открывает URL-адрес. Если включено (по умолчанию), при сканировании штрих-кода QR-кода, содержащего действительный URL-адрес, появляется всплывающее окно, предлагающее пользователю решить, открывать URL-адрес или нет, на основе следующего выбора: • Да — запускается браузер по умолчанию. и открывает URL. • Нет — URL-адрес не открывается, а отсканированные данные отправляются в приложение.
Всплывающее сообщение с QR-кодом
Настройка параметров сканера
Настройка параметров сканера Параметр доступен в настройках профиля DataWedge. Он настраивает параметры сканера, указывая, как сканируется штрих-код, включая выбранный сканер (например, камера, 2D-сканер, сканер Bluetooth и т. д.), декодер, параметры декодера, параметры считывателя и параметры сканирования. Дополнительную информацию см. в соответствующих разделах ниже по каждому параметру.
Настройки профиля
Коснитесь Настройка параметров сканера . Появится список параметров конфигурации сканера.
Конфигурация сканера
Примечание: Параметр Настройка параметров сканера по-прежнему доступен, даже если сканер, выбранный в Выбор сканера , отключен. В предыдущих версиях DataWedge до 6.8 все параметры сканера (декодеры, параметры декодера и т. д.) отображаются серым цветом и недоступны.
Режимы сканирования
Режимы сканирования используется для выбора режима сканирования штрих-кодов:
Одиночный — нормальный режим для сканирования отдельного штрих-кода
UDI — сканирование штрих-кодов уникальной идентификации устройства (UDI), таких как GS1, HIBCC и ICCBBA
Отключено — при выборе режима сканирования, такого как MultiBarcode или Document Capture, на экране NG SimulScan Configuration , режим сканирования в этом разделе автоматически отключается, предотвращая любой другой выбор.
Режимы сканирования существует как в разделах Scanner Configuration , так и NG SimulScan Configuration . Доступность параметров Режимы сканирования зависит от параметра, выбранного в каждом разделе:
Если Одиночный или UDI выбран в качестве Режим сканирования в Конфигурация сканера, затем отключен5 Режимы сканирования в конфигурации NG SimulScan.
Если Document Capture или MultiBarcode выбраны для Режимы сканирования в конфигурации NG SimulScan, , то Режимы сканирования отключены в конфигурации сканера .
Конфигурация сканера — режимы сканирования
Общая конфигурация сканера
Глобальная конфигурация сканера (Все сканеры) позволяет пользователям указать общую конфигурацию сканера, применимую ко всем поддерживаемым сканерам. Вместо указания нескольких индивидуальных конфигураций для каждого отдельного сканера в заданном профиле DataWedge предоставляется параметр глобальной конфигурации для настройки нескольких сканеров в одном профиле.
Глобальная конфигурация сканера (Все сканеры) отображает все параметры сканера и значения для каждого сканера, даже если они не поддерживаются конкретным сканером. Поскольку этот список является всеобъемлющим, существует вероятность того, что конкретный параметр или значение могут не поддерживаться отдельным сканером. В этом случае в logcat логируется ошибка при сканировании.
Когда глобальная конфигурация сканера (Все сканеры) включена, по-прежнему доступен доступ к настройкам, характерным для отдельных сканеров, таким как параметр «Оставлять включенным при приостановке» (который особенно относится к Bluetooth и другим периферийным сканерам), даже если по умолчанию сканер выбран в качестве внутреннего сканера для «Выбора сканера» ( См. Рисунок 1 ). При применении конфигураций, если какие-либо глобальные настройки неприменимы к конкретному сканеру, эти настройки не могут быть применены и будут проигнорированы.
Если настраивается глобальный параметр, а затем настраивается отдельный сканер, сохраняются оба параметра конфигурации. Конфигурации будут применяться в следующем порядке:
Применяется глобальная конфигурация.
Применена определенная конфигурация сканера.
Если отчеты генерируются при установке глобальной конфигурации сканера, будут возвращены значения, поддерживаемые подключенным устройством.
Конфигурация
Откройте профиль в DataWedge. Раздел «Ввод штрих-кода» содержит пункт «Настройка параметров сканера». Примечание: Параметр «Настройка параметров сканера» по-прежнему доступен, даже если сканер, выбранный в «Выборе сканера», отключен. В предыдущих версиях DataWedge до 6.8 все параметры сканера (декодеры, параметры декодера и т. д.) отображаются серым цветом и недоступны.
Настройки профиля
Нажмите «Настроить параметры сканера». Появится список параметров конфигурации сканера.
Конфигурация сканера
Нажмите «Выбрать сканер для настройки параметров». Все сканеры Параметр позволяет включить глобальную конфигурацию сканера, позволяя применять настройки сканера ко всем сканерам.
Общая конфигурация сканера
Выбрать Все сканеры . Появится подтверждающее сообщение, указывающее, что любые изменения настроек в дальнейшем будут применяться ко всем сканерам в качестве общей глобальной конфигурации. Любой существующий индивидуальный параметр сканера будет заменен этим глобальным параметром. Сканер не нужно подключать к устройству, чтобы настроить параметры в глобальной конфигурации сканера.
Использование намерений
Установите глобальную конфигурацию сканера, установив для параметра configure_all_scanners значение «true» через API намерения SET_CONFIG.
Конфигурация SimulScan NextGen
Конфигурация SimulScan NextGen (NG) — это конфигурация, перенесенная из устаревшего SimulScan. Ввод DataWedge, ранее объявленный устаревшим. NG SimulScan — это решение для сбора данных, предназначенное для извлечения данных из документов, форм и этикеток путем сканирования штрих-кодов или частичного или полного захвата документов в виде изображений. Доступны не все устаревшие функции SimulScan — миграция этих функций в NextGen SimulScan требует постоянной работы. В настоящее время следующие функции являются частью NextGen SimulScan:
MultiBarcode — получает несколько уникальных штрих-кодов из формы за один сеанс сканирования и доставляет данные либо сразу, либо после достижения заданного количества штрих-кодов за сканирование. Поддерживается начиная с DataWedge 8.0. В отличие от устаревшего SimulScan, для этой функции MultiBarcode шаблон не требуется, в отличие от подфункции MultiBarcode, являющейся частью Document Capture, для которой шаблон требуется.
Document Capture — извлекает данные из документов, форм и этикеток путем сканирования штрих-кодов или частичного или полного захвата документов в виде изображений на основе шаблона, созданного в NG SimulScan Template Builder. Поддерживается начиная с DataWedge 8.0 и доступно только на некоторых устройствах и сканерах, см. матрицу функций. 9Для захвата документов 0008, который включает MultiBarcode в качестве подфункции, требуется шаблон NextGen SimulScan , также известный как шаблон захвата документов .
Для устройств Zebra Professional Series, таких как TC21 и TC26, NextGen SimulScan требуется лицензия Mobility DNA Enterprise. При попытке доступа к этой функции на устройстве без действующей лицензии отображается следующее сообщение:
Требуется лицензия на устройствах Zebra Professional
Дополнительную информацию см. в разделе Лицензирование DataWedge.
Для доступа к конфигурациям NextGen SimulScan:
В профиле DataWedge коснитесь Настройка параметров NG SimulScan . Профиль DataWedge, отображающий NG SimulScan
Появится экран конфигурации NG SimulScan с параметрами, аналогичными Настройка параметров сканера . Конфигурация NextGen (NG) SimulScan
. Дополнительную информацию см. в соответствующих разделах ниже по каждому параметру конфигурации NG SimulScan.
Режимы сканирования
Режимы сканирования выбирает режим сканирования штрих-кодов:
MultiBarcode — нескольких штрих-кодов, считанных за одно сканирование. Шаблон не требуется.
Захват документа — захват полей в документе или захват всего документа в виде изображения на основе шаблона, созданного в NG SimulScan Template Builder. Поддержка этой функции зависит от аппаратного обеспечения и версии операционной системы. Дополнительную информацию см. в таблице «Матрица функций».
Отключено — , когда режим сканирования, например Одиночный или UDI, выбран в разделе Конфигурация сканера , режим сканирования автоматически отключается в Конфигурация SimulScan NG, запрещает любой другой выбор.
Режимы сканирования существует как в разделах Scanner Configuration , так и NG SimulScan Configuration . Доступность параметров Режимы сканирования зависит от параметра, выбранного в каждом разделе:
Если Одиночный или UDI выбран в качестве Режим сканирования в Конфигурация сканера, , затем Режимы сканирования отключены в конфигурации NG SimulScan.
Если Document Capture или MultiBarcode выбраны для Режимы сканирования в конфигурации NG SimulScan, , то Режимы сканирования отключены в конфигурации сканера .
NextGen (NG) SimulScan — режимы сканирования
Выбор документа / Захват документа
Выбор документа указывает шаблон, используемый для захвата документа для извлечения данных из документов, форм и этикеток путем сканирования штрих-кодов или частичного или полного захвата документов в виде изображений. Шаблон создается с помощью NG SimulScan Template Builder и используется для обработки полученных данных, чтобы их можно было использовать в приложении. Document Capture должен быть выбран в качестве режима сканирования . Существует 2 типа шаблонов захвата документов:
Захват изображения — захватывает изображения целых документов или форм, а также дополнительно захватывает элементы внутри формы, включая штрих-коды и фотографии, и обнаруживает подписи в одном сеансе.
MultiBarcode — получает данные из форм, содержащих штрих-коды. Применяется в случаях, когда требуется одновременное считывание нескольких штрих-кодов или необходимо считывать определенный(-е) штрих-код(-ы) из множества штрих-кодов. Захваченные штрих-коды включают любые штрих-коды (критерии штрих-кода не определены), специально определенные штрих-коды (на основе определенных определенных критериев) и группы общих штрих-кодов (общий шаблон, обнаруженный в штрих-кодах на основе определенных критериев), даже если количество или наличие штрих-кода (ов) меняется от этикетки к этикетке.
Инструкции по извлечению данных из формы с помощью Document Capture см. в Руководстве программиста Document Capture.
Инструкции по созданию шаблона Document Capture/NextGen SimulScan см. в конструкторе шаблонов. После создания шаблона скопируйте его на устройство.
Чтобы выбрать шаблон Document Capture/NextGen SimulScan, на экране конфигурации NG SimulScan нажмите Document Selection и выберите шаблон для документа, который необходимо захватить (см. снимок экрана ниже). Этот выбор заполняется после импорта шаблона. С Захват документа , требуется для Использовать поставщиков контента для извлечения отсканированных данных.
Выбор шаблона захвата документов
Шаблоны по умолчанию, относящиеся к Весь документ
В следующих подразделах выделено несколько различных типов параметров шаблона захвата документа на основе определенного шаблона:
A) Штрих-код привязки
Захват документа с помощью штрих-кода привязки захватывает поля в документе в виде изображений, таких как адрес или подпись, на основе штрих-кода в шаблоне NG SimulScan, который определяет положение захватываемых полей. Применяется к типу шаблона Image Capture. После правильной настройки отсканируйте штрих-код привязки, чтобы захватить определенную область в виде изображения. Различные поля в документе могут быть захвачены отдельными изображениями. Это полезно в таких ситуациях, как операции по доставке, для захвата адреса и подписи в формах доставки в виде отдельных изображений для подтверждения доставки.
Видеодемонстрация захвата документа со штрих-кодом привязки:
B) Весь документ
Захват всего документа захватывает весь документ или форму в виде изображения на основе окружающих границ содержимого, определенного в шаблоне NG SimulScan Строитель. Применяется к типу шаблона Image Capture. Весь документ может быть захвачен со сканированием штрих-кода или без него. Документ должен иметь черные рамки, окружающие все четыре стороны, или быть окаймлен контрастным фоном, в противном случае документ не может быть захвачен.
По умолчанию доступны два шаблона:
WholePage-MandatoryBarcode — Используется для захвата любой формы или документа, имеющего хотя бы один штрих-код, который может быть расположен в любом месте формы или документа.
WholePage-OptionalBarcode — Используется для захвата любой формы или документа, который может иметь или не иметь штрих-код. Если штрих-код присутствует, он может быть расположен в любом месте формы или документа. Поскольку документ сканируется, как только DataWedge обнаруживает его, полученное отсканированное изображение может стать размытым. Для лучшего качества изображения измените Прицельтесь Введите – Нажмите и удерживайте в разделе «Параметры считывателя».
Видеодемонстрация захвата всего документа:
C) Обнаружение присутствия подписи
Обнаружение наличия рукописной подписи при сканировании документа с помощью Document Capture. Эта функция полезна, в частности, для служб доставки или курьерских служб, чтобы автоматически проверять отсутствие подписи, а не выполнять проверку вручную. Шаблон NG SimulScan требуется для обозначения области в форме, используемой для определения местоположения сигнатуры для обнаружения ее присутствия. Применяется к типу шаблона Image Capture. Обнаружение наличия подписи управляется через Content Provider. Дополнительную информацию см. в руководстве программиста Content Provider.
Чтение определенного штрих-кода декодирует конкретный штрих-код из множества штрих-кодов на основе уникальных критериев, определенных в шаблоне NG SimulScan. Применяется к типу шаблона MultiBarcode (как часть Document Capture). Критерии захвата штрих-кода определены в шаблоне NextGen SimulScan. См. Конструктор шаблонов для получения дополнительной информации и инструкций о том, как создать шаблон. Критерии считывания конкретных штрих-кодов основаны на следующих параметрах, выбранных при создании шаблона. Можно использовать любую комбинацию этих параметров. Если присутствует более одного штрих-кода, соответствующего заданным критериям, то опция 9Вместо этого можно использовать 0554 Automatic Group Identification , описанный в следующем разделе.
Тип штрих-кода — Указывает тип или декодер штрих-кода, как определено в шаблоне.
Проверка символов (начинается с) — Указывает конкретный символ, с которого должен начинаться штрих-код, чтобы его можно было декодировать, как определено в шаблоне. Некоторые общие спецификации: ○ N — (например, NXXXXXX) для номера извещения ○ P – (например, PXXXXXX) для номера детали ○ Q – (например, QXXXXXX) для количества ○ V – (например, VXXXXXX) для идентификатора поставщика
Проверка символов (содержит символы в заданной позиции в строке) — Указывает символы в заданной позиции в декодированной строке, которые должен содержать штрих-код, как определено в шаблоне.
Длина данных штрих-кода — Указывает длину строки штрих-кода для декодирования, как определено в шаблоне.
Проверка нескольких символов (начинается с) — Указывает допустимые символы для начала строки штрих-кода, как указано в шаблоне. Например, если указаны «А» и «В», то декодируются только те штрих-коды, которые начинаются с «А» или «В».
Наличие переменного поля (обязательный + необязательный штрих-код) — применяется к формам, которые содержат комбинацию обязательных и необязательных штрих-кодов для декодирования, как указано в шаблоне. Если обязательный штрих-код отсутствует, то декодирование не происходит. Если обязательный штрих-код присутствует с необязательным штрих-кодом, то декодируются оба. Если обязательный штрих-код присутствует без дополнительного штрих-кода, то декодируется обязательный штрих-код.
E) Автоматическая идентификация групп
Автоматическая групповая идентификация обрабатывает штрих-коды из документа или этикетки, которые имеют общий шаблон, автоматически группируя декодированные данные при обнаружении шаблона. Обычный вариант использования включает сканирование серийных номеров с оптовых упаковок продукта, где идентификаторы серийных номеров и количество элементов в оптовых упаковках меняются от этикетки к этикетке. Применяется к типу шаблона MultiBarcode (как часть Document Capture). DataWedge идентифицирует штрих-коды, принадлежащие к группе, путем поиска шаблона в данных каждого штрих-кода на основе следующих критериев, определенных в шаблоне NG SimulScan (все критерии должны быть соблюдены):
Та же символика штрих-кода
Те же первые 1-2 символа данных штрих-кода
Одинаковая длина данных штрих-кода
При использовании этой опции количество штрих-кодов должно быть указано с использованием одного из следующих методов методов, основанных на том, как определяется количество — будь то с наличием штрих-кода «количества» (количественный штрих-код) или заданным пользователем или системой (определяется пользователем/системой):
Количество штрих-кодов – В зависимости от шаблона на форме или этикетке присутствует отдельный штрих-код, указывающий количество штрих-кодов для сканирования для каждого сеанса декодирования. Декодированные данные из штрих-кода количества должны соответствовать хотя бы одному из следующих критериев:
Начинается с «Q» или «q»
Длина не более 3 цифр
Определяется пользователем/системой — Установите количество штрих-кодов (диапазон значений: от 1 до 100; значение по умолчанию: 5) для сканирования на основе:
Пользовательский интерфейс DataWedge — используйте параметр Определяемое пользователем количество штрих-кодов в Параметры шаблона из Конфигурация NG SimulScan , как показано ниже.
API намерения DataWedge — используйте SetConfig, чтобы установить common_barcode_dynamic_quantity на желаемое количество.
Установка количества штрих-кодов для автоматической идентификации групп
Видеодемонстрация функций Specify Barcode Criteria и Auto Group Identification:
MultiBarcode получает несколько уникальных штрихкодов из формы за один сеанс сканирования и доставляет данные либо сразу, либо после определенного требования выполняется — сканируется определенное количество штрих-кодов или количество сканированных штрих-кодов находится в пределах заданного диапазона значений. Дублирующиеся штрих-коды декодируются только один раз. Шаблон не требуется. MultiBarcode должен быть выбран в качестве режима сканирования в конфигурации NG SimulScan. MultiBarcode включает следующие функции:
Мгновенная отчетность немедленно сообщает о каждом декодированном штрих-коде, позволяя пользователю управлять сеансом сканирования — когда сеанс сканирования начинается (нажмите и удерживайте триггер) и заканчивается (отпустите триггер) — с обратной связью по декодированию за каждый отсканированный штрих-код.
Переменное количество штрих-кодов применяется к рабочим процессам, в которых количество штрих-кодов варьируется от этикетки к этикетке. Этикетки могут не обязательно следовать спецификации, определенному количеству штрих-кодов или уникальным критериям для различения конкретных штрих-кодов. Рассмотрите этикетки от разных производителей, которые используют разные идентификаторы штрих-кода и/или этикетки с дополнительной информацией о штрих-коде. Отрегулируйте количество переменных штрих-кодов, установив минимальное и максимальное количество штрих-кодов за сканирование.
Фиксированное количество штрих-кодов применяется к рабочим процессам, в которых всегда ожидается одинаковое количество штрих-кодов и не существует уникальных критериев для различения каждого штрих-кода. Укажите конкретное количество штрих-кодов за сканирование.
Укажите, когда сообщать о декодированных штрих-кодах, следует ли сразу после сканирования штрих-кода или нет, пока не будет выполнено одно из следующих требований:
Сканировано определенное количество штрих-кодов
Количество отсканированных штрих-кодов находится в диапазоне минимального и максимального количества указанных штрих-кодов
MultiBarcode от NG SimulScan не следует путать с MultiBarcode от Document Capture, , который включает чтение определенного штрих-кода и автоматическую идентификацию группы.
Параметры MultiBarcode (в DataWedge 8.1 и более ранних версиях этот раздел отображается как Основные параметры MultiBarcode вместо Параметры MultiBarcode )
Параметры параметров MultiBarcode:
Мгновенные отчеты — Включить/выключить немедленные отчеты об уникальных штрих-кодах в сеансе сканирования; нажмите и удерживайте курок, чтобы начать сканирование, отпустите курок, чтобы остановить сканирование. Повторяющиеся штрих-коды игнорируются. Если Мгновенная отчетность включена, она игнорирует значение из Максимальное/Конкретное количество штрих-кодов при сканировании и немедленно сообщает отсканированные данные. Если отключено (по умолчанию), декодированные данные возвращаются как единое целое после достижения максимального/конкретного числа штрих-кодов за сканирование. Если разделители штрих-кодов предназначены для вывода (используя IP-вывод или вывод по нажатию клавиши) для нескольких штрих-кодов, эти разделители не добавляются — штрих-коды выводятся по одному с Instant Reporting.
Минимальное количество штрих-кодов за одно сканирование — Представляет нижний предел количества штрих-кодов для сканирования в одном сеансе сканирования, если Сообщать о декодированных штрих-кодах включен. Данные штрих-кода декодируются только в том случае, если количество отсканированных штрих-кодов находится в диапазоне от Минимальное количество штрих-кодов для сканирования до Максимальное/конкретное количество штрих-кодов для сканирования. Чтобы устранить минимальное ограничение, установите для этого значения значение 0 и установите конкретное значение для Максимальное/конкретное количество штрих-кодов за сканирование. Применяется только к встроенным имидж-сканерам, но не к внешним сканерам (например, сканеру-кольцу RS5100). Если Сообщить о декодированных штрих-кодах отключен, эта опция неактивна и недоступна.
Максимальное/определенное количество штрих-кодов за одно сканирование — Применяется только к встроенным имидж-сканерам, а не к внешним сканерам (например, сканеру-кольцу RS5100).
Переменное количество штрих-кодов — Максимальное количество штрих-кодов за одно сканирование представляет верхний предел количества штрих-кодов для сканирования в одном сеансе сканирования, если включен параметр Отчет о декодированных штрих-кодах . Данные штрих-кода декодируются только в том случае, если количество штрих-кодов находится в пределах Минимальное количество штрих-кодов для сканирования и Максимальное количество штрих-кодов для сканирования. Максимальный предел — 100.
Фиксированное количество штрих-кодов — Определенное количество штрих-кодов за сканирование представляет определенное количество штрих-кодов, которые должны быть отсканированы в одном сеансе сканирования, если Сообщать о декодированных штрих-кодах отключен. Если указанное количество штрих-кодов изначально не находится в поле зрения сканера, сканер не декодирует данные. Если в поле зрения сканера содержится большее количество штрих-кодов, чем указанное количество, сканер случайным образом декодирует штрих-коды, пока не будет достигнуто указанное количество. Например, если счетчик установлен на 2 и 8 штрих-кодов находятся в поле зрения, сканер декодирует первые 2 считанных штрих-кода, возвращая данные в случайном порядке. Данные возвращаются только после считывания указанного количества штрих-кодов .
Отчет о декодированных штрих-кодах — Включение/отключение отчетов о декодированных данных штрих-кода в одном сеансе сканирования независимо от указанного Максимального/конкретного количества штрих-кодов за сканирование. Если отключено, о декодированных штрих-кодах не сообщается, если Максимальное/конкретное количество штрих-кодов за сканирование не достигнуто в сеансе сканирования. Если включено, о декодированных штрих-кодах сообщается, когда количество отсканированных штрих-кодов находится в диапазоне от Минимальное количество штрих-кодов на сканирование и Максимальное/конкретное количество штрих-кодов на сканирование. Рассмотрим следующее поведение, когда Сообщать о декодированных штрих-кодах включен:
Если также включен параметр Continuous Read , непрерывное считывание штрих-кодов не работает.
Если Instant Reporting также включен, Instant Reporting имеет более высокий приоритет.
MultiBarcode Примечания:
Полученные данные со всех штрих-кодов доставляются в виде одной строки при выводе в виде нажатий клавиш. Чтобы добавить разделители и настроить порядок вывода, см. руководство «Вывод по нажатию клавиши».
MultiBarcode поддерживает максимальный размер данных 64 КБ.
Поведение списка выбора — Если для параметра списка выбора установлено значение «Отключено», устройство попытается отсканировать количество штрих-кодов, указанное на экране параметров MultiBarcode. Если для параметра «Список выбора» установлено значение, отличное от «Отключено», предполагается, что пользователь будет перемещать перекрестие на каждый сканируемый штрих-код. Данные возвращаются только после считывания указанного количества штрих-кодов .
Несколько типов штрих-кодов — Несколько типов штрих-кодов (декодеров) могут быть получены в одном сеансе сканирования. Например, если указанное количество для сканирования MultiBarcode равно четырем, два штрих-кода могут иметь тип штрих-кода Code 128, а два других могут быть типа Code 39.
Если включены параметры «Непрерывное чтение» и «Мгновенная отчетность», мгновенная отчетность имеет приоритет над Непрерывное чтение, игнорируется.
Если таймер луча истекает во время любого из сеансов сканирования до выполнения определенных критериев (например, минимальное/максимальное количество штрих-кодов), отсканированные данные не сообщаются.
Подсветка штрих-кода
Подсветка штрих-кода обеспечивает обратную связь на экране при сканировании с помощью камеры или имидж-сканера, выделяя штрих-коды на основе определенных правил. Создайте правила для выделения штрих-кодов и укажите, о каких штрих-кодах сообщается. Эта функция помогает пользователю определить, какие штрих-коды захватываются, или помогает в поиске товаров. Ввод штрих-кода должен быть включен, чтобы функция Подсветка штрих-кода работала.
Видео, знакомящее и демонстрирующее использование выделения штрих-кода
Пример выделенных штрих-кодов на основе данных штрих-кода и примененных правил
Включить выделение штрих-кода
Параметры выделения штрих-кода:
Правила выделения штрих-кода — выделение штрих-кодов на основе заданных условий и действий из созданных правил. Применяется только для выделения; правила декодирования задаются в опции Report Data Rules .
Правила данных отчета — декодирует штрих-коды на основе заданных условий и действий из созданных правил.
См. «Руководство программиста по выделению штрих-кодов» для получения инструкций по реализации подсветки штрих-кодов в приложении.
Правила выделения штрих-кодов
Правила выделения штрих-кодов определяют условия и действия для выделения штрих-кодов, видимых на экране предварительного просмотра. Доступные параметры:
Условия — определяют условия, при которых должно применяться правило. Должно быть задано хотя бы одно условие, иначе будут выделены все штрих-коды:
Идентификатор: • Минимальная длина — указывает минимальную длину отсканированного штрих-кода • Максимальная длина — указывает максимальную длину отсканированного штрих-кода. • Содержит — отсканированный штрих-код должен содержать указанные символы. не обязательно совпадать с регистром букв строки в поле Содержит . Если этот параметр отключен, отсканированные данные чувствительны к регистру, и регистр букв должен совпадать с символами в Содержит 9.поле 0555.
Символика — выберите символику или штрихкоды для сканирования
Действия — определяют действие, которое необходимо выполнить при выполнении условия:
Цвет заливки — выберите цвет, используемый для выделения отсканированного штрих-кода
Чтобы создать правило выделения штрих-кода:
Включить Ввод штрих-кода и Подсветка штрих-кода .
Нажмите на многоточие (. ..) рядом с Подсветка штрих-кода , чтобы открыть Параметры выделения штрих-кода .
Tap Правила выделения штрих-кода .
Нажмите на значок гамбургера в правом верхнем углу и нажмите Новое правило.
Введите имя нового правила.
Коснитесь ОК. Появится новое правило.
Нажмите на правило.
Нажмите Условия , чтобы указать условия для вступления правила в силу.
Нажмите Идентификатор.
Укажите нужные параметры:
Нажмите кнопку «Назад».
Нажмите Символы.
Выберите желаемую символику для сканирования.
Нажимайте назад, пока не появится экран с отображением правила.
Коснитесь Действия.
Нажмите на значок гамбургера в правом верхнем углу и нажмите Новое действие.
Нажмите Цвет заливки , чтобы выбрать новое действие для создания.
В списке указано новое действие. Коснитесь Цвет заливки.
Выберите нужный цвет и отрегулируйте уровень прозрачности с помощью ползунка.
Коснитесь OK.
Выбранный цвет отображается в предварительном просмотре правила цвета заливки.
Правила данных отчета
Правила данных отчета определяют условия и действия для декодирования выделенного штрих-кода. Доступные параметры:
Условия — определяют условия, при которых должно применяться правило:
Идентификатор: • Минимальная длина — указывает минимальную длину отсканированного штрих-кода • Max Length — указывает максимальную длину отсканированного штрих-кода • Содержит — отсканированный штрих-код должен содержать указанные символы. отсканированные данные не чувствительны к регистру и не должны совпадать с регистром букв строки в поле Содержит . Если этот параметр отключен, отсканированные данные чувствительны к регистру, и регистр букв должен совпадать с символами в Содержит поле .
Символика — выберите символику или штрихкоды для сканирования
Действия — определяют действие, которое необходимо выполнить при выполнении условия:
Отчет — декодирование штрих-кода на основе условий указанных
Чтобы создать правило данных отчета:
Включить Ввод штрих-кода и Подсветка штрих-кода .
Нажмите на многоточие (…) рядом с Подсветка штрих-кода , чтобы открыть Параметры выделения штрих-кода .
Нажмите Правила данных отчета .
Нажмите на значок гамбургера в правом верхнем углу и нажмите Новое правило.
Введите имя нового правила.
Коснитесь OK. Появится новое правило.
Нажмите на правило.
Нажмите Условия , чтобы указать условия для вступления правила в силу.
Нажмите Идентификатор.
Укажите соответствующие настройки по желанию:
Нажмите кнопку «Назад».
Нажмите Символы.
Выберите нужные символы для сканирования.
Нажимайте назад, пока не появится экран с отображением правила.
Коснитесь Действия.
Нажмите на значок гамбургера в правом верхнем углу и нажмите Новое действие.
Коснитесь Отчет , чтобы декодировать штрих-коды на основе указанных условий .
Действие «Отчет» указано в списке.
Выбор декодера
Многие методы ввода включают параметры, которые можно настроить в соответствии с ожидаемыми целями сканирования и/или предпочтениями организации. Включение узкого набора декодеров может помочь повысить безопасность, уменьшить количество ошибок декодирования и повысить производительность сканирования. Например, компания, которая регулярно получает посылки, закодированные с помощью символики Code 128, может подумать об ограничении используемых ею декодеров Code 128 декодерами не-EAN разновидности .
Параметры отдельных декодеров изменяются в профиле. Каждому профилю DataWedge можно назначить уникальную группу декодеров и параметров декодера (где это применимо) для использования со связанными с ним приложениями. В этом руководстве рассматривается выбор декодеров и приводятся подробные сведения о декодерах с настраиваемыми параметрами.
См. Декодеры для информации о поддерживаемых декодерах и параметрах декодера.
Декодеры по умолчанию
DataWedge декодирует все основные символы штрих-кода. Популярные форматы включены по умолчанию во всех профилях DataWedge (обозначены *). Чтобы повысить производительность сканирования, Zebra рекомендует отключить все декодеры, не требуемые приложениями, связанными с данным профилем .
Примечание :
Декодеры, не имеющие настраиваемых параметров, не отображаются в разделе «Параметры декодера». Другие связаны с соответствующими описаниями параметров.
В качестве декодера следует выбирать только «Почту Австралии» или «Почту Канады», а не оба сразу. Если оба одновременно выбраны в качестве декодеров, декодируются только штрих-коды «Почта Канады».
Почта Австралии
Ацтек *
Почта Канады
Китайский 2 из 5
Кодабар *
Код 11
Код 32 *
Код 39 *
Код 93
Код 128 *
Композитный AB *
Композитный C *
Datamatrix *
Подпись декодера
Дискретный 2 из 5
Точечный код
Почта Нидерландов
EAN-8 *
EAN-13 *
Почта Финляндии 4S
Панель данных GS1
Матрица сетки
GS1 DataBar Limited
Расширенная панель данных GS1
Матрица данных GS1
QR-код GS1
ХАНЬ СИНЬ
Чередование 2 из 5
Почта Японии
Корейский 3 из 5
MacroPDF *
ПОЧТОВЫЙ МАРКЕТ
Матрица 2 из 5
Максикод *
MICR E13B
MicroPDF *
MicroQR
MacroMicroPDF *
MSI
ОКР А
ОКР В
ПДФ417 *
QR-код *
ТЛЦ 39 *
Триоптик 39
Валюта США
Почта США
Планета США
Почтовый индекс США
УПК-А *
СКП-Е0 *
US4state FICS
СКП E1
США4штат
* Включено по умолчанию
Примечание : Декодеры с гиперссылками указывают (и ссылаются на) настраиваемые параметры.
Включение/отключение декодеров
Чтобы включить или отключить декодеры :
1. В редактируемом профиле нажмите «Настроить параметры сканера», затем нажмите «Декодеры », как показано ниже. Появится список декодеров, аналогичный изображенному на шаге 2.
2. Выберите/отмените выбор нужных декодеров , установив/сняв соответствующий флажок. Примечание : Сокращение ненужных декодеров может повысить производительность сканирования.
Редактировать параметры декодера
Для редактирования параметров декодера :
1. В редактируемом профиле нажмите Декодеры. Появится список декодеров, аналогичный изображенному на шаге 2 ниже.
2. В списке Декодер коснитесь декодера, чтобы изменить его параметры. Если декодер не имеет параметров, отображается флажок для включения/отключения декодера.
Параметры декодера
Ниже описаны редактируемые параметры отдельных декодеров. Примечание. Декодеры без настраиваемых параметров не отображаются в разделе «Параметры декодера» ниже . Дополнительные инструкции по созданию и редактированию профилей DataWedge см. в руководстве «Управление профилями».
См. Декодеры для информации о поддерживаемых декодерах и параметрах декодера.
Сокращенная неактивная зона
Незаметная зона — это пустое место по обе стороны от штрих-кода, которое указывает, где начинается и заканчивается символика, и предназначено для предотвращения сканирования считывателем ненужной информации. Когда декодеры без полей используются с параметрами считывателя с уменьшенным уровнем тихой зоны, декодеры ведут себя в соответствии со следующей таблицей: Описания уровней 1D Quiet Zone , показанные выше, находятся в разделе Reader Params вместе с важными предупреждениями .
Параметры UPC/EAN
Параметр UPC/EAN позволяет настраивать параметры, применимые к более чем одному декодеру UPC или EAN.
Преобразовать DataBar в UPC EAN — Если этот параметр включен, штрих-коды DataBar преобразуются в формат UPC/EAN/JAN. Чтобы этот параметр работал, необходимо включить символику UPC/EAN/JAN. Этот параметр применяется только к штрих-кодам GS1 DataBar Omnidirectional и GS1 DataBar Limited, которые не декодируются как часть составного штрих-кода. Он удаляет начальный «010» из штрих-кодов DataBar-14 и DataBar Limited, кодирующих один ноль в качестве первой цифры, и сообщает штрих-код как EAN-13. Для штрих-кодов, которые начинаются между двумя и пятью нулями, он удаляет начальный «0100» и сообщает штрих-код как UPC-A. Параметр преамбулы UPC-A, который передает системный символ и код страны, применяется к преобразованным штрих-кодам. Обратите внимание, что ни системный символ, ни контрольную цифру нельзя удалить.
Уменьшенная неактивная зона UPC — Включение/выключение декодирования штрих-кодов UPC с уменьшенными неактивными зонами, областью перед и в конце штрих-кода. Включение этого параметра увеличивает агрессивность декодирования штрих-кодов, что приводит к увеличению времени декодирования и риску неправильного декодирования.
Bookland — Если этот параметр включен, выберите формат Bookland из списка ниже.
Формат Bookland — Когда Bookland включен, для данных Bookland можно выбрать следующие значения:
Формат ISBN-10 — Сканер сообщает данные Bookland, начинающиеся с 978, в традиционном 10-значном формате со специальной контрольной цифрой Bookland для обратной совместимости. Данные, начинающиеся с 979, в этом режиме не считаются Bookland.
Формат ISBN-13 — Сканер передает данные Bookland (начиная с 978 или 979) как EAN-13 в 13-значном формате, чтобы соответствовать протоколу ISBN-13 2007 года.
Купон — Включить/выключить декодирование кода купона. Для использования этой функции необходимо включить UPC-A, EAN-13 и GS1-128. Когда эта функция включена, декодируются штрих-коды UPC-A, начинающиеся с цифры «5», штрих-коды EAN-13, начинающиеся с цифры «99», и коды купонов UPC-A/GS1-128.
Режим отчета о купоне — Традиционные символы купона состоят из двух штрих-кодов: UPC/EAN/JAN и Code 128. Новый символ купона состоит из одного штрих-кода с расширенными данными. Новый формат предлагает больше вариантов стоимости покупки (до 9 долларов США).99,999) и поддерживает сложные предложения скидок в качестве второго требования к покупке. Также существует символ промежуточного купона, который содержит оба типа штрих-кодов: UPC/EAN/JAN и расширенную панель данных. Этот формат подходит как для розничных продавцов, которые не распознают или не используют дополнительную информацию, содержащуюся в новом символе купона, так и для тех, кто может обрабатывать новые символы купона.
Режим отчета о старом купоне — Сообщает как UPC-A/код-128, так и EAN-13/код-128.
Режим отчета о новом купоне — Сканирование промежуточного формата сообщает UPC-A/GS1-DataBar и EAN-13/GS1-DataBar.
Оба режима отчета о купоне — Сообщает как о старом формате купона, так и о новом формате купона.
EAN Zero Extend — Если этот параметр включен, к декодированным штрих-кодам EAN-8 добавляются пять начальных нулей, чтобы сделать их совместимыми по длине со штрих-кодами EAN-13.
Линейное декодирование — Включает свойство линейного декодирования.
Счетчик повторов — Счетчик повторов для автоматического распознавания дополнений UPC/EAN/JAN, регулируя количество раз декодирования штрих-кода без дополнений перед передачей. Диапазон значений от 2 до 20; значение по умолчанию — 10. Zebra рекомендует значение 5 или выше при декодировании комбинации штрих-кодов UPC/EAN/JAN с дополнениями и без них. Дополнительный режим должен быть установлен на одно из следующих значений: Дополнения Авто, Дополнения Смарт, Дополнения 378-379, дополнительные номера 978-979, дополнительные номера 977 или дополнительные номера 414-419-434-439 (от 2 до 20).
Уровень безопасности — Сканер предлагает четыре уровня безопасности декодирования штрих-кодов UPC/EAN/JAN. По мере снижения качества штрих-кодов реализация повышенного уровня безопасности компенсирует это и поможет повысить эффективность декодирования. Существует обратная связь между агрессивностью сканера и безопасностью. Zebra рекомендует тщательно выбирать уровень безопасности, необходимый для любого конкретного приложения:
Уровень 0 — Этот параметр позволяет сканеру работать быстрее, обеспечивая при этом достаточную безопасность при декодировании штрих-кодов UPC/EAN/JAN, соответствующих спецификации.
Уровень 1 — По мере снижения уровня качества штрих-кода одни символы становятся подвержены ошибкам декодирования раньше других (например, 1, 2, 7, 8). Если сканер не может декодировать плохо напечатанные штрих-коды, а ошибки декодирования ограничены этими символами, выберите этот уровень безопасности.
Уровень 2 — Если сканеру не удается декодировать плохо напечатанные штрих-коды, а ошибки декодирования не ограничиваются символами 1, 2, 7 и 8, выберите этот уровень безопасности.
Уровень 3 — Если сканер по-прежнему не выполняет декодирование, выберите этот уровень безопасности. Имейте в виду, что выбор этой опции является крайней мерой против ошибок декодирования штрих-кодов, которые сильно не соответствуют техническим требованиям. Выбор этого уровня безопасности может значительно ухудшить способность сканера к декодированию. Если требуется этот уровень безопасности, попробуйте улучшить качество штрих-кодов.
Доп.2 — Включить/отключить длину 2 доп.
Доп.5 — Включить/отключить длину 5 доп.
Дополнительный режим — Выберите один из следующих вариантов:
Без дополнений — Сканер декодирует только UPC/EAN/JAN и игнорирует дополнительные символы.
Дополнительные всегда — Сканер декодирует только символы UPC/EAN/JAN с дополнительными символами и игнорирует штрих-коды без дополнительных символов.
Дополнительное авто — Сканер немедленно декодирует символы UPC/EAN/JAN с дополнительными символами. Если у символа нет дополнения, сканер должен декодировать штрих-код количество раз, заданное с помощью дополнительной избыточности UPC/EAN/JAN, прежде чем передавать свои данные, чтобы подтвердить отсутствие дополнения.
Supplemental Smart — Включает смарт-дополнения. В этом режиме декодер немедленно возвращает декодированное значение основного блока, если только он не принадлежит к одному из следующих дополнительных типов: ◦ 378 ◦ 379 ◦ 977 ◦ 978 ◦ 979 ◦ 414 ◦ 419 ◦ 434 ◦ 439
Если штрих-коду предшествует один из вышеуказанных префиксов, изображение ищет дополнение более агрессивно и пытается его отсканировать. Если дополнительное сканирование не удается, возвращается только основной штрих-код.
Дополнительные 378-379 — Включает (автораспознавание) дополнительные коды UPC/EAN/JAN, начинающиеся с 378 или 379. Отключает чтение дополнений для любого другого штрих-кода UPC/EAN/JAN, не начинающегося с 378 или 379. Пытается отсканировать дополнение, если оно присутствует. Если дополнительное сканирование не удается, возвращается только основной штрих-код.
Дополнение 978-979 — Включает (автораспознавание) дополнение для кодов UPC/EAN/JAN, начинающихся с 978 или 979. Отключает чтение дополнений для другого штрих-кода UPC/EAN/JAN, не начинающегося с 978 или 979. Попытки отсканируйте доп., если он есть. Если дополнительное сканирование не удается, возвращается только основной штрих-код.
Supplemental 414-419-434-439 — Включает (автораспознавание) дополнения для кодов UPC/EAN/JAN, начинающихся с 414, 419, 434 или 439. Отключает чтение дополнений для другого штрих-кода UPC/EAN/JAN, не начиная с 414, 419, 434 или 439. Пытается отсканировать дополнение, если оно есть. Если дополнительное сканирование не удается, возвращается только основной штрих-код.
Дополнительные 977 — Включает (автораспознавание) дополнительные коды UPC/EAN/JAN, начинающиеся с 977. Отключает чтение дополнений для другого штрих-кода UPC/EAN/JAN, не начинающегося с 977. Пытается отсканировать дополнение, если оно присутствует. Если дополнительное сканирование не удается, возвращается только основной штрих-код.
Параметры считывателя
Параметры считывателя управляют определенными параметрами конфигурации для считывателя штрих-кода, выбранного в редактируемом профиле. Не все параметры применимы ко всем считывателям .
Параметры режима презентации — Устанавливает уровень чувствительности реакции на движение в поле зрения сканера во время сеанса сканирования для автоматической активации сканера при обнаружении движения. Используется, когда Режим презентации выбран для Тип цели.
Чувствительность — Устанавливает уровень чувствительности.
Высокий — Сканирование активируется с высокой чувствительностью к движению в поле зрения сканера (по умолчанию). Любое незначительное движение в поле зрения может активировать сканер.
Средняя — Сканирование активируется со средней чувствительностью к движению в поле зрения сканера.
Низкая — Сканирование активируется при низкой чувствительности к движению в поле зрения сканера. Быстрое движение в поле зрения не активирует сканер.
Уровень тихой зоны 1D — Устанавливает усилие, с которым декодер будет пытаться декодировать штрих-коды без полей. Поведение этих уровней зависит от выбранного декодера без полей. Поведение см. в таблице «Сокращенная тихая зона»:
Уровень 0 — Декодер выполнит декодирование полей как обычно.
Уровень 1 — Декодер будет работать более агрессивно.
Уровень 2 — Для декодера требуется только один конец штрих-кода.
Уровень 3 — Декодер может декодировать что угодно.
Примечание : Более высокие уровни без полей увеличивают время декодирования и риск ошибок декодирования. Zebra рекомендует включать только те символы, для которых требуется более высокий уровень без полей, и оставлять все остальные символы на уровне по умолчанию 1.
Режим прицеливания — Включает и выключает режим прицеливания.
Таймер прицеливания — Устанавливает продолжительность (в мс) для режимов прицеливания по времени. Поддерживает диапазон от 0 до 60 000 мс с шагом 100 мс.
Тип цели — Позволяет выбрать поведение считывателя при нажатии триггера:
Триггер — При каждом нажатии триггера можно сканировать один штрих-код.
Непрерывная по времени — Датчик приближения определяет перемещение объекта в поле зрения. Когда объект обнаружен, он активирует модуль сканирования для работы в непрерывном режиме. Любой штрих-код, обнаруженный в поле его зрения, декодируется. Сканер продолжает работать в непрерывном режиме, даже после декодирования или удаления объекта из поля зрения, до Достигнуто время таймера непрерывного луча (см. настройку ниже). Если в течение установленного тайм-аута декодирования не происходит, модуль сканирования отключается, и датчик приближения становится активным, обнаруживая, что в поле зрения не появляется другой объект.
Удержание по времени — После нажатия на курок сеанс прицеливания запускается на время, указанное Таймером прицеливания. По истечении этого времени запускается сеанс декодирования и становится виден сканирующий луч. Сеанс декодирования будет оставаться активным до тех пор, пока не истечет время таймера луча, не будет отпущен триггер или не будет декодирован штрих-код.
Отпуск по времени — После нажатия на спусковой крючок запускается сеанс прицеливания, который будет продолжаться до тех пор, пока спусковой крючок не будет отпущен. Если время таймера прицеливания истекло при отпускании триггера, сеанс декодирования начнется с видимым сканирующим лучом в течение оставшегося времени, равного таймеру луча, или будет декодирован штрих-код.
Нажать и отпустить — Сканирующий луч запускается при нажатии и отпускании курка. Сеанс декодирования будет оставаться активным до тех пор, пока не истечет время таймера луча или не будет декодирован штрих-код.
Презентация — Автоматически активирует сканер и начинает сканирование сразу же после появления штрих-кода в его поле зрения, без нажатия кнопки.
Непрерывное считывание — При нажатии и удержании кнопки сканирования выполняется непрерывное сканирование штрих-кодов. Сканирование останавливается при отпускании курка или по истечении времени луча сканера. Один и тот же штрих-код можно сканировать несколько раз. При сканировании с использованием намерений, например, с программным триггером сканирования, намерение START_SCANNING запускает непрерывное сканирование до тех пор, пока не будет получено намерение STOP_SCANNING или пока не истечет время луча сканера. Не поддерживается сканером-кольцом Zebra RS507 Bluetooth .
Нажать и удерживать — Запускает сканирующий луч при нажатии триггера и продолжает сеанс декодирования до тех пор, пока не истечет время таймера луча, не будет декодирован штрих-код или отменено считывание. Сканирующий луч не останавливается при отпускании курка . Это позволяет избежать неожиданной отмены считывания последующим нажатием кнопки запуска устройства; последующие нажатия курка при включенном луче не имеют никакого эффекта. Применяется к внутреннему имидж-сканеру на сканерах Bluetooth TC20/TC25 и RS6000/RS507, подключенных к устройствам TC57/TC77 и PS20 .
Нажать и продолжить — Сканирующий луч запускается при нажатии курка. Последующее удержание или отпускание триггера сохраняет активным сеанс декодирования до тех пор, пока не истечет таймер луча или пока не будет нажато и отпущено следующее триггерное нажатие. Это позволяет избежать преждевременного износа пусковой кнопки и сводит к минимуму усилия пользователя по нажатию и удержанию жесткой пусковой кнопки во время сеанса декодирования.
Управление освещением DPM — Управление освещением для штрих-кодов DPM:
Прямое освещение — Сканер использует только прямое (белое) освещение. Рекомендуется для использования со штрих-кодами с точечной гравировкой — наклоните часть на 30 градусов для оптимального декодирования.
Непрямое освещение — Сканер использует только красную подсветку. Рекомендуется для использования со штрих-кодами, выгравированными лазером, на цилиндрах или изогнутых, шероховатых, зернистых, сильно отражающих или обработанных поверхностях.
Циклическое освещение — Сканер попеременно переключается между прямым и непрямым освещением. Сканер запускается с подсветкой, использованной при последнем успешном декодировании.
Режим DPM — Режим для оптимизации производительности декодирования штрих-кода DPM в зависимости от размера штрих-кода (значение по умолчанию — режим 2):
Отключено — Без специальной обработки.
Режим DPM 1 — Оптимизирует производительность декодирования небольших штрих-кодов DPM, обычно используемых в электронных и медицинских инструментах, особенно на гладких поверхностях. Эти штрих-коды, как правило, наносятся лазерной гравировкой или прямой печатью.
DPM, режим 2 — Оптимизирует производительность декодирования больших штрих-кодов DPM, обычно встречающихся на промышленных деталях, особенно на шероховатой, зернистой или явно обработанной поверхности. Эти штрих-коды, как правило, наносятся точечной обработкой или лазерной гравировкой.
Включено — Включает декодирование только инверсных 1D-символов.
Авто — Автоматически обнаруживает и декодирует положительные и обратные символы 1D.
Режим ЖК-дисплея — Используется для включения/отключения режима ЖК-дисплея, который расширяет возможности имидж-сканера по считыванию штрих-кодов с ЖК-дисплеев, таких как мобильные телефоны (применимо только к модулю сканирования). Использование ЖК-режима может привести к снижению производительности и миганию сетки перед декодированием .
Линейный уровень безопасности — Устанавливает количество считываний штрих-кода для подтверждения точного декодирования:
Избыточность и длина безопасности — Дважды считывается избыточность на основе флагов избыточности и длины кода.
Security Short или Codabar — Двукратное считывание избыточности при коротком штрих-коде или Codabar.
Безопасность Все дважды — Двукратное считывание всех штрих-кодов.
Security All Thrice — Трехкратное считывание всех штрих-кодов.
Тайм-аут низкого энергопотребления ядра аппаратного обеспечения — Время (в мс) бездействия перед тем, как сканер перейдет в режим пониженного энергопотребления.
Список выбора — Позволяет выбрать режим списка выбора, который предписывает имидж-сканеру декодировать только штрих-код непосредственно под перекрестием/прицельной сеткой на экране предварительного просмотра. Эта функция наиболее полезна для приложений, в которых несколько штрих-кодов могут появляться в поле зрения во время сеанса декодирования, но для декодирования требуется только один.
Отключить — Отключает режим списка выбора; любой штрих-код в поле зрения может быть декодирован.
Список выбора оборудования — Режим списка выбора включается путем отправки команды на оборудование.
8у6
Список выбора программного обеспечения — Функция списка выбора обрабатывается в программном обеспечении; никакие команды не отправляются на оборудование.
Примечания :
Производительность может различаться на некоторых устройствах, если установлены аппаратные или программные режимы раскрывающегося списка.
При использовании режима MultiBarcode см. важные примечания по поведению ниже.
Плохое качество декодирования — Позволяет выбирать режимы улучшения для декодирования штрих-кодов плохого или ухудшенного качества. Доступные параметры:
Уровень сложности 0– Не влияет на производительность декодирования обычных одномерных и двумерных штрих-кодов.
Effort Level 1 — Производительность сканера обычных двумерных штрих-кодов снижена, а производительность декодирования штрих-кода Tesco Thailand и штрих-кода суппозиториев улучшена.
Усилие Уровень 2 — То же, что и Уровень 1.
Усилие, уровень 3 — аналогично уровню 1.
Примечание: Одинаковая производительность от уровня усилия 1 до уровня усилия 3.
Таймер луча — Устанавливает максимальное количество времени (в мс), в течение которого считыватель остается включенным. Поддерживает диапазон от 0 до 60 000 мс с шагом 100 мс. Значение 0 устанавливает, что считыватель остается включенным на неопределенный срок.
Таймер непрерывного луча по времени — (связан с Непрерывный по времени Тип прицеливания.) Устанавливает количество времени (в мс), в течение которого сеанс сканирования остается активным до истечения времени ожидания. Поддерживает диапазон от 0 до 180 000 мс с шагом 1000 мс. Значение 0 переводит считыватель в непрерывный режим, оставаясь включенным на неопределенный срок.
Тайм-аут другого символа — Используется для предотвращения декодирования сканером другого символа в течение заданного интервала времени (применимо, только если для параметра «Тип цели» установлено значение «Непрерывное чтение»). Значение 0 указывает, что интервал между двумя последовательными чтениями не требуется.
Истечение времени ожидания одного и того же символа — Используется для предотвращения декодирования сканером одного и того же символа в течение заданного интервала времени (применимо, только если для параметра Тип цели установлено значение Непрерывное чтение). Значение 0 указывает, что интервал между двумя последовательными чтениями не требуется.
Инициирование пробуждения и сканирования — Используется для запуска сканирования, когда устройство находится в состоянии ожидания или без экрана. Пользователю необходимо установить кнопку запуска сканера в качестве источника пробуждения. Когда пользователь нажимает кнопку триггера в режиме приостановки/выключения экрана, сканирование начинается, когда пользователь удерживает триггер нажатым.
Декодирование Digimarc — Используется для включения/отключения поддержки Digimarc, который кодирует и незаметно интегрирует данные традиционных штрих-кодов в упаковку продукта. Поддерживается с внутренним имидж-сканером и задней камерой . Включено по умолчанию. Подробнее о Дигимарк.
Режим видоискателя — Позволяет выбрать поддерживаемые режимы видоискателя:
Видоискатель включен — Включает только видоискатель.
Статическая сетка — Включает видоискатель и красную сетку (перекрестие) в центре экрана, чтобы облегчить позиционирование штрих-кода для сканирования. Этот параметр поддерживается только при использовании камеры для сканирования .
Zoom — Требуется для декодирования штрих-кодов DotCode. Пользователю необходимо установить значение «Масштаб камеры» на 2 на следующих устройствах: MC33, TC51/TC56, TC70x/TC75x, VC80x, TC52/TC57, TC72/TC77, PS20. Если на этих устройствах для масштабирования камеры установлено любое значение, отличное от 2, это может негативно повлиять на декодирование определенных штрих-кодов DotCode. Значения параметров: 1 — 8. По умолчанию=1 .
Сохранять информацию о сопряжении после перезагрузки — Включение/отключение автоматического повторного подключения к подключенному Bluetooth-сканеру после перезагрузки устройства. Применяется только к подключенным Bluetooth-сканерам.
См. Важные примечания ниже.
Конфигурация набора символов
Предоставляет параметры для настройки набора символов декодера. Эти опции:
Выбор набора символов
Автоматический набор символов Предпочтительный порядок
Параметр ошибки автоматического набора символов
Выбор набора символов — Преобразует данные штрих-кода в указанный тип кодировки, если он отличается от типа кодировки по умолчанию, UTF-8. Другие варианты: автоматический выбор набора символов, ISO-8859-1, Shift_JIS и GB18030.
Автоматический выбор набора символов (наилучшее из возможных) — Декодирует данные в предпочтительном порядке наборов символов, указанном в списке «Предпочтительный порядок автоматического набора символов». Если данные не могут быть декодированы на основе перечисленных наборов символов, вступает в силу «Опция ошибки автоматического набора символов». Подробнее см. в описании каждой соответствующей опции.
Предпочтительный порядок автоматического набора символов — если выбран «Автоматический выбор набора символов (наилучшее)», данные декодируются в указанном предпочтительном порядке поддерживаемых наборов символов: UTF-8 и GB2312. Это полезно в тех случаях, когда данные могут быть декодированы из более чем одного набора символов. Для декодирования данных выбирается первый из перечисленных наборов символов, который может успешно декодировать данные — любой другой набор символов, расположенный ниже в списке, не рассматривается, даже если данные могут быть успешно декодированы с использованием этого набора символов. Если DataWedge не может найти набор символов из предпочтительного списка для успешного декодирования данных, для декодирования данных используется набор символов, выбранный в параметре «Ошибка автоматического набора символов».
Можно настроить как список предпочтительных наборов символов, так и их предпочтительный порядок. Порядок изменяется путем перетаскивания «гамбургерного» значка набора символов в нужное положение. Чтобы удалить набор символов, нажмите и удерживайте элемент, и появится опция «Удалить». Чтобы добавить новый набор символов, коснитесь меню «гамбургер» в правом верхнем углу — появится возможность добавить набор символов, например UTF-8 и GB2312.
Ошибка автоматического набора символов Параметр — используется для декодирования данных, если устройство не может успешно декодировать на основе наборов символов, перечисленных в списке «Предпочтительный порядок автоматического набора символов». Если выбрано «Нет», в качестве строки данных возвращается «Нулевой».
Параметры сканирования
Параметры сканирования позволяют настраивать идентификатор кода и параметры обратной связи декодирования для сканера, выбранного в редактируемом профиле.
Примечание. Некоторые параметры зависят от устройства .
Тип идентификатора кода — Позволяет выбрать символ идентификатора кода для вставки между префиксом и декодированным символом. Символ идентификатора кода определяет тип кода отсканированного штрих-кода. Эта информация может быть полезна для приложения, когда считываются несколько типов штрих-кодов. Доступные варианты:
Тип идентификатора кода Нет — Без префикса.
Идентификатор кода Тип Цель — Вставка стандартного трехсимвольного префикса.
Символ типа идентификатора кода — Вставляет определенный Zebra односимвольный префикс.
Время бездействия подключения — Указывает время (в секундах), в течение которого периферийный сканер Bluetooth остается подключенным до перехода в режим ожидания для экономии заряда батареи.
Тактильная обратная связь декодирования — Включение вибрации мобильного компьютера для индикации успешного декодирования.
Показать штрих-код адреса BT — Если этот параметр включен (по умолчанию) и доступ к выбранному сканеру Bluetooth осуществляется, когда он не подключен к мобильному компьютеру, адрес Bluetooth мобильного компьютера отображается с помощью утилиты Bluetooth Pairing Utility, чтобы пользователь мог выполнить сканирование и сопряжение со сканером Bluetooth. Отключите этот параметр, чтобы адрес Bluetooth не отображался.
Звуковая обратная связь декодирования — Выберите звуковой сигнал, который будет воспроизводиться для индикации успешного декодирования.
Уведомление о декодировании экрана — Если эта функция включена, при каждом успешном декодировании на 1 секунду появляется полупрозрачный зеленый экран.
Таймер уведомления экрана о декодировании — Определяет продолжительность времени (в миллисекундах) для отображения уведомления на экране после успешного декодирования. Диапазон конфигурации таймера составляет от 500 мс до 1500 мс. Время по умолчанию 1000 мс.
Уровень прозрачности экрана декодирования — Устанавливает прозрачность зеленого экрана уведомления о декодировании. Диапазон уровней прозрачности составляет от 20 до 50 с шагом 5. Чем выше значение, тем выше прозрачность (видимость).
Уведомление светодиода декодирования — Если этот параметр включен, красный светодиод мигает при нажатии триггера сканирования.
Таймер светодиода обратной связи декодирования — Определяет время (в мс), в течение которого зеленый светодиод мигает, указывая на успешное декодирование.
Канал громкости звукового сигнала — Позволяет выбрать настройку громкости, которая будет использоваться при воспроизведении обратной аудиозаписи декодирования. Доступные варианты:
Звонок — Использование настройки громкости звонка для звуковой обратной связи.
Музыка и мультимедиа — Использует настройку громкости музыки и мультимедиа для звуковой обратной связи.
Тревоги — Использует настройку громкости будильника для звуковой обратной связи.
Уведомление — Использует настройку громкости уведомлений для звуковой обратной связи.
Примечание : не все рингтоны поддерживаются в качестве тонов декодирования; некоторые рингтоны могут быть обрезаны при использовании в качестве тона декодирования. Zebra рекомендует протестировать все выбранные тональные сигналы перед развертыванием.
Важно : Поддержка параметров декодирования может различаться в зависимости от выбранного сканирующего устройства. Замечания по поддержке конкретных устройств см. в Руководстве интегратора, прилагаемом к устройству.
Параметры UDI
Параметр универсального идентификатора устройства (UDI) одновременно получает несколько штрих-кодов.
Поддержка штрих-кодов UDI была восстановлена для устройств Zebra под управлением Android 10 с BSP 10.12.13 «Обновление 17» (или более поздней версии).
Нажмите Режимы сканирования в Конфигурация сканера , чтобы включить декодирование UDI:
Когда режим сканирования UDI включен (как указано выше) … … будут использоваться выбранные входные параметры UDI .
Декодирование UDI Примечания:
Декодирование UDI поддерживается только на устройствах, перечисленных выше .
Для вывода собранных данных UDI может потребоваться корректировка настроек символа-разделителя токенов и/или порядка вывода. Дополнительную информацию см. в руководстве по вводу данных с клавиатуры.
Параметры UDI могут различаться в зависимости от географического региона. Дополнительную информацию см. в соответствующих разделах руководств «Вывод нажатия клавиш», «Вывод намерения» и/или «Вывод IP».
Пакеты с кровью со штрих-кодом, соответствующим стандарту ICCBBA , можно расшифровать с помощью UDI.
Параметры OCR
Оптическое распознавание символов (OCR) позволяет извлекать цифровой текст из изображений. Параметры OCR применяются к декодерам OCR A и/или OCR B , если они включены. OCR A и OCR B поддерживают только прописные буквы, а не строчные. Декодирование OCR не так безопасно, как штрих-код. Чтобы уменьшить число ошибок декодирования OCR и ускорить считывание OCR, задайте точный шаблон OCR и подмножество символов, а также используйте контрольную цифру. Включение OCR может замедлить декодирование штрих-кода. Включение более одного шрифта OCR также может замедлить декодирование OCR и повлиять на точность декодирования OCR.
OCR поддерживается на всех устройствах платформы Zebra SDM660 со встроенными сканерами (такими как TC52, TC57, TC72 и TC77). OCR , а не , поддерживается на устройствах только с камерой, сканерах Bluetooth, устройствах на базе SE965 (таких как MC3300 и MC9300), задней панели расширения сканера Zebra (ZBack) или ET51 со встроенным сканером.
Inverse OCR — Белые или светлые слова на черном или темном фоне. Выберите параметр для декодирования обратного OCR:
Только обычные — Декодировать только обычные строки OCR (черное на белом).
Только инверсия — Декодировать только инверсные строки OCR (белое на черном).
Автоматическое распознавание — Декодирование как обычных, так и инверсных строк OCR.
Модуль контрольной цифры OCR — Устанавливает вычисление контрольной цифры модуля OCR. Контрольная цифра — это последняя цифра (в крайнем правом положении) в строке OCR, которая повышает точность собранных данных. Контрольная цифра является конечным продуктом вычислений, сделанных на основе входящих данных. Для вычисления контрольной цифры, например модуля 10, буквенным и числовым символам присваиваются числовые веса. Расчет применяется к весам символов, и полученная контрольная цифра добавляется в конец данных. Если входящие данные не совпадают с контрольной цифрой, данные считаются поврежденными. Выбранный параметр контрольной цифры не вступит в силу, пока вы не установите проверку контрольной цифры OCR.
Множитель контрольной цифры OCR — Устанавливает множитель контрольной цифры OCR для позиций символов. Для проверки контрольной цифры каждый символ в отсканированных данных имеет эквивалентный вес, используемый при вычислении контрольной цифры.
Добавление продукта слева направо — Каждому символу в отсканированных данных присваивается числовое значение. Каждая цифра, представляющая символ в отсканированных данных, умножается на соответствующую цифру в множителе, и вычисляется сумма этих произведений. Контрольная цифра проходит, если эта сумма по модулю контрольной цифры равна нулю. Пример: Числовое значение отсканированных данных — 132456 (контрольная цифра — 6). Проверьте цифровую ленточную строку. Модуль цифр равен 10, он проходит, потому что 90 делится на 10 (остаток равен нулю).
Добавление продукта справа налево — Каждому символу в отсканированных данных присваивается числовое значение.
Множитель контрольной цифры имеет обратный порядок. Каждое значение, представляющее символ в отсканированных данных, умножается на соответствующую ему цифру в обратном множителе, в результате чего получается произведение для каждого символа в отсканированных данных. Сумма этих произведений вычисляется. Контрольная цифра проходит, если эта сумма по модулю контрольной цифры равна нулю. Пример: Числовое значение отсканированных данных: 132459(контрольная цифра 9). Проверьте цифровую ленточную строку ряд 123456. Digit 1 3 2 4 5 9 Множитель 6 5 4 3 2 1 Продукт 6 15 8 12 10 Продукт Добавить 6+ 15+ 8+ 12+ 10+ 9 = 60 , если Модуль контрольной цифры равен 10, он проходит, потому что 60 делится на 10 (остаток равен 0).
Добавление цифр слева направо — Каждому символу в отсканированных данных присваивается числовое значение.
Каждое значение, представляющее символ в отсканированных данных, умножается на соответствующую ему цифру в множителе, в результате чего получается произведение для каждого символа в отсканированных данных. Затем рассчитывается сумма каждой отдельной цифры во всех продуктах. Контрольная цифра проходит, если эта сумма по модулю контрольной цифры равна нулю. Пример: Числовое значение отсканированных данных — 132456 (контрольная цифра — 6). Проверка цифровой цифры. 6 = 36 Если модуль контрольной цифры равен 12, он считается пройденным, поскольку 36 делится на 12 (остаток равен 0).
Добавление цифр справа налево — Каждому символу в отсканированных данных присваивается числовое значение.
Множитель контрольной цифры имеет обратный порядок. Каждое значение, представляющее символ в отсканированных данных, умножается на соответствующую ему цифру в обратном множителе, в результате чего получается произведение для каждого символа в отсканированных данных. Затем рассчитывается сумма каждой отдельной цифры во всех продуктах. Контрольная цифра проходит, если эта сумма по модулю контрольной цифры равна нулю. Пример: Числовое значение отсканированных данных — 132456 (контрольная цифра — 6). Проверьте цифровую цифру. 6 = 30 Модуль контрольной цифры равен 10. Он проходит, потому что 30 делится на 10 (остаток равен 0).
Добавление продукта справа налево Простой остаток — Каждому символу в отсканированных данных присваивается числовое значение. Множитель контрольной цифры имеет обратный порядок. Каждое значение, представляющее символ в отсканированных данных, умножается на соответствующую ему цифру в обратном множителе, в результате чего получается произведение для каждого символа в отсканированных данных. Вычисляется сумма этих произведений, за исключением произведения контрольной цифры. Контрольная цифра проходит, если эта сумма по модулю модуля контрольной цифры равна произведению контрольной цифры. Пример: Числовое значение отсканированных данных — 122456 (контрольная цифра — 6). Проверка цифровой строка множественного мультипликатора составляет 123456. цифр 1 2 2 4 5 6 Умноспособность 6 5 4 3 2 1 Продукт 6 10 8 12 10 6 Продукт Добавить 6+ 10+ 8+ 12+ 10 = 46 6 Проверка цифры Модуль равен 10. Он проходит, потому что 46 разделить на 10 дает в остатке 6.
Добавление цифр справа налево Простой остаток — Каждому символу в отсканированных данных присваивается числовое значение. Множитель контрольной цифры имеет обратный порядок. Каждое значение, представляющее символ в отсканированных данных, умножается на соответствующую ему цифру в обратном множителе, в результате чего получается произведение для каждого символа в отсканированных данных. Затем вычисляется сумма каждой отдельной цифры во всех продуктах , кроме продукта контрольной цифры . Контрольная цифра проходит, если эта сумма по модулю модуля контрольной цифры равна произведению контрольной цифры. Пример: Числовое значение отсканированных данных — 122459 (контрольная цифра — 6). Проверьте цифровую цифру. = 19 9 Модуль контрольной цифры равен 10. Он проходит успешно, потому что 19, деленное на 10, дает в остатке 9.
Индустрия здравоохранения — HIBCC43 — Стандарт контрольной цифры модуля 43 для индустрии здравоохранения. Контрольная цифра представляет собой сумму по модулю 43 всех значений символов в данном сообщении и печатается как последний символ в данном сообщении.
Строки OCR — Выберите количество строк OCR для декодирования:
1 строка
2-я строка
3-я линия
Максимальное количество символов OCR — Выберите максимальное количество символов OCR (включая пробелы) в строке для декодирования.
Минимум символов OCR — Выберите минимальное количество символов OCR (не включая пробелы) в строке для декодирования.
OCR Orientation — Выберите ориентацию строки OCR для чтения. Установка неправильной ориентации может привести к неправильному декодированию. Параметры:
0 градусов — для модуля обработки изображений (по умолчанию)
270 градусов — по часовой стрелке (или 90 градусов против часовой стрелки) к блоку обработки изображений
180 градусов — (в перевернутом виде) к модулю обработки изображений
90 градусов — по часовой стрелке к блоку обработки изображений
Всенаправленный
Тихая зона OCR — Задает ширину пустого поля для остановки сканирования во время чтения OCR.
Подмножество OCR — Определяет пользовательскую группу символов вместо предустановленного варианта шрифта. Например, при сканировании только цифр и букв A, B и C создайте подмножество только этих символов для ускорения декодирования. Это применяет указанный подмножество OCR ко всем включенным шрифтам OCR.
Шаблон OCR — Создает шаблон для точного сопоставления отсканированных символов OCR с желаемым входным форматом, что помогает устранить ошибки сканирования. Шаблон состоит из буквенных, цифровых и/или специальных символов. Значение по умолчанию — 99999999, где «9» представляет цифру для каждого символа. См. таблицу ниже, где столбец Template содержит шаблоны OCR, состоящие из символов, представленных на основе столбца Name . Каждый персонаж имеет определенное представление. Тщательное создание шаблона OCR исключает ошибки сканирования.
Минимальная длина — 3 Максимальная длина — 100 (по умолчанию — 99999999)
Шаблоны и параметры OCR:
Имя
Описание
Шаблон
Действительные данные/ Входящие данные
Неверные данные/ Исходящие данные
Обязательная цифра (9)
В этой позиции допускается только числовой символ.
99999
12987
123АВ
Требуется Альфа (A)
В этой позиции допускается только буквенный символ.
ААА
Азбука
12F
Требовать и подавлять (0)
Любой символ в этой позиции, включая пробел или отклонение, исключается из вывода.
990AA
12QAB
12АВ
Дополнительный буквенно-цифровой (1)
Этот параметр принимает буквенно-цифровой символ, если он присутствует. Необязательные символы не допускаются в качестве первых символов в поле с одинаковыми символами.
99991
1234А
1234<
Дополнительный альфа-канал (2)
Этот параметр принимает буквенный символ, если он присутствует. Необязательные символы не допускаются в качестве первых символов в поле с одинаковыми символами.
АААА2
АВСДЕ
ABCD6
Буквы или цифры (3)
В этой позиции требуется буквенно-цифровой символ для проверки входящих данных.
33333
12АВС
12АВ<
Любой, включая пробел и отклонение (4)
Принимает любой символ в этой позиции, включая пробел и отклонение. Отклонения представлены в выводе символом подчеркивания (_). Это хороший выбор для устранения неполадок.
99499
1234$ 34_98
Любой, кроме пробела и отклонения (5)
В этой позиции принимается любой символ, кроме пробела или отклонения.
55999
А.123 *Z456
А BCD
Дополнительная цифра (7)
Принимает цифровой символ, если он присутствует. Необязательные символы не допускаются в качестве первых символов в поле с одинаковыми символами.
99977
12345 789
789АВ
Цифра или заполнение (8)
Принимает любую цифру или символ заполнения в этой позиции.
88899
12345 >>789 <<789
Альфа или заливка (F)
Принимает любой альфа-символ или символ заполнения в этой позиции.
ААААФФ
АВСХУ LMN>> ABC<5
Дополнительный пробел ( )
Принимает пробел, если он присутствует. Необязательные символы не допускаются в качестве первых символов в поле с одинаковыми символами.
99 99
12 34 1234
67891
Дополнительное маленькое специальное (.)
Принимает специальный символ, если он присутствует. Необязательные символы не допускаются в качестве первых символов в поле с одинаковыми символами. Маленькие специальные символы — , и .
АА.99
MN.35 XY98
XYZ12
Другие операторы шаблонов — Эти операторы шаблонов помогают захватывать, ограничивать и форматировать отсканированные данные OCR
Буквенная строка («и +»)
Используйте любой из этих символов-разделителей, окружающих буквенно-цифровые символы, для определения буквальной строки в шаблоне, которая должна присутствовать в отсканированных данных OCR. Есть два символа, используемые для разделения обязательных литеральных строк; если в нужной литеральной строке присутствует один из символов-разделителей, используйте другой разделитель.
«35+БК»
35+БК
АБ+22
Новая линия (E)
Чтобы создать шаблон из нескольких строк, добавьте E между шаблонами каждой отдельной строки.
999EAAAA
321 млрд. канадских долларов
XYZW 12
Извлечение строки (C)
Этот оператор в сочетании с другими определяет строку символов, извлекаемую из отсканированных данных. Извлечение строки структурировано следующим образом:
CbPe
Где: • C — оператор извлечения строки • b — начальный разделитель строки • P — категория (один или несколько цифровых или буквенных символов), описывающая представление строки • e — концевой разделитель строки
Значения для b и e могут быть любыми сканируемыми символами. Они включаются в выходной поток.
С>А>
XQ3>ABCDE> ->ATRU>123
>АБВДЕ> >АТРУ>
Игнорировать до конца поля (D)
Этот оператор приводит к игнорированию всех символов после шаблона. Используйте это как последний символ в шаблоне.
999Д
123-ПЕД 357298
123 357
Пропустить до (P1)
Этот оператор позволяет пропускать символы до тех пор, пока не будет обнаружен определенный тип символов или литеральная строка. Его можно использовать двумя способами:
P1ct
Где: • P1 — оператор «Пропустить до» • c — тип символа, запускающий начало вывода • t — один или несколько шаблонных символов
P1″s»t
Где: • P1 — это оператор «Пропустить до» • «s» — это один или несколько строковых символов, запускающих начало вывода. • t — один или несколько символов шаблона. , и первый символ в шаблоне должен соответствовать этому триггеру.
P1″PN»AA9999
123PN9876 X-PN3592
PN9876 PN3592
Пропустить до Нет (P0)
Этот оператор позволяет пропускать символы до тех пор, пока в выходном потоке не будет найдено совпадение с определенным типом символов или литеральной строкой. Его можно использовать двумя способами:
P0ct
Где: • P0 — оператор Skip until Not • c — тип символа, запускающий начало вывода • t — один или несколько символов шаблона
P0″s»t
Где: • P0 — оператор Skip until Not • «s» — один или несколько буквенных строковых символов, запускающих начало вывода • t является одним или несколькими символами шаблона
Триггерный символ или литеральная строка включаются в выходные данные оператора Skip until Not.
P0A9999
BPN3456 X-PN3592
5341 Нет выхода
Повторить предыдущий (R)
Этот оператор позволяет повторять символ шаблона один или несколько раз, что позволяет захватывать отсканированные данные переменной длины. В следующих примерах фиксируются два обязательных буквенных символа, за которыми следует одна или несколько обязательных цифр:
.
АА9Р
АБ3 АБ3 32RM52700
PN12345 PN12345 Без выхода
Прокрутить до совпадения (S)
Этот оператор проходит через отсканированные данные по одному символу за раз, пока данные не будут соответствовать шаблону.
S99999
AB3 PN12345 32RM52700
Нет выхода 12345 52700
Несколько шаблонов
Эта функция устанавливает несколько шаблонов для декодирования OCR. Для каждого шаблона в строке нескольких шаблонов используйте заглавную букву X в качестве разделителя между шаблонами.
Например, установите шаблон OCR как 99999XAAAAA для декодирования строк OCR либо 12345, либо ABCDE.
Ниже приведены примеры шаблонов с описаниями допустимых данных для каждого определения. За определением поля следует его описание:
«M»99977 : M , за которым следуют три цифры и две необязательные цифры. «X»997777″X» : X , за которыми следуют две цифры, четыре необязательные цифры и X. 9
5599 : две цифры, за которыми следует любой символ, цифра, две необязательные цифры, любые два символа и две цифры. A55″-«999»-«99 : буква, за которой следуют два символа, тире, три цифры, тире и две цифры. 33A».»99 : два буквенно-цифровых символа, за которыми следуют буква, точка и две цифры. 9999 : пять цифр, за которыми следует необязательная буква, две цифры и необязательная буквенно-цифровая.