Урок русского языка. «Состав слова. Алгоритм разбора слова по составу». 2-й класс
Цель: Учить разбирать слова по составу используя алгоритм
Задачи:
- Формировать умение подбирать однокоренные слова и развивать умения находить в словах корень, приставки, суффиксы, окончание, основу.
- Учить их видеть орфограммы в разных частях слова, выделять их графически.
- Развивать орфографическую зоркость, речь, наблюдательность.
- Воспитывать бережное отношение к природе.
Настрой на хорошую работу.
Вдохните… Как хорошо, что мы вместе. Мы все счастливы и здоровы. Мы помогаем друг другу. Мы дополняем друг друга. Мы нужны друг другу. Пусть этот день несёт нам радость общения, наполнит сердце благородными чувствами.
Вот с таким настроением мы и начнём наш урок.
II. Чистописание.— Откройте тетради и запишите число и предложение «Классная работа».
— Назовите буквы и буквосочетания.
Зз зи за
— Назовите буквосочетания, в котором буква з обозначает мягкий согласный звук.
— Пропишите буквы Зз и буквосочетания.
— Прочитайте слова.
зима Зима зимородок заморозки
— Объясните лексическое значение слов.
Зима́ — город в России, Иркутской области. Расположен в 230 км на северо-запад от областного центра г. Иркутска, на левом берегу реки Оки.
Зимородок — это удивительно красивая птица. Он немного крупнее воробья с необычайно ярким оперением. Верх тела его зеленовато-голубой, брюшко же — огненно-рыжее. Гнездится зимородок по береговым обрывам в норах глубиной до 2 м. Пищу — мелких рыбёшек, головастиков, лягушат добывает птица исключительно в воде, подкарауливая добычу на какой-нибудь ветке, откуда камнем падает в воду, тут же выныривает и взлетает. Не зря зимородка называют “синим рыболовом” или “рыбачком”. Зимородки улетают в августе—сентябре, но отдельных птиц иногда наблюдают и в октябре — перед самым ледоставом. А вот в европейской части России зимородков можно увидеть и в студеную пору — возле незамерзающих речных родников и стремнин, где пернатые рыболовы, подобно оляпкам, остаются на зиму.
За́морозки — легкие утренние морозы осенью или весной. (С.И. Ожегов, Н.Ю. Шведова «Толковый словарь русского языка»)
— Что заметили? Разделите слова на группы.
— Какие слова называются однокоренными?
— Что общего? Признаки какой части речи называли?
— Что вы знаете об именах существительных?
— Подчеркните ошибкоопасные буквы в словах.
— Как проверить ошибкоопасные буквы в слове
— Какую букву нельзя проверить?
— Как называются слова написание надо запомнить? (словарные слова)
— Запишите слова.
III. Актуализация.— Подберите однокоренные слова к слову заморозки. Мороз, заморозка, мороженое,
морозец, морозилка, морозильник, Морозко, морозная.
— Что знаете о частях слова?
Корень — это общая (одинаковая) часть однокоренных слов.
Окончание — это изменяемая часть слова, которая образует форму слова и служит для связи слов в предложении и словосочетании.
Основа — это часть изменяемого слова без окончания.
Приставка — это часть слова, которая стоит перед корнем и служит для образования новых слов.
Суффикс — это часть слова, которая стоит после корня и служит для образования новых слов.
IV. Проблемная ситуация— Так какую часть слова надо находить первой, какую следующей и почему? А в какой последовательности нужно выполнять разбор слова по составу? Сформулируйте тему урока? (Ученики формулируют тему и цель урока).
— Какие задачи поставим перед собой и будем решать на уроке?
Тема урока: Состав слова. Алгоритм разбора слова по составу.
Цели урока: научить определять части слова, разбирать слова по составу; развивать орфографическую зоркость, внимание, речь, наблюдательность; воспитывать бережное отношение к природе, интерес к процессу познания.
Задача: на основании полученных знаний о частях слова, провести самостоятельное выведение алгоритма разбора слова по составу.
V. Открытие нового.— Я предлагаю вам установить порядок разбора слова по составу, т. е. вывести алгоритм. Вернёмся к нашему слову – заморозки и уже, соблюдая порядок разбора, выделим в нём все его части.
Вывод:
VI. Физминутка.Слово по составу верно разбирай:
Первым, окончание всегда выделяй,
На основу внимательно смотри,
Корень, поскорее, ты у нее найди,
Приставку и суффикс в конце определи.
Пускай снегами все заносит,
(Руки через стороны вверх, опустили)
Пускай лютуют холода,
(Руки на пояс, повороты туловища влево – вправо)
Зима меня не заморозит,
Не напугает никогда.
(Левой рукой плавное движение вверх – вниз, правая на поясе)
Зимою белые снежинки
Танцуют за моим окном.
(Правой рукой плавное движение вверх-вниз, левая на поясе)
А Дед Мороз свои картинки рисует на стекле ночном.
(Плавные движения двумя руками вверх-вниз перед собой)
— Запишите слова: зимушка, холода, снежинка, прогулка, горка. (Выполняют ученики разбор слов по составу с комментированием)
— А в какой последовательности нужно выполнять разбор слова по составу?
— Какие части слова входят в основу?
Вывод: Начинать разбор по составу нужно с окончания, затем, зная окончание слова, будем выделять основу, потом корень и только после этого приставку и суффикс.
VIII. Зрительный диктант.На дереве висит кормушка. На ветку села синичка. Над елкой закружила стайка дроздов.
— Прочитайте предложения.
— Запишите предложение под диктовку.
— Найдите, подчеркните ошибкоопасные буквы в предложениях.
— Найдите грамматическую основу предложения. Определите части речи в предложениях.
IX. Творческая работа.— Какое время года трудное для животных? Почему?
Птицам трудно приходится зимой. Нередко они голодают. Во время метелей и сильных морозов много птиц погибает от голода. Особенно часто птицы погибают в конце зимы, когда почти весь корм повсюду съеден. Действительно, зима – очень трудное время для птиц, особенно, если она морозная и снежная. Не найти птицам под снегом корма. Голодная птица сильно страдает от холода. Зимой день короткий, а чтобы выжить, не замерзнуть, пищи нужно съесть больше, чем летом.
ПОКОРМИТЕ ПТИЦ
Покормите птиц зимой!
Пусть со всех концов
К вам слетятся, как домой,
Стайки на крыльцо.
Не богаты их корма,
Горсть зерна нужна,
Горсть одна – и не страшна
Будет им зима.
(Александр Яшин)
— Подберите к существительному зима подходящие прилагательные. Зима, какая? (Холодная, морозная, сказочная, суровая, снежная, вьюжная, студеная, белая и т.д.)
— Составьте cинквейн на тему «Зима».
— Прочитайте cинквейн. Запишите.
Х. Итог урока.— Подведем итог нашего урока. Какое открытие сделали? (Алгоритм разбора состава слова)
Слово по составу верно разбирай:Литература
Первым, окончание всегда выделяй,
На основу внимательно смотри,
Корень, поскорее, ты у нее найди,
Приставку и суффикс в конце определи.
- С.И. Ожегов, Н.Ю. Шведова «Толковый словарь русского языка»)
- http://www.inpic.ru/tag/зимородок
- http://birds-altay.ru/2009/10/goluboj-zimorodok/
- http://www.liveinternet.ru/users/3872837/post142442036
- http://free-extras.com/search/1/winter.htm
- http://www.redbook.ru/article483.html
- https://urok.1sept.ru/articles/517799/
Книга Разбор слова по составу / ИД Литера
Книга Разбор слова по составу / ИД Литера купить в детском интернет-магазине ВотОнЯ по выгодной цене.Ваш город — Санкт-Петербург?
Да
Выбрать другой город
От выбранного города зависит наличие товара
ФЕДЕРАЛЬНЫЙ ОКРУГ
Северо-Западный
Центральный
Южный
Дальневосточный
Сибирский
Уральский
Приволжский
Северо-Кавказский
Регистрация
Войти
город получения заказа:Санкт-Петербург
Выберите округ
Северо-Западный
Центральный
Южный
Дальневосточный
Сибирский
Уральский
Приволжский
Северо-Кавказский
или воспрользуйтесь поиском
перейти в:
Каталог детских товаров
Каталог cемейной аптеки
способ доставки:
Наши магазины
(розничные покупки и выдача заказов)
Дополнительные пункты выдачи
мой кабинет:
Регистрация
Войти
Книга Разбор слова по составу / ИД Литера
Ожидается поставка
Сообщить о поступлении
Сообщить о поступлении
Самовывоз:
(бесплатно)
Курьером по СПб:
(бесплатно от 2500 руб)
недоступно. нет на складе
Добавить в закладки
- Для учащихся 1-4 классов.
- ISBN: 978-5-94455-086-6
- Автор: Ушакова О.Д.
Разбор слова по составу — один из основных и самых сложных грамматических видов разбора на уроках русского языка в начальной и средней школе. В книге представлены план и многочисленные образцы разбора слов по составу. Слова для словарика отобраны в рамках орфографического минимума для начальной школы и младших классов средней общеобразовательной школы.
Средний рейтинг
Пока нет отзывов
Вы должны быть авторизованы, чтобы оставить отзыв
Вес брутто: 0.10 кг
Размеры упаковки: 22×1×14 см
Код производителя: 978-5-94455-086-6
Страна изготовления: РОССИЯ
Рекомендуемый возраст: с 7- лет
это пустое модальное окно
Карточки с заданиями по русскому языку по теме «Разбор слова по составу»
Карточки для индивидуальной работы по русскому языку
для учащихся 3 класса
Карточки можно использовать на этапе закрепления и диагностики темы «Разбор слова по составу». Задания в карточках предложены двух уровней: (1)- базовый, (2)- повышенный.
Карточка №1
1(1) Разобрать слова по составу.
Снежинка, переносить, заморозить, рыбка, мореход, лётчик, кустик, корешок.
2(2) Распределите слова в соответствующие столбики, соответственно схемам. Разберите слова по составу.
Банька, снежный, добежать, учение, ответить, разговор, ночь, черный.
____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Карточка №2
1(2)Разбери слова по составу. Запиши слова в соответствующие столбики.
Сад , переход, медовый, улететь, залез, выходной, белый.
слова, называющие предметы | слова, называющие действия | слова, называющие признаки |
|
|
|
|
|
|
|
|
|
|
|
|
2(2) Разбери слова по составу. Найди слова с одинаковым составом и выпиши их ниже парами.
Прибрежный, ключик, небесный, подушка, подосиновик, осиная, читать, учить, дорисовать, кленовый.
____________________________________________________________________________________________________________________________________
Карточка №3
1(2) Разбери слова по составу.
Листочек, школьник, держать, бой, купить, снежок, подорожник, учение, долететь.
Придумайте слово с таким же составом как слово- ПОДОРОЖНИК.
____________________________________________________________________________________________________________________________________
2(2) Отгадайте слово и разберите его по составу.
| Приставка как, в слове …
| Корень как, в слове …
| Суффикс как, в слове …
| Окончание как, в слове … | Получилось слово… |
1 | понес | бегать | читать | летать |
|
2 |
| посадить | мостовая | серая |
|
3 | залетать | полёт | смотреть | ходить |
|
4 | почитать | дорожка | подснежник | конь |
|
5 |
| ветреная | снежок | стул |
|
Карточка №4
1(1) Разобрать слова по составу.
Дубовый, длинный, мяч, перелётная, подбежать, осмотреться, подъехать, улей.
2(2) Распределите слова в соответствующие столбики, соответственно схемам. Разберите слова по составу.
Стена, ручной, море, ключик, звонкий, подвозить, зимушка, осенняя, переход, школьный.
____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Карточка №5
1(2)Разбери слова по составу. Запиши слова в соответствующие столбики.
Стройка, цветник, ворона, кочка, снеговой, бежать, дубовая, стульчик, слоненок, береговая.
слова, называющие предметы | слова, называющие действия | слова, называющие признаки |
|
|
|
|
|
|
|
|
|
|
|
|
2(2) Разбери слова по составу. Найди слова с одинаковым составом и выпиши их ниже парами.
Стенка, травяной, бумажка, прибрежная, город, глазик, лесник, посадить, листовой, чай , кофе.
____________________________________________________________________________________________________________________________________
Карточка №6
1(2) Разбери слова по составу.
Крот, девица, ученик, весёлый, листочек, ученица, молочный, метро, желтый.
Придумайте слово с таким же составом как слово- молочный.
____________________________________________________________________________________________________________________________________
2(2) Отгадайте слово и разберите его по составу.
| Приставка как, в слове …
| Корень как, в слове …
| Суффикс как, в слове …
| Окончание как, в слове … | Получилось слово… |
1 | донести | бежать | читать | учить |
|
2 |
| садик | медовый | белая |
|
3 | захочет | летчик | смотреть | ходить |
|
4 | порулить | дорожная | подснежник | лес |
|
5 |
| круглый | дружок | пень |
|
Морфемный разбор (разбор слова по составу)
При морфемном разборе слова (разборе слова по составу) сначала в слове выделяется окончание и формообразующий суффикс (если они есть), подчёркивается основа.
После этого основа слова разбивается на морфемы.
Как мы уже говорили, возможны два противоположных подхода к морфемному членению основы: формально-структурный и формально-смысловой.
Суть формально-структурного морфемного разбора состоит в том, что в основе в первую очередь выделяется корень как общая часть родственных слов. Затем то, что идёт до корня, учеником должно быть осознано как приставка (приставки) в соответствии с представлениями ученика о том, встречались ли ему подобные элементы в других словах. Аналогично с суффиксами. Иначе говоря, главным при разборе становится эффект узнаваемости учеником морфем, внешнее сходство каких-то частей разных слов. И это способно привести к массовым ошибкам, причина которых — игнорирование того факта, что морфема является значимой языковой единицей. Отсутствие работы по определению значения морфем приводит в ошибкам двух типов, имеющих разную природу:
Ошибки в определении корня слова связаны с неразличением синхронного морфемного и исторического (этимологического) состава слова. Причём комплекс 2 неразличение современного и исторического морфемного состава слов берёт за установку, помогающую иногда в определении правильности написания, что вполне соответствует общей орфографико-пунктуационной направленности курса и учебника в целом. Так, в учебнике по теории в качестве иллюстративного материала приведён такой пример морфемного разбора слова искусство (ис-кус-ств-о). Очевидно, что такой подход не может способствовать корректному выделению корня в современной структуре слова и приводит к выделению в основе незначимых сегментов.
Ошибки в выделении приставок и суффиксов связаны с алгоритмом морфемного членения — с представлением большинства учащихся о слове как о веренице морфем, которые должны быть «опознаны» как уже встречавшиеся в других словах. Крайнее выражение разборов такого рода — случаи типа клю-чик (ср.: лёт-чик), я-щик (обой-щик). Но и при правильно определённом корне очень часто приходится сталкиваться с неправильным определением количества и состава приставок и суффиксов, если этих морфем в слове больше двух. Это связано, во-первых, с алгоритмом морфемного членения и, во-вторых, с тем, что в учебниках слова, имеющие более одной приставки и/или суффикса, практически не приводятся.
Формально-структурный подход к морфемному членению слова не является исключительно принадлежностью школьной практики. Аналогичный подход осуществлён в ряде научных изданий, например в «Словаре морфем русского языка» А. И. Кузнецовой и Т. Ф. Ефремовой, где утверждается, что «морфемный анализ мало зависит от словообразовательного, так как обычно при членении слова используется сопоставительный метод, при котором практически не учитывается, что от чего образуется».
Формально-структурному подходу противопоставлен подход формально-смысловой (формально-семантический). Главная установка данного подхода и алгоритм морфемного разбора выходят из трудов Г. О. Винокура и состоят в неразрывности морфемного членения и словообразовательного разбора. О том, что этот подход является целесообразным и даже единственно возможным, писали многие учёные и методисты на протяжении многих десятилетий.
Подход учебных комплексов к вопросу о принципах и алгоритме морфемного членения различен: учебные комплексы 1 и 3 предлагают формально-смысловой подход к морфемному членению слова (комплекс 3 в большей степени, чем комплекс 1), комплекс 2 — формально-структурный.
Алгоритм морфемного разбора основы состоит в построении словообразовательной цепочки «наоборот»: со слова как бы «снимаются» приставки и суффиксы, корень же выделяется в последнюю очередь. При разборе постоянно необходимо соотнесение значения производного и значения его производящего; производящая основа в современном русском языке — основа мотивирующая. Если между значением производного и значением производящего (в нашем представлении) слова нет отношения мотивированности, производящее выбрано неверно.
Таким образом, порядок разбора слова по составу таков:
1) выделить окончание, формообразующий суффикс (если они есть в слове),
2) выделить основу слова — часть слова без окончаний и формообразующих суффиксов,
3) выделить в основе слова приставку и / или суффикс через построение словообразовательной цепочки,
4) выделить в слове корень.
Примеры :
1) плотничал
Образец рассуждения :
плотничал — форма глагола плотничать; глагол стоит в форме прошедшего времени изъявительного наклонения, что выражено формообразующим суффиксом -л—, мужского рода единственного числа, что выражено нулевым кончанием (сравним: плотничал-и).
Основа — плотнича—.
Глагол плотничать образован от существительного плотник, мотивируется через него: плотничать — «быть плотником»; разница между основой плотничаи плотник — суффикс -а—, в основах представлено чередование к / ч.
Существительное плотник в современном языке непроизводно, так как не может быть мотивировано через слово плот. Следовательно, плотник /плотнич — корень.
Таким образом, словоформа плотничал имеет нулевое окончание со значением мужского рода единственного числа, формообразующий суффикс -л— со значением прошедшего времени изъявительного наклонения, словообразующий суффикс -а— со значением являться тем, что названо в мотивирующей основе, корень плотнич. Основа слова плотнича-.
Этапы урока |
Содержание учебного материала каждого этапа |
Деятельность обучающихся |
Деятельность учителя |
Самоопределение. Цель – настроить на позитивную коллективную работу, положительную мотивацию учения. |
Приветствие учащихся. Проверка готовности к уроку. Чистописание (цепочка из букв м, р, ф и петли с закруглением вверху и внизу).
|
Приветствуют учителя. Организуют свое рабочее место, проверяют наличие индивидуальных учебных принадлежностей на столе. Выполняют письмо по образцу. Разгадывают шараду. |
Создает эмоциональный настрой на работу. Организует письмо по образцу. |
Актуализация знаний |
Разгадать какое слово спряталось (морфема). |
Вспоминают, что такое морфема, морфология. |
|
Постановка учебной задачи, целей урока. Цель – закрепить знания о составе слова. |
Сегодня мы совершим путешествие по океану Знаний в страну по имени «Морфема». Эта страна интересна тем, что состоит из островов. Мы сегодня посетим эти острова и пообщаемся с их жителями. Вы готовы к этому? В путешествие мы отправимся на волшебном корабле. Давайте запишем дату нашего путешествия. Тетрадь — это наш бортовой журнал, туда будем делать все записи о путешествии. Чтобы попасть на волшебный корабль, выполним словарную работу.
|
Дети записывают число и классная работа, словарь. (Берег, до свидания, весело, вместе, интересный, погода, коллектив, ветер). |
Организует работу, управляет диалогом и ведет к верному ответу на вопросы. Управляет процессом определения уровня знаний. |
Работа по теме урока 1 остров. |
В стране «Морфема» живут части слова. Догадайтесь, какой первый островок? С чего начнем, друзья, урок? Нас приглашает окончание? И у него для нас задание? А что такое окончание? (Ответы детей) Что такое окончание? Какую роль окончание выполняет в нашей речи?
— А ну-ка, ребята, внимание! В каждом ли слове есть окончание?
— Когда вы будете постарше, окончание расскажет вам все свои секреты. У него еще много тайн. — Жители острова «Окончание» задали вам задачу.
В, гости, хорошо, а, дом, лучше.
— Прочитайте. Получилась ли у вас пословица?
— Что нужно сделать, чтобы связать слова в предложении? ( Ответы детей и составление пословицы)
Молодцы, ребята! Справились с первой задачей. Запишите в тетрадь эту пословицу. Выделите те части слова, которые помогли связать слова по смыслу. ( Работа в тетради). |
Дети отвечают на вопросы и выполняют задания 1.Выделить в словах окончания. Вода, море, палуба, земля. 2.Корабль, ветер, мотор. 3.Радио, кино, пальто. (Индивидуальная работа). |
Через подводящий диалог приводит в формулировке понятий. |
2 остров. |
Представьте, что мы опять на нашем корабле, который плывет к следующему острову. Жило-было слово ХОД В слове выХОД, в слове вХОД, В слове ХОДики стучало. И в поХОДе вдаль шагало
Кто догадался, к какому острову мы приближаемся? Что такое корень слова? (Ответы детей)
А вот и новая задачка от местных жителей. От данных слов образуйте однокоренные слова. |
1 ряд: Лень – (ленивый, леность, лентяй.) 2 ряд: Боль — (больной, заболеть, переболеть.) 3 ряд: Соль –( соленый, посолить, пересолить.) Что такое однокоренные слова? Запишите эти слова и выделите корень. ( Работа в малых группах).
|
Через подводящий диалог приводит в формулировке понятий. |
Физкультминутка. |
«Морская звезда».
|
(Руки поднимаем вверх, сжимая и разжимая пальцы, опускаем руки вниз). |
|
3 остров. |
А теперь глаза закрыли! С вами дальше мы поплыли.
Прислушайтесь, что с палубы кричит матрос?
«Приплыли? Причаливаем! Выходите!» Как вы думаете, на каком острове мы оказались? Почему так решили? Что такое приставка? Какую роль выполняет приставка? А вот и следующее задание от островитян. Какие слова получились? Запишите их в тетрадь и выделите приставку. ( Работа в тетради) Молодцы, и с этим заданием вы справились!
|
Ответы детей. Выполнение задания. Какие прставки вы знаете?
(Работа в парах). |
Через подводящий диалог приводит в формулировке понятий. |
4 остров. |
Продолжается наше путешествие. Закрыли глаза. Мы приближаемся к следующему острову.
Водичка тепленькая Погодка чудесненькая. А не сбились мы в пути? Что за остров впереди?
Почему вы так решили? А что такое суффикс? Давайте поиграем! Назовите детенышей: козы, утки, льва, гуся, слона, кошки.
( Козленок, утенок, львенок, гусенок, слоненок, котенок.) При помощи какой части слова образовались эти слова? Какой оттенок дал слову суффикс? (Ответы детей) Запишите в тетрадь слова, записанные на доске, и выделите суффикс. ( Работа в тетради) Ребята, жители последних островов спрашивают, для чего нужны суффиксы и приставки? (Ответы детей)
|
Ответы детей на вопрос « Для чего нужны суффиксы? Какие суффиксы вы знаете?».
|
Через подводящий диалог приводит в формулировке понятий. |
Определение задачи на следующий урок. |
Молодцы, справились и с этой задачей! Но мы ещё должны узнать одну морфему, чтобы правильно выполнять морфемный анализ слова. |
|
|
Этап самостоятельной работы. |
Вот мы и вернулись домой. Мы повторили все, что знали о частях слова.
разборе слов по составу.
Горка, полет, слово, садик, расписка. ( Работа в тетради) 2.Составьте новые слова, используя выделенные части данных слов.
|
|
Контролирует выполнение задания. |
Рефлексии. Оценивание. |
Молодцы, ребята! Вы показали, чему научились! Что вам понравилось на уроке? А что не понравилось? Что бы вы хотели изменить? Не ленитесь, старайтесь как можно больше узнать обо всем на свете — и тогда каждый урок будет для вас не скучным, а веселым.
|
Участвуют в учебном диалоге. |
|
Домашнее задание. |
Карточка.
|
|
«Футболисту нужно иметь мозги, в каком бы «Зените» и в какой бы сборной он ни играл». Лучшие цитаты Карпина.
Назначение Валерия Карпина на пост главного тренера сборной России – не столько удивительный выбор РФС, сколько малопонятный. Тем более в роли совместителя. За 12 лет работы тренером Карпин не выиграл ни одного трофея, а футбол его «Ростова» не назовешь более содержательным, чем игру нашей национальной команды под руководством Станислава Черчесова. Разумеется, ростовчане по составу далеки от топ-клубов РПЛ, но ведь и в сборной России подбор игроков не топовый по мировым или даже европейским стандартам. Достаточно сказать, что в прошлом чемпионате «Ростов» по проценту успешных ТТД (74%) поделил… последнее место с «Тамбовом», «Ротором» и «Химками»! По точности передач (77%) команда Карпина вообще стала худшей в лиге. Ростовчане очень много атаковали за счет навесов (15 в среднем за матч), уступая по этой статистике только «Зениту» и «Спартаку». Но у «Зенита» есть Артем Дзюба, а будет ли он у сборной, учитывая историю отношений Карпина с капитаном национальной команды, большой вопрос. Да и какой смысл тогда было менять Черчесова на Карпина, если прежнего тренера критиковали за игру на Дзюбу?
«Ростов» Карпина был хорош, прежде всего, прессингом и работой на подборах. То есть опять же тем, чем выделялась сборная России при Черчесове. Поэтому, кажется, что в лучшем случае в нашей национальной команде ничего не изменится. А в худшем – новая сборная превратится в кривую копию старой. Сам же Карпин на фоне давления из-за неудачных результатов может выдавать таких перлы, после которых последняя пресс-конференция Черчесова покажется выступлением Цицерона. Резать словом Валерий Георгиевич вообще умеет. Давайте вспомним в этом материале самые яркие цитаты нового главного тренера сборной России:
«Игра была равна, играли два…».
«Не надо верить в Валеру — надо болеть за команду».
«Этот чемпионат напоминает первенство бани или водокачки».
«Спасибо тем болельщикам, которые пришли на стадион после матча с «Порту». Я сам бы не пришёл. А если бы и пришёл, то только затем, чтобы закидать футболистов помидорами. Или яйцами тухлыми».
«Открытого футбола у нас в лиге мало очень — это не хорошо и не плохо, это просто факт».
«Для обычного болельщика, наверное, большое количество голов – это интересно. А для меня забитые мячи в большей степени – показатель действий обороны. Если много пропустили, значит, плохо защищались».
«Если человек рядом со мной 24 часа в сутки будет повторять: «Ты дурак, ты дурак, ты дурак», то в конце концов я в это поверю».
«Вы хотите услышать, что кого-то оштрафуем? Кому-то отрубим руку, кому-то ногу?»
«Как тренироваться? Как обычно. А вы что предлагаете – закрыться в номере и не выходить оттуда всю неделю? Или давайте тогда я предложу игрокам тренироваться в противогазах, хорошо?»
«Фалькао к нам не поедет».
«Твенте» ср***й им («Зениту». – Примечание «Спорта День за Днем») трешку отгрузил. С Бруну Алвешем и Данни!».
«Мальчик, по сути, ничего ещё не достиг, а уже ведёт себя, как я не знаю кто. Прошёл, сказал что-то, мячом запулил… Хорошо, что в камеру попал. Точнее, камере, конечно, не хорошо, но людям лучше. Футболисту нужно иметь мозги, в каком бы «Зените» и в какой бы сборной он ни играл».
«Если б не лимит на легионеров, многие наши футболисты, уехавшие в последние годы за границу, не вернулись бы. Там почти не играли, но тут все равно были востребованы. Почему? Российский паспорт».
«Я себе дал слово про судейство не говорить. Если я сниму табу и начну говорить про судейство, меня отстранят на всю жизнь от футбола, сто процентов».
«Словами не всегда добьешься нужного эффекта. Вот спрашиваю я игроков: «Хотите стать чемпионами России?» Они: «Хотим». «Давайте тогда больше и интенсивней тренироваться»! «Нет, это тяжело». Хотеть, как говорится, не вредно. Нужно что-то для этого делать. Я, может быть, тоже хочу тренировать «Реал» или «Барселону». И что с того?»
«Ну и?»
Карпин – автор большого количества перлов. Ждем от Валерия Георгиевича новых ярких высказываний в сборной России? Возможно, его выступления будут ярче, чем игра нашей национальной команды в отборочном цикле ЧМ-2022.
Читайте также
Клаудиньо – хорошая замена Дриусси. Будущий новичок «Зенита» может стать звездой Олимпиады
16 причин следить за командами РПЛ в новом сезоне
Тренер «Фиорентины» определился с ролью Кокорина. Неприятная новость для российского нападающего?
Бердыев или Виллаш-Боаш: помогаем РФС выбрать тренера сборной России
Текущая форма
Если у Андре Виллаш-Боаша она плохая, то у Курбана Бердыева ее просто нет. Курбан Бекиевич уже больше двух лет сидит без работы, все чаще возникая в футбольном пространстве в качестве консультанта. Его последним проектом был «Рубин», куда он пришел расчищать то, что было сделано в сезоне 2016/17.
Если в первом сезоне после возвращения легенды «Рубин» можно было выделить за качественную оборону и умение сушить матчи, то сезон 2018/19 — однозначный провал. «Рубин» по созданным моментам был четвертым с конца, а разница забитых и пропущенных была отрицательной (впервые с 2007 года). Но нужно учитывать контекст: все это время у «Рубина» были проблемы с деньгами: львиная доля лидеров (вроде Азмуна и Оздоева) были проданы, а полноценных замен не нашлось. Но что есть, то есть: после неудачной работы Бердыев решил уйти в отставку.
Фото: Global Look Press/Virginie Lefour/ZUMAPRESS.com.У Виллаш-Боаша дела даже хуже. Высшей точкой его карьеры был «Порту», а это было уже 10 лет назад. Затем неудачи с «Челси» и «Тоттенхэмом», одно чемпионство с «Зенитом» за два с половиной сезона, прибыльный отдых в Китае, пауза в карьере ради ралли и «Марсель», где португалец отработал и хорошо, и плохо одновременно. Боаша уволили из «Олимпика» еще в январе, но с тех пор вокруг его имени почти не возникало никаких слухов. Зато в сборную России его активно сватают.
Фото: Global Look Press/Panoramic/Keystone Press Agency.Тактические воззрения и как их можно применить в сборной России
Бердыев — давний сторонник философии, центром которой являются организованная игра в защите, отработанные стандарты и быстрый выход из обороны в атаку. Начиная с сезона 2016/17, он ни разу не использовал в официальном матче «Ростова» или «Рубина» схему с двумя центральными защитниками. Доминировала формация 5-3-2.
В «Ростове» в рамках этой схемы особая роль была отдана Тимофею Калачеву. Если белорус выходил в основе, то южане от 40 до 50% атак за игру проводили именно через правый фланг, откуда Калачев нагружал штрафную соперника навесами. Также были важны Азмун и Полоз (скоростные рывки в контратаках), а также Ерохин и Нобоа (первый отлично врывался в штрафную, а второй созидал из глубины). Почти все эти футболисты последовали за Бердыевым в Казань, где действовали по похожим принципам, но с меньшим успехом.
Вот так «Ростов» побеждал «Баварию». Фото: Global Look Press/Igor Russak/ZUMAPRESS.com.Сейчас в составе сборной России хватает игроков, которые знакомы с требованиями Курбана Бекиевича: даже Артем Дзюба успел застать раннего ростовского Бердыева.
Команды этого тренера любят атаковать через фланги, так что радикальных перемен в игре сборной быть не должно: Караваев в «Зените» и Фернандес в ЦСКА приучены к рывкам в атаку и навесам в штрафную. Про наличие сразу трех силовых форвардов в составе сборной даже говорить не станем.
С Нобоа-заменителем сложнее. Сейчас в составе сборной сложно найти футболиста, который так же хорош в созидании. Учитывая, что Кристиан не играл глубинного опорника в командах Бердыева на постоянной основе, с этой работой вполне может справиться Александр Головин, который хорош не только в дриблинге на пространстве. Плюс Кудряшов, Оздоев, Ерохин отлично знакомы с требованиями Бердыева по совместной работе в клубе.
Кристиан Нобоа против Златана. Фото: Global Look Press/imago sportfotodienst.Явный минус? Тот факт, что залог успеха Бердыева — кропотливая и каждодневная работа со своими игроками. Номинально кажется, что идеальнее тренера нет: он во всех командах обладал вполне средним составом, который на длинной дистанции делал конкурентоспособным. Но достичь этого можно только благодаря долгому контакту с футболистами, чего лишен любой тренер любой сборной.
«В «Рубине» послематчевый разбор порой растягивается на два дня. Перед игрой то одна «теория», то две. Зависит от соперника», — рассказывал о совместной работе с Бердыевым нынешний главный тренер «Зенита» Сергей Семак. Да и легенду про «водить за руку на тренировках» не совсем можно считать за легенду, ведь именно так Курбан Бекиевич готовил команду к испытанию на «Камп Ноу».
Перейдем к Виллаш-Боашу. Если Бердыева можно называть фанатом строгой организации и структуры, то португалец работает в несколько ином стиле. Для того, чтобы понять, какие принципы исповедует Андре, нужно внимательно присмотреться ко всем его командам: «Порту», «Челси», «Тоттенхэм», «Зенит» и «Марсель». Пять клубов и пять разных историй. Свой этап на севере Португалии Виллаш-Боаш емко охарактеризовал сам: «Та команда – это порно. Команда, за которую играли Халк, Фалькао, Хамес, Моутинью, Отаменди. Они сделали себе невероятные карьеры после “Порту”».
Та команда вполне могла добраться до высших стадий Лиги чемпионов, но ей не повезло, потому что изначально они входил в сезон как участники Лиги Европы. Дать характеристику Виллаш-Боашу как тренеру за тот отрезок сложно, ведь «Порту», обладая элитным составом, не встретил настоящую топовую оппозицию. Они просто забрали то, что должны были, сделали это предельно доминантно и мощно.
Более показательна ситуация в «Челси», где Андре решил устроить революцию, но не справился. Он решил, что время троицы Терри — Лэмпард — Дрогба подходит к концу, начав активно наигрывать на их местах более молодых конкурентов. Что было дальше, мы все помним: в конфликте между ветеранами и тренером Роман Абрамович выбрал игроков, которые в том же сезоне добыли первую победу в Лиге чемпионов.
Андре Виллаш-Боаш в «Челси». Фото: Global Look Press/imago sportfotodienst.Проблемы с опытными игроками случались и в «Тоттенхэме» с «Зенитом», где от тренера доставалось Адебайору, Кержакову и Аршавину.
Если уходить от личных проблем к футболу, то во всех своих командах Виллаш-Боаш пытался делать упор на контроле мяча. При этом во всех его командах был ярко выраженный лидер, без которого атакующая мощь перестает быть мощью.
Ярче всего зависимость Андре от лидеров проявилась в «Тоттенхэме»: в первом сезоне его буквально тащил Гарет Бэйл, который грезил о «Реале». Валлиец ушел за рекордные деньги, на его место была куплена куча игроков, но португалец провалился с ними, потеряв работу по ходу сезона. В «Зените» таким игроком был, безусловно, Халк, который при Виллаш-Боаше достиг пика своей результативности. В «Марселе» за магию отвечал Димитри Пайет, который в 22 играх первого сезона набрал 9+5 по системе «гол+пас», а в 20 играх (именно после 20 матчей Лиги 1 Андре был уволен из «Олимпика») француз набрал всего 3+3.
Если лидеры не тащат/уходят/ломаются, то дела Виллаш-Боаша плохи. И если недостаток кандидата Бердыева кроется в необходимости быть с футболистом каждый день, то недостаток кандидата Виллаш-Боаша заключается в том, что ему жизненно важно полагаться на индивидуальные качества футболистов, если речь идет о позиционной атаке.
У сборной России попросту нет лидеров необходимого для решения подобных задач уровня. Но в пользу Андре может сыграть то, что у него был один очень хороший сезон с Артемом Дзюбой, в котором нападающий впервые проявил себя как топовых ассистент.
Краткий вывод
Из двух фаворитов гонки за место главного тренера сборной России идеального кандидата выбрать просто невозможно. Бердыев хорошо знаком с многими из нынешних игроков сборной, но для успеха ему требуется его штаб и долгий период вхождения в работу. Виллаш-Боаш дает свободу лидерам, у него отлично раскрываются творческие игроки, но Андре всегда был конфликтным человеком, который почти из каждой команды уходил, оставив после себя кучу скандалов.
Ни пары месяцев на сборы национальной команды, ни своего Халка в составе сборной РФС тренерам пообещать сейчас не может. А значит, проявить свои сильные стороны в такой ситуации любому тренеру будет тяжело (а точнее — почти невозможно).
Патент США для помощи в составлении имен в приложениях обмена сообщениями Патент (Патент № 10,848,453, выдан 24 ноября 2020 г.)
Настоящая заявка является продолжением заявки на патент США сер. № 14/089830, поданной 26 ноября 2013 г., в которой испрашивается преимущество даты подачи предварительной заявки на патент США № 61/904 731, поданной 15 ноября 2013 г., полное раскрытие которой включено в настоящий документ посредством ссылки. .
ОБЛАСТЬ РАСКРЫТИЯНастоящее раскрытие в целом относится к приложениям электронного обмена сообщениями и, в частности, к составлению сообщений в приложениях электронного обмена сообщениями.
ИСТОРИЯ ВОПРОСАСледуя прецеденту аналогов ручки и бумаги, которые предшествовали им, электронные письма, мгновенные сообщения (IM), текстовые сообщения и другие электронные сообщения часто состоят из приветствия или приветствия, которое включает имя одного или больше предполагаемых получателей электронного сообщения. Однако это приводит к ситуациям, когда составитель сообщения непреднамеренно ошибочно вводит имя получателя в приветствии или где-либо еще в теле сообщения. Такие ошибки особенно распространены, когда имя получателя необычно для культуры отправителя или когда имя пишется аналогично обычному слову, не являющемуся именем.Обычные механизмы обнаружения ошибок, такие как процессы проверки орфографии, использующие предопределенный общий словарь, часто не позволяют выявить такие ситуации. Чтобы проиллюстрировать, имя получателя может быть похоже по написанию на обычное слово, и отправитель может неосознанно произносить имя получателя как обычное слово, что затем приведет к тому, что орфографические ошибки останутся незамеченными, поскольку они соответствуют написанию, найденному в словаре проверки орфографии. . Кроме того, даже если имя получателя написано отправителем правильно, функция автокоррекции в некоторых приложениях для обмена сообщениями изменяет имя, чтобы оно соответствовало слову, найденному в словаре проверки орфографии.Такие инциденты могут вызвать смущение или замешательство у отправителя и получателя.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙНастоящее изобретение может быть лучше понято, а его многочисленные особенности и преимущества станут очевидными для специалистов в данной области техники со ссылкой на прилагаемые чертежи. Использование одних и тех же условных обозначений на разных чертежах указывает на аналогичные или идентичные предметы.
РИС. 1 представляет собой схему, иллюстрирующую электронное устройство, использующее помощь в составлении имени получателя с использованием опции автопредложения для приложения обмена сообщениями в соответствии по меньшей мере с одним вариантом осуществления настоящего раскрытия.
РИС. 2 — схема, иллюстрирующая интерфейс составления сообщений приложения обмена сообщениями, которое использует помощь в составлении имени получателя с использованием опции автозаполнения в соответствии с по меньшей мере одним вариантом осуществления настоящего раскрытия.
РИС. 3 — схема, иллюстрирующая интерфейс составления сообщения приложения обмена сообщениями, которое использует помощь в составлении имени получателя с использованием опции автозамены в соответствии с по меньшей мере одним вариантом осуществления настоящего раскрытия.
РИС. 4 — схема, иллюстрирующая интерфейс составления сообщения приложения обмена сообщениями, которое использует помощь в составлении имени получателя с использованием опции автозамены после составления в соответствии с, по меньшей мере, одним вариантом осуществления настоящего раскрытия.
РИС. 5 — блок-схема, иллюстрирующая способ предоставления помощи в составлении имени получателя для составления имени получателя в теле электронного сообщения в соответствии с по меньшей мере одним вариантом осуществления настоящего раскрытия.
РИС. 6 — схема, иллюстрирующая методику идентификации имен кандидатов для помощи в составлении имени получателя во время составления электронного сообщения путем анализа адреса получателя электронного сообщения в соответствии с по меньшей мере одним вариантом осуществления настоящего раскрытия.
РИС. 7 — схема, иллюстрирующая методику идентификации имен кандидатов для помощи в составлении имени получателя во время составления электронного сообщения путем анализа отображаемого имени, связанного с адресом обмена сообщениями получателя электронного сообщения, в соответствии с, по меньшей мере, одним вариантом осуществления настоящего изобретения. раскрытие.
РИС. 8 — схема, иллюстрирующая методику идентификации имен кандидатов для помощи в составлении имени получателя во время составления электронного сообщения путем синтаксического анализа тела электронного сообщения в соответствии с, по меньшей мере, одним вариантом осуществления настоящего раскрытия.
РИС. 9 — схема, иллюстрирующая методику идентификации имен кандидатов для помощи в составлении имени получателя во время составления электронного сообщения путем выполнения поиска контактов в базе данных контактов с использованием контекста сообщения из одного или нескольких полей электронного сообщения в соответствии по меньшей мере с одним вариантом осуществления. настоящего раскрытия.
РИС. 10 — схема, иллюстрирующая методику идентификации имен кандидатов для помощи в составлении имени получателя во время составления электронного сообщения путем анализа содержимого другого приложения, которое инициировало составление электронного сообщения, в соответствии с, по меньшей мере, одним вариантом осуществления настоящего раскрытия.
РИС. 11 — схема, иллюстрирующая реализацию электронного устройства , 100, в соответствии, по меньшей мере, с одним вариантом осуществления настоящего раскрытия.
ПОДРОБНОЕ ОПИСАНИЕСледующее описание предназначено для передачи полного понимания настоящего раскрытия посредством предоставления ряда конкретных вариантов осуществления и деталей, включающих помощь в составлении имен во время составления электронного сообщения на электронном устройстве. Однако понятно, что настоящее раскрытие не ограничивается этими конкретными вариантами осуществления и деталями, которые являются только примерами, и объем раскрытия, соответственно, предназначен для ограничения только следующей формулой изобретения и ее эквивалентами.Кроме того, понятно, что специалист в данной области техники в свете известных систем и способов мог бы оценить использование раскрытия для его предполагаемых целей и получения преимуществ в любом количестве альтернативных вариантов осуществления, в зависимости от конкретной конструкции и других потребностей.
РИС. 1-11 иллюстрируют примерные методы для предоставления помощи в автоматизированном составлении имен в теле сообщения электронного сообщения, составляемого на электронном устройстве. По крайней мере, в одном варианте осуществления электронное устройство идентифицирует одно или несколько имен кандидатов-получателей на основе контекста сообщения и, в ответ на идентификацию, пользователь составляет приветствие или другое приветствие, которое, как ожидается, будет включать имя получателя в тело сообщения, предоставляет имя помощь в составлении с использованием одного или нескольких идентифицированных имен кандидатов для облегчения точного составления имени получателя.Помощь в составлении имени может быть предоставлена в виде графического представления выбранного имени кандидата в соответствии с одним или несколькими вариантами представления, такими как вариант автоматического предложения («автозаполнение»), вариант автоматического завершения («автозаполнение»), и вариант автоматического исправления («автокоррекция»). Для опции автозаполнения после идентификации пользовательского ввода, указывающего на триггер приветствия (например, ввод приветствия, такого как «Привет» или «Уважаемый», или инициирования ввода первого слова тела сообщения), одно или несколько имен кандидатов являются графически представлены в виде выбираемой пользователем опции через графический интерфейс пользователя (GUI) электронного устройства, и выбор пользователем выбираемой пользователем опции приводит к автоматическому заполнению («автозаполнению») выбранного имени кандидата в теле сообщения. как часть приветствия.Для опции автозаполнения после идентификации триггера приветствия и получения пользовательского ввода, указывающего состав начальных букв не приветствующего термина в теле сообщения, выбирается имя кандидата (если имеется более одного имени кандидата), и электронное устройство предоставляет графическое представление имени кандидата путем автономного завершения слова в теле сообщения на основе выбранного имени кандидата. Затем пользователь может решить принять это завершенное слово в качестве предполагаемого имени получателя или отклонить завершенное слово и, таким образом, вызвать его удаление из тела сообщения.Для опции автозамены электронное устройство определяет, включает ли приветствие в теле сообщения слово, соответствующее имени кандидата, и, если есть несоответствие, отображает уведомление о том, что пользователь мог ошибиться при составлении имени получателя в теле сообщения. Это уведомление может включать в себя выбираемую пользователем опцию для замены слова в приветствии предложенным именем кандидата. Опция автозамены может использоваться после завершения приветствия и перед составлением остальной части тела сообщения, после того, как тело сообщения было составлено (например,g., когда пользователь дал команду приложению обмена сообщениями инициировать передачу составленного электронного сообщения) и т.п. Ввод приветствий и других слов может осуществляться путем набора текста на клавиатуре, набора текста на виртуальной клавиатуре (сенсорного экрана), проведения пальцем по виртуальной клавиатуре, выбора букв с помощью мыши или сенсорной панели, набора текста с клавиатуры или набора клавиш, распознавания речи или другого типа ввод текста.
Идентификация имен кандидатов для процесса помощи в составлении имен может быть определена из внутреннего контекста сообщения, внешнего контекста сообщения или их комбинации.Внутренний контекст сообщения включает поля самого электронного сообщения, такие как адреса сообщения получателя в полях адреса сообщения получателя, отображаемые имена полей отображаемых имен, связанных с адресами сообщения получателя, имена вложений файлов вложений, перечисленные в полях вложений ( и содержимое прикрепленных файлов), а также содержимое самого тела сообщения, такое как строка темы сообщения или содержимое предыдущего электронного сообщения, которое было включено в тело сообщения составляемого электронного сообщения.Внешний контекст сообщения включает в себя контекст сообщения, отличный от полей составляемого электронного сообщения, и, таким образом, может включать, например, базу данных контактов, поддерживаемую на электронном устройстве, или содержимое приложения, из которого было составлено электронное сообщение. инициировано (например, содержимое веб-страницы, содержащее ссылку, которая при выборе инициирует составление электронного сообщения). По меньшей мере, в одном варианте осуществления электронное устройство идентифицирует имена кандидатов из внутреннего или внешнего контекста сообщения путем анализа содержимого контекста сообщения для идентификации отдельных слов или комбинаций или слов, которые, как предполагается, представляют слова имени, или путем использования таких проанализированных слов для выполнения поиск имени, например, в базе данных контактов для определения соответствующего имени кандидата.Эта идентификация имени кандидата через внутренний и внешний контекст сообщения, таким образом, может использоваться для дополнения обычных процессов проверки орфографии, которые полагаются на заранее определенные словари орфографии, которые не отражают конкретный контекст имени получателя или другое содержимое составляемого электронного сообщения.
Для простоты иллюстрации большая часть нижеследующего описания методов поддержки автоматизированного составления имен предоставляется в соответствии с примером использования приложения для обмена сообщениями электронной почты портативного электронного устройства.Однако эти автоматизированные методы составления имен не ограничиваются этим контекстом, а вместо этого могут использоваться для любого из множества приложений для обмена электронными сообщениями, таких как приложения для обмена мгновенными сообщениями (IM), приложения для обмена текстовыми сообщениями, приложения для микроблогов, приложения для социальных сетей и как.
РИС. 1 иллюстрирует электронное устройство , 100, , использующее автоматизированную помощь в составлении имени получателя во время составления электронного сообщения в соответствии, по меньшей мере, с одним вариантом осуществления настоящего раскрытия.Электронное устройство 100 может включать в себя любое из множества устройств, которые могут быть использованы для обмена электронными сообщениями, например сотовый телефон с поддержкой вычислений («смартфон») или часы с возможностью вычислений («умные часы»), планшетный компьютер, ноутбук. компьютер, настольный компьютер, игровая консоль, персональный цифровой помощник (КПК) и т.п.
В изображенном примере электронное устройство 100 включает в себя приложение обмена сообщениями 102 , которое работает для обмена электронными сообщениями между электронным устройством 100 и другими электронными устройствами через поставщика электронных сообщений 104 , доступного через одно или несколько сети 106 .Чтобы проиллюстрировать, приложение обмена сообщениями , 102, может включать в себя веб-приложение электронной почты (например, Google Gmail ™), которое взаимодействует с сервером электронной почты в Интернете (один вариант осуществления поставщика сообщений 104 ) через Интернет (один вариант осуществления сеть 106 ). В качестве другого примера приложение обмена сообщениями 102 может включать в себя почтовый клиент Microsoft Outlook ™, который взаимодействует с сервером Microsoft Exchange ™ (один из вариантов поставщика сообщений 104 ) через внутреннюю корпоративную сеть, Интернет или их комбинацию. .В качестве еще одного примера приложение для обмена сообщениями , 102, может включать в себя приложение для обмена мгновенными сообщениями (IM), которое обменивается данными с веб-сервером IM (один вариант осуществления поставщика 104 обмена сообщениями) через Интернет. Другие примеры приложения для обмена сообщениями 102 включают в себя, например, приложение для обмена текстовыми сообщениями (например, приложение службы простых сообщений (SMS) или приложение службы обмена мультимедийными сообщениями (MMS)), приложение для микроблогов (например, приложение «твиттер»). предоставлено Twitter Inc.), приложение для социальных сетей (например, Facebook ™ или Google Circles ™) и т.п. В некоторых реализациях приложение для обмена электронными сообщениями 102 отправляет и принимает электронные сообщения в координации с операционной системой (ОС) 108 (или другим системным программным обеспечением) электронного устройства 100 . Чтобы проиллюстрировать, ОС 108 может облегчить доступ к проводному или беспроводному сетевому интерфейсу, который соединяется с сетью 106 , доступ к дисплею и устройствам пользовательского ввода (например.g., сенсорный экран, микрофон, мышь или клавиатура) электронного устройства 100 и т.п.
Одной из функций обмена сообщениями, предоставляемой приложением обмена сообщениями 102 , является представление графического пользовательского интерфейса (GUI) для облегчения составления пользователем электронных сообщений, которые должны быть переданы одному или нескольким получателям через поставщика сообщений 104 . Составление электронного сообщения управляется посредством пользовательского ввода 110 композиции, принимаемого через один или несколько пользовательских интерфейсов ввода, связанных с этим графическим интерфейсом пользователя, например сенсорный экран, микрофон, мышь или клавиатуру.Пользовательский ввод композиции , 110, обычно включает в себя инструкцию для инициирования композиции электронного сообщения, такую как выбор пользователем кнопки «составить», отображаемой в графическом пользовательском интерфейсе (GUI), предоставляемом приложением обмена сообщениями 102 или через голос пользователя. команды, инструктирующие электронное устройство 100 инициировать новое электронное сообщение. Пользовательский ввод состава , 110, также включает пользовательский ввод для предоставления адресов сообщения получателя в одном или нескольких полях адреса сообщения, и пользовательский ввод для предоставления текста и другого типографского содержимого в тело сообщения составляемого электронного сообщения.
В ходе составления электронного сообщения пользователь электронного устройства 100 может пожелать обратиться к одному или нескольким получателям по имени в теле сообщения, например, инициируя содержимое тела сообщения приветствием, которое включает одно или несколько имен получателей. Однако существует значительная вероятность того, что пользователь может неправильно написать имя предполагаемого получателя в теле сообщения, либо потому, что пользователь не знаком с именем (например, оно может не распространяться в культуре пользователя), оно может иметь несколько возможных написание (e.g., «Карл» против «Карл»), или это может иметь написание, очень похожее на другое слово. Для иллюстрации получателя электронного сообщения можно назвать «Gulprit», которое пользователь может непреднамеренно ввести как «Culprit» в теле сообщения из-за сходства их написания. Чтобы уменьшить или избежать ошибок написания имени получателя, по крайней мере, в одном варианте осуществления приложение обмена сообщениями , 102, обеспечивает автоматическую помощь в составлении имени получателя, идентифицируя имена кандидатов на основе контекста сообщения, а затем автономно способствуя правильному использованию имени в теле сообщения с помощью различной помощи пользователя. параметры, такие как параметр автозаполнения, параметр автозаполнения, параметр автозамены и т. д.
В одном варианте осуществления этой помощи в составлении имени получателя способствует различная информация, хранящаяся в электронном устройстве 100 . Такая информация может включать в себя, например, контекст сообщения , 112, самого сообщения. Этот контекст сообщения 112 может включать внутренний контекст сообщения, который представляет собой информацию в полях составляемого сообщения, такую как информация в полях адреса получателя сообщения, например, адреса электронной почты в полях «Кому:», «Копия:» и «Bcc:» адресные поля, имена или другая основанная на имени информация, уже присутствующая или впоследствии добавленная в тело сообщения, и т.п.Этот контекст сообщения 112 также может включать в себя внешний контекст сообщения, который представляет собой информацию, которая не получается напрямую из полей составляемого электронного сообщения, например, содержимое в другом приложении, которое инициировало составление электронного сообщения или контактную запись получатель, к которому осуществляется косвенный доступ с использованием некоторой информации из внутреннего контекста сообщения.
Приложение обмена сообщениями 102 может использовать этот контекст сообщения 112 для идентификации одного или нескольких имен кандидатов (то есть имен, которые могут быть использованы пользователем при составлении тела сообщения) либо напрямую, например, путем создания имена кандидатов на основе синтаксического анализа частей адресов электронной почты, зависящих от получателя, в полях получателя или косвенно, например, путем определения идентификаторов получателя из полей сообщения и последующего использования этих идентификаторов, зависящих от получателя, для поиска соответствующего имени получателя, например, база данных контактов 114 хранится на электронном устройстве 100 .База данных контактов , 114, может включать, например, постоянный список контактов с записями контактов, которые были собраны приложением обмена сообщениями 102 или другим приложением, которое разрешило доступ к своей базе данных контактов, например, записи контактов Google, доступные в приложение Google Gmail ™, набор записей контактов, доступных в приложении Microsoft Outlook ™, или набор записей «друзей», доступных в учетной записи пользователя Facebook ™. Имена кандидатов, идентифицированные таким образом, могут быть сохранены во временной базе данных имен кандидатов , 116, , которая может быть списком, таблицей или другой структурой данных, реализованной, например, в пространстве памяти или дисковом пространстве, выделенном приложению обмена сообщениями 102 , и может сохраняться в течение всего времени составления электронного сообщения, в течение всего времени, пока приложение 102 обмена сообщениями работает или иным образом активно, и т.п.Ниже подробно описаны различные методы идентификации имен кандидатов.
Когда одно или несколько имен кандидатов идентифицированы и сохранены в базе данных имен кандидатов 116 , приложение обмена сообщениями 102 отслеживает ввод состава пользователя 110 для обнаружения любых потенциальных триггеров приветствия, которые могут включать в себя или быть связаны с Имя получателя. Такие триггеры приветствия могут включать в себя, например, ввод пользователя, указывающий на ввод типичного вступительного приветствия, например, когда пользователь вводит слово «Привет» или «Уважаемый» в начале тела сообщения.Более того, триггер приветствия может быть начальным вводом пользователем содержимого тела сообщения (то есть вводом первых нескольких букв или слова в теле сообщения), и, в частности, триггер приветствия может сработать, когда первые несколько буквы, набранные в теле сообщения, по существу совпадают с соответствующими начальными буквами идентифицированного имени кандидата. В ответ на обнаружение триггера приветствия приложение обмена сообщениями , 102, пытается помочь пользователю правильно составить имя получателя в теле сообщения.Как описано выше, эта помощь может предоставляться как графическое представление имени кандидата как часть одной или нескольких опций помощи пользователю, таких как опция автозаполнения, опция автозаполнения, опция автозамены и т.п.
Для иллюстрации на фиг. 1 изображен графический интерфейс составления сообщения 118 приложения обмена сообщениями 102 для составления сообщения электронной почты получателю с именем «Gulprit» на адрес электронной почты «[email protected]», как указано в поле адреса to: 120 сообщения электронной почты.Этот графический интерфейс составления сообщения , 118 иллюстрирует реализацию опции автозаполнения, посредством которой приложение обмена сообщениями 102 идентифицирует «Gulprit» как имя кандидата из адреса электронной почты «[email protected]» и в ответ на ввод пользователя, представляющий ввод слова «Hi» 130 в тело сообщения 122 сообщения электронной почты, приложение обмена сообщениями 102 предоставляет возможность автозаполнения для завершения приветствия, представляя выбираемую пользователем опцию 124 в графическом интерфейсе пользователя 118 , который предлагает графическое представление имени «Gulprit» в виде одной записи имени кандидата 126 , идентифицированной из контекста сообщения 112 , и графическое представление имени «Gillray» в качестве другой записи имени кандидата 128 , то есть идентифицированы, например, из предварительно определенного орфографического словаря, имеющего в качестве записи «Gillray».В то время как выбираемая пользователем опция 124 проиллюстрирована как графическое изображение списка выбираемых записей имени кандидата 126 , 128 , выбираемая пользователем опция 124 для автоматического предложения имен кандидатов может быть реализована в любом из разнообразие способов, согласующихся с изложенными здесь учениями. При отображении выбираемой пользователем опции 124 , предполагая, что пользователь намеревался обратиться к Gulprit в теле сообщения 122 , пользователь может выбрать запись имени кандидата «Gulprit» 126 из выбираемой пользователем опции 124 , в ответ на которое приложение обмена сообщениями 102 подставляет имя «Gulprit» в текущее положение курсора в теле сообщения 122 .Таким образом, имя получателя «Gulprit» правильно вводится в тело сообщения 122 и исключается возможность ошибки пользователя при самостоятельном вводе имени «Gulprit».
РИС. 2, 3 и 4 иллюстрируют другие варианты помощи при автоматическом составлении имени получателя, которые могут быть предоставлены приложением обмена сообщениями 102 электронного устройства 100 на фиг. 1 в связи с составлением электронного сообщения. Например, фиг. 2 иллюстрирует графический интерфейс 218 составления сообщений, который предоставляется приложением обмена сообщениями 102 и который предоставляет возможность автозаполнения для помощи в составлении имен.Для опции автозаполнения приложение обмена сообщениями 102 отслеживает ввод композиции пользователя 110 (фиг.1) для обнаружения пользовательского ввода, представляющего ввод или другой ввод начального набора букв слова в теле сообщения 222 GUI составления сообщений 218 . В случае, если начальный набор букв совпадает с соответствующим начальным набором букв имени кандидата, идентифицированного из контекста сообщения 112 составляемого электронного сообщения, приложение обмена сообщениями 102 предоставляет графическое представление имени кандидата через параметр автозаполнения 224 , который представляет собой предлагаемое завершение слова в теле сообщения 222 .
В этом примере имя кандидата «Gulprit» идентифицируется из адреса электронной почты «[email protected]» в поле адреса «Кому» 220 . Для опции автозаполнения 224 , когда пользователь вводит приветственный триггер «Hi», за которым следует пробел, а затем три начальные буквы «Gul» слова 225 после приветственного триггера, приложение обмена сообщениями 102 идентифицирует этот начальный набор букв слова 225 в качестве достаточного совпадения с именем кандидата «Gulprit» и, таким образом, автоматически дополняет слово 225 в качестве имени кандидата «Gulprit».Как показано, это автозаполнение может включать, например, автоматическое введение оставшихся букв «prit» имени кандидата «Gulprit» в тело сообщения 222 после начальных букв «Gul» и предоставление некоторого индикатора того, что эти последние буквы 226 заполняются автоматически, например, с использованием текста другого цвета, подчеркивания и т.п. Если имя с автозаполнением — это слово, которое пользователь намеревался ввести, пользователь может указать свое согласие на автозаполнение, например, выбрав полосу «пробел» на клавиатуре или нажав кнопку «принять» или другую функцию принятия (не показано ), связанный с опцией автозаполнения 224 в графическом интерфейсе составления сообщений 218 .
РИС. 3 иллюстрирует графический интерфейс 318 составления сообщения, который предоставляется приложением обмена сообщениями 102 и который предоставляет возможность автозамены. Для этого подхода к помощи в составлении имени получателя приложение обмена сообщениями 102 предоставляет опцию автозамены 324 для замены слова с идентифицированным именем кандидата после того, как слово уже было набрано и заполнено в теле сообщения 322 . Таким образом, приложение обмена сообщениями , 102, идентифицирует завершенное слово в теле сообщения 322 как потенциально представляющее имя получателя и проверяет, соответствует ли слово имени кандидата, идентифицированному для имени получателя.Если слово недостаточно соответствует имени кандидата, приложение обмена сообщениями 102 может отображать параметр автозамены 324 в графическом интерфейсе пользователя 318 , чтобы предоставить пользователю возможность заменить слово на имя кандидата, графически представленное в опция автозамены 324 . В изображенном примере опция автозамены 324 включает в себя диалоговое окно, которое предлагает пользователю возможность заменить слово «Culprit» в теле сообщения на имя кандидата «Gulprit», идентифицированное из адреса электронной почты в адресе to: поле 320 .В этом примере слово «Culprit» может быть идентифицировано как потенциально неправильно набранное имя получателя, например, из-за того, что оно следует сразу после триггера приветствия «Привет», написано с заглавной буквы, но не является первым словом предложения, или потому что оно в основном совпадает с названием «Gulprit».
Приложение обмена сообщениями 102 может анализировать тело создаваемого электронного сообщения на предмет возможности представить параметр автозамены в одной или нескольких точках процесса составления сообщения.В примере на фиг. 3, адрес обмена сообщениями получателя (например, «[email protected]») уже был введен в поле адреса сообщения получателя электронного сообщения, составляемого в момент начала составления тела сообщения, и, таким образом, приложение обмена сообщениями 102 может использовать этот адрес обмена сообщениями получателя для определения одного или нескольких имен кандидатов для опции автозамены. Таким образом, когда сигнализируется завершение потенциального слова имени в теле сообщения (например, когда пользователь вводит символ «пробел» или другой символ пробела после слова), приложение обмена сообщениями 102 может проверить слово в то время завершения.Однако в некоторых случаях пользователь может инициировать составление тела сообщения до заполнения любого из полей получателя электронного сообщения, и, таким образом, может быть недостаточно контекста сообщения для приложения обмена сообщениями 102 , чтобы идентифицировать имя кандидата в время написания сообщения. Соответственно, в других случаях анализ тела сообщения для одного или нескольких потенциальных слов для автозамены имени может быть отложен до тех пор, пока пользователь не введет информацию о получателе.
РИС. 4 иллюстрирует пример процесса задержки опции автозамены до тех пор, пока составление сообщения не будет по существу завершено. В этом примере снимок экрана 400 иллюстрирует состояние графического пользовательского интерфейса составления сообщения 418 после того, как пользователь ввел сообщение в тело сообщения 422 , но до заполнения любого из полей адреса сообщения получателя графического интерфейса составления сообщения. 418 . В сообщении, введенном пользователем, имя «Gulprit» с ошибкой отображается как «Culprit».Однако, поскольку поля адреса сообщения получателя еще не заполнены на этом этапе, приложение обмена сообщениями 102 может быть не в состоянии идентифицировать ошибку, потому что имена кандидатов не могут быть идентифицированы, а «Culprit» — это правильно написанное слово. , и, следовательно, не будет обнаружен с помощью стандартного процесса проверки орфографии с предопределенным орфографическим словарем. Напротив, снимок экрана 402 иллюстрирует графический интерфейс составления сообщения 418 после того, как пользователь заполнил поле адреса 420 с псевдонимом «Gulprit» (которое приложение обмена сообщениями 102 считает соответствующим «gulprit @» Gmail.com »в этом примере), и пользователь указал, что составление сообщения электронной почты было завершено, например, инициируя передачу сообщения электронной почты, выбрав значок« отправить » 423 графического интерфейса пользователя 418 составления сообщения.
В ответ на это указание на то, что составление завершено, приложение обмена сообщениями 102 может затем повторно оценить поля адреса сообщения получателя, чтобы определить, можно ли по ним определить имя кандидата. В этом случае приложение обмена сообщениями может идентифицировать имя кандидата «Gulprit» и, таким образом, при анализе тела сообщения 422 может идентифицировать слово «Culprit» потенциально как версию имени кандидата «Gulprit» с ошибкой и, таким образом, предоставить опция автозамены, такая как опция автозамены 324 на фиг. 3 , заменить «Culprit» на «Gulprit» в теле сообщения 422 . Таким образом, приложение обмена сообщениями , 102, может продолжать обновлять процесс помощи в составлении имен по мере того, как становится доступным дополнительный контекст сообщения.
РИС. 5 иллюстрирует примерный способ 500 работы приложения обмена сообщениями 102 электронного устройства 100 для предоставления помощи в составлении имени во время составления электронного сообщения в соответствии по меньшей мере с одним вариантом осуществления.Метод 500 запускается в блоке 502 , когда пользователь выполняет действие, чтобы инициировать составление электронного сообщения. Это действие может включать, например, ввод пользователя, указывающий инструкцию для приложения обмена сообщениями 102 , чтобы начать составление сообщения, например, путем выбора значка «составить сообщение» в графическом интерфейсе приложения обмена сообщениями 102 или в графическом интерфейсе пользователя ОС 108 (РИС. 1). В некоторых случаях составление электронного сообщения может быть инициировано косвенно.Чтобы проиллюстрировать, отдельное приложение может связывать или иным образом перенаправлять пользователя к приложению обмена сообщениями 102 для составления сообщения. Чтобы проиллюстрировать, веб-сайт, отображаемый в веб-браузере, может включать в себя ссылку, которая инициирует вызов интерфейса прикладного программирования (API) к приложению обмена сообщениями 102 , чтобы позволить пользователю составлять электронное сообщение, связанное с веб-сайтом (например, пересылка статьи на веб-сайте указанному получателю или пересылка сообщения получателю, связанному с веб-сайтом).
В ответ на этот инициирующий ввод в блоке 504 приложение обмена сообщениями 102 генерирует и отображает графический интерфейс составления сообщения, чтобы облегчить пользователю ввод для составления электронного сообщения. Графический интерфейс составления сообщения обычно включает в себя ряд полей, включая одно или несколько полей адреса сообщения получателя (например, поля адреса электронной почты для; cc: и bcc:) и одно или несколько полей тела сообщения, то есть поля адреса не получателя. (обратите внимание, что термин «тело сообщения» может включать, например, поле строки темы сообщения электронной почты, поскольку оно сродни заголовку сообщения).При отображении графического пользовательского интерфейса составления сообщения в блоке 506 начальный ввод состава пользователя принимается приложением обмена сообщениями 102 через графический интерфейс составления сообщения.
В некоторых случаях этот ввод начального состава пользователя может включать в себя предоставление пользователем псевдонимов адресов или неполных адресов сообщения получателя в одном или нескольких полях адреса сообщения получателя электронного сообщения. В таких случаях в блоке 508 приложение обмена сообщениями 102 идентифицирует полные или полные адреса сообщений получателя, используя функцию автозаполнения приложения обмена сообщениями 102 .Эта функция автозаполнения может, например, использовать псевдоним или частичный адрес сообщения получателя для выполнения поиска в базе данных контактов 114 (фиг. 1), чтобы идентифицировать полный адрес сообщения получателя.
На этапе , 510, приложение обмена сообщениями 102 подготавливается для поддержки процесса помощи в составлении имени получателя для электронного сообщения, составляемого путем определения внутреннего контекста сообщения, который может быть полезен при идентификации имен кандидатов.Этот внутренний контекст сообщения включает в себя контекст сообщения, определенный непосредственно из полей составляемого электронного сообщения, и, таким образом, может включать адреса сообщений получателей в полях адресов сообщений получателей электронного сообщения, имена файлов вложенных файлов, перечисленные в поле вложения, или содержимое. самих вложенных файлов и содержимого, уже присутствующего в поле тела сообщения, такого как любой исходный контент, составленный пользователем в теле сообщения, или электронное сообщение может включать в себя ответное сообщение или сообщение пересылки, и в этом случае тело сообщения может содержат содержание исходного электронного сообщения, служащего основой для ответа или переадресации сообщения.Это содержимое исходного электронного сообщения может включать, например, адреса получателей исходного электронного сообщения, а также одно или несколько имен получателей в поле тела сообщения.
В некоторых вариантах осуществления имена кандидатов также могут быть определены на основе внешнего контекста сообщения; то есть контекст сообщения, который непосредственно не идентифицируется полем составляемого электронного сообщения, и, таким образом, на этапе 512 приложение обмена сообщениями 102 определяет такой внешний контекст сообщения.Этот внешний контекст сообщения может включать в себя, например, определение имени получателя из базы данных контактов , 114, на основе поиска с использованием, по меньшей мере, части адреса сообщения получателя. Кроме того, поскольку составление электронного сообщения могло быть инициировано другим приложением (например, примером веб-сайта, описанным выше), внешний контекст сообщения может включать в себя контекстную информацию об этом другом приложении, такую как контент в приложении, связанный со ссылкой или другим источник создания электронного сообщения.
С определением одного или обоих из контекста внутреннего сообщения и внешнего контекста сообщения на этапе 514 приложение обмена сообщениями 102 идентифицирует одно или несколько имен кандидатов для электронного сообщения из внутреннего и внешнего контекста сообщения. Как более подробно описано ниже, идентификация этих имен кандидатов может включать в себя синтаксический анализ информации, относящейся к имени, во внутреннем контексте сообщения, поиск имен на основе специфической для получателя информации из контекста сообщения и т.п.Любые идентифицированные таким образом имена кандидатов могут быть сохранены во временной базе данных 116 имен кандидатов (фиг. 1), поддерживаемой приложением 102 обмена сообщениями для электронного сообщения.
Одновременно с процессом идентификации имени кандидата в блоке 516 приложение обмена сообщениями 102 отслеживает ввод исходной композиции пользователя для обнаружения триггера приветствия, который указывает, что пользователь может намереваться включить имя получателя в поле тела сообщения.Как отмечалось выше, этот триггер приветствия может включать в себя ввод слова, которое обычно служит частью приветствия в сообщении, например, ввод «Привет», «Привет», «Уважаемый» и т. Д. Вместо этого триггер приветствия может включать ввод по крайней мере части слова в области тела сообщения, обычно используемой для приветствия, такой как первое или два слова в теле сообщения или набор слов, расположенный в верхнем левом углу поля тела сообщения, или ввод начального набора букв, который соответствует соответствующему начальному набору букв имени кандидата.
В ответ на обнаружение триггера приветствия на этапе 518 приложение обмена сообщениями 102 выбирает имя кандидата (если существует более одного имени кандидата), которое может отражать имя получателя, к которому пользователь собирается или пытается к, вход в сочетании с триггером приветствия. Этот процесс выбора может включать применение одного или нескольких правил приоритизации. Например, правило приоритизации может предусматривать, что имена кандидатов, определенные из полей адреса сообщения получателя электронного сообщения, могут иметь приоритет выбора по сравнению с именами кандидатов, определенными из полей адреса не получателя, то есть полей тела сообщения.Кроме того, правило приоритизации может предусматривать, что имена кандидатов, определенные из поля to: address, могут иметь приоритет выбора по сравнению с именами кандидатов, определенными из поля cc: address, которые, в свою очередь, получают приоритет выбора над именами кандидатов, определенными из поля bcc: address и т. д. В ситуациях, когда триггер приветствия включает в себя ввод пользователем начального набора букв слова, которое, как ожидается, будет именем получателя, приоритет выбора среди нескольких имен кандидатов может быть отдан тому имени кандидата, которое наиболее близко соответствует начальному набору букв. .
С выбранным именем кандидата в блоке 520 приложение обмена сообщениями 102 может облегчить составление имени получателя, предоставляя через графический интерфейс составления сообщений один или оба варианта автозаполнения (например, фиг. 1) или автозаполнения. вариант (например, фиг. 2), который графически представляет имя кандидата пользователю для включения в тело электронного сообщения таким образом, чтобы предотвратить множество вероятных ошибок ввода пользователем для имени получателя. В случае, если параметр автозаполнения / вариант автозаполнения не принимается пользователем, или в случае, если ни один из вариантов не представлен, на этапе 522 приложение обмена сообщениями 102 продолжает отслеживать ввод композиции пользователя, чтобы определить, действительно ли пользователь завершил слово, предполагаемое пользователем как имя получателя, которое несовместимо с одним или несколькими идентифицированными именами кандидатов (например,g., не соответствует ни одному из идентифицированных имен кандидатов). Этот анализ может быть выполнен относительно быстро после того, как пользователь завершил ввод слова (например, после того, как после слова был введен пробел) или после того, как пользователь сигнализировал о завершении составления электронного сообщения, например, выбрав «сохранить »Или при попытке инициировать передачу электронного сообщения путем выбора значка« отправить ».
Если такое несоответствие имени кандидата / завершенного слова или несоответствие возникает в теле сообщения, то в блоке 524 приложение обмена сообщениями 102 может предоставить опцию автозамены (например.g., фиг. 3 и 4), чтобы уведомить пользователя о потенциальной ошибке и дать пользователю возможность исправить ошибку (если это ошибка), заменив вместо этого спорное слово предложенным именем кандидата. После внесения этого исправления или если такое исправление в первую очередь не требуется, на этапе 526 приложение обмена сообщениями 102 завершает составление электронного сообщения и отправляет электронное сообщение провайдеру обмена сообщениями 104 (фиг.1) для рассылки по одному или нескольким адресам обмена сообщениями получателя, указанным в полях адреса сообщения получателя электронного сообщения.
РИС. 6-10 иллюстрируют примерные методы, которые могут использоваться приложением обмена сообщениями 102 , OS 108 или другим компонентом электронного устройства 100 на фиг. 1 для идентификации одного или нескольких имен кандидатов из контекста сообщения 112 составляемого электронного сообщения. В частности, фиг.6-8 иллюстрируют методы, которые идентифицируют имена кандидатов из внутреннего контекста сообщения (то есть информации в полях самого сообщения), а фиг. 9 и 10 иллюстрируют методы, которые идентифицируют имена кандидатов из внешнего контекста сообщения (то есть контекста из внешних источников, к которому осуществляется доступ или который идентифицируется на основе внутреннего контекста сообщения).
РИС. 6 иллюстрирует методику идентификации одного или нескольких имен кандидатов из адресов сообщения получателя, присутствующих в полях адреса сообщения получателя электронного сообщения.В этом подходе синтаксический анализатор 600 приложения обмена сообщениями 102 обращается к зависящей от получателя части адреса сообщения получателя и анализирует вероятные слова имени из специфической для получателя части. Однако, поскольку имя получателя может включать в себя несколько слов, синтаксический анализатор , 600 дополнительно может генерировать различные комбинации слов имени, анализируемых из адреса сообщения получателя, для генерации нескольких имен кандидатов. Чтобы проиллюстрировать, в изображенном примере синтаксический анализатор , 600 обращается к адресу электронной почты получателя 602 (один из вариантов адреса сообщения получателя) из поля to: address или поля cc: address, или из включенного исходного сообщения электронной почты. в теле сообщения в случае, если составляемое сообщение электронной почты является ответным сообщением электронной почты или пересылаемым сообщением электронной почты.Адреса электронной почты обычно состоят из части, зависящей от получателя, за которой следует доменная часть с символом «@», разделяющим их. Таким образом, адрес электронной почты «[email protected]» включает в себя специфичную для получателя часть «gulprit.singh» и часть домена «gmail.com». Таким образом, синтаксический анализатор , 600 может анализировать специфичную для получателя часть, чтобы идентифицировать одно или несколько потенциальных слов имени, посредством чего синтаксический анализатор , 600 может использовать различные разделители общих слов имени, такие как точка («.»), Подчеркивание (« _ »), тире (« — ») и т.п. для обнаружения отдельных слов. Таким образом, для специфической для получателя части «gulprit.singh» адреса электронной почты получателя 602 синтаксический анализатор 600 может сгенерировать слова имени «gulprit» и «singh», и из комбинаций этих слов имени получить три имена кандидатов 604 , 606 , 608 — «Гулприт», «Сингх» и «Гулприт Сингх» соответственно. «Сингх Гулприт» также может быть разумным кандидатом на имя, если в системе адресации электронной почты принято ставить фамилию или фамилию первыми в адресе электронной почты.Затем синтаксический анализатор 600 может поместить эти имена кандидатов 604 , 606 и 608 в базу данных кандидатов 116 электронного устройства 100 для последующего использования при составлении имен, как описано выше. Этот процесс может быть аналогичным образом применен для анализа имен файлов, перечисленных в поле вложения электронного сообщения.
РИС. 7 иллюстрирует методику идентификации одного или более имен кандидатов из поля отображаемого имени, связанного с адресом сообщения получателя, присутствующим в полях адреса сообщения получателя электронного сообщения.Часто по соображениям безопасности или по другим причинам организация, предоставляющая услугу электронного обмена сообщениями своим составляющим, может решить использовать специфичную для получателя часть адреса сообщения получателя, которая, будучи уникальной для получателя, не отражает имени получателя. Такие конфигурации затрудняют идентификацию имен кандидатов непосредственно из адреса получателя сообщения, если не делают невозможным. Однако протоколы электронной почты и другие протоколы обмена сообщениями часто предоставляют одно или несколько полей идентификации пользователя, которые могут быть более полезными при идентификации получателя, чем адрес получателя сообщений.Для иллюстрации, протоколы электронной почты предусматривают включение поля отображаемого имени в ассоциации с адресом электронной почты получателя, где поле отображаемого имени хранит удобное для пользователя отображаемое имя. Синтаксический анализатор , 600, может использовать такие поля имени пользователя для идентификации одного или более имен кандидатов. В качестве примера, получатель составляемого сообщения электронной почты может быть указан в наборе полей получателя электронной почты 702 , который включает в себя поле адреса электронной почты 704 , в котором хранится адрес электронной почты «A100269 @ motorola».com »и поле отображаемого имени 706 , в котором хранится отображаемое имя« Gulprit Singh ». Специфическая для получателя часть адреса электронной почты «A100269» не содержит никакой полезной информации для прямой идентификации одного или нескольких слов имени, и, таким образом, синтаксический анализатор 600 вместо этого может проанализировать отображаемое имя «Gulprit Singh» в поле отображаемого имени . 706 для определения одного или нескольких имен кандидатов. Как и в примере на фиг. 6, анализ этого отображаемого имени может привести к именам кандидатов 604 , 606 , 608 — «Gulprit», «Singh» и «Gulprit Singh», соответственно, которые хранятся в базе данных имен кандидатов 116 для использования в составлении имен приложением обмена сообщениями 102 .
РИС. 8 иллюстрирует метод идентификации одного или более имен кандидатов из поля тела электронного сообщения. Часто при составлении электронного сообщения поле тела сообщения может содержать контент, который включает в себя или иным образом идентифицирует, по меньшей мере, часть имени одного или нескольких получателей электронного сообщения. Чтобы проиллюстрировать, электронное сообщение может быть ответом на предыдущее электронное сообщение или может пересылать предыдущее электронное сообщение другому получателю.В таких случаях одно или несколько полей тела сообщения и полей адреса сообщения получателя предыдущего электронного сообщения могут быть включены в поле тела сообщения составляемого электронного сообщения. Таким образом, поле тела сообщения может включать в себя адреса получателей сообщения получателей предыдущего электронного сообщения, отображаемые имена, связанные с адресами сообщений получателей, или другие ссылки на вероятных получателей, такие как строка подписи, включенная отправителем предыдущего электронного сообщения. электронное сообщение в теле сообщения предыдущего электронного сообщения.Таким образом, синтаксический анализатор , 600 может анализировать поле тела электронного сообщения в таких случаях, чтобы идентифицировать одно или несколько имен кандидатов.
Чтобы проиллюстрировать, пример на фиг. 8 изображает поле 802 тела сообщения составляемого ответного сообщения электронной почты, при этом поле 802 тела сообщения включает в себя содержимое 804 исходного сообщения электронной почты. Это содержимое 804 включает строку подписи 806 отправителя исходного сообщения.Таким образом, синтаксический анализатор , 600, может анализировать контент , 804, , чтобы идентифицировать строку подписи , 806, , используя любой из множества методов синтаксического анализа, а затем анализировать строку подписи , 806, для идентификации потенциальных слов имени. Этот синтаксический анализ может включать в себя, например, отбрасывание или игнорирование слов, предварительно идентифицированных, например, в словаре синтаксического анализа (не показан) как не указывающие имена получателей. При анализе проиллюстрированной строки подписи 806 анализатор 600 проигнорирует слова «CTO», «Motorola», «Mobility» и «Inc.», И таким образом получаем именные слова« Pathy »и« Sunil »как именные слова. Из комбинаций этих именных слов синтаксический анализатор 600 может сгенерировать, например, имена кандидатов 808 , 810 , 812 — «Pathy», «Sunil» и «Pathy Sunil» соответственно, и сохранить этих кандидатов. имена 808 , 810 , 812 в базе данных кандидатов для использования при составлении имен приложением обмена сообщениями 102 . Этот процесс может быть аналогичным образом применен к синтаксическому анализу содержимого файлов, перечисленных как вложения в поле вложения электронного сообщения.
РИС. 9 иллюстрирует метод косвенной идентификации одного или нескольких имен кандидатов с использованием базы данных контактов , 114, (фиг. 1), хранящейся в электронном устройстве , 100, . Как отмечалось выше, адрес сообщения получателя может не содержать информацию, полезную для прямой идентификации имен кандидатов, и может не быть отображаемого имени или другого удобного для пользователя поля именования, связанного с адресом сообщения получателя. Однако пользователь мог ранее иметь дело с получателем, связанным с адресом сообщения получателя, и, таким образом, может иметь контактную запись для получателя в базе данных контактов , 114, .Эта контактная запись может включать в себя различную информацию о получателе, такую как имя получателя, должность, работодатель, адрес, номер телефона и различные адреса электронных сообщений для получателя. Соответственно, в таких случаях приложение обмена сообщениями 102 или другой компонент электронного устройства 100 на фиг. 1 может использовать модуль поиска контактов для идентификации записи контакта, связанной с контекстом сообщения, идентифицированного в одном или нескольких полях составляемого электронного сообщения, и из этой записи контакта косвенно идентифицировать одно или несколько имен кандидатов.
Для иллюстрации, в изображенном примере единственной информацией, идентифицирующей получателя создаваемого сообщения электронной почты, является адрес электронной почты 902 , который имеет специфичную для получателя часть «A100269», которая не отражает имя получателя, связанного с электронный адрес 902 . Соответственно, модуль поиска контактов , 900, может использовать эту специфичную для получателя часть для поиска в базе данных контактов 114 записи контакта, которая имеет поле, которое соответствует специфической для получателя части «A100269».В этом примере база данных контактов , 114, имеет соответствующую запись контакта, связанную с человеком по имени «Гулприт Сингх», и, таким образом, модуль поиска контактов 900 может анализировать поля имени в этой совпадающей записи контакта, чтобы идентифицировать имя. слово 904 слова «Gulprit» и слово фамилии 906 слова Singh. Модуль поиска контактов 900 может затем сохранить эти слова имен 904 , 906 в базе данных имен кандидатов 116 , после чего синтаксический анализатор 600 (РИС.6) затем объединяет слова имени в различные имена кандидатов «Gulprit», «Singh» и «Gulprit Singh», или модуль поиска контактов 900 может сгенерировать эти имена кандидатов непосредственно перед сохранением их в базе данных имен кандидатов 116 . Таким образом, как показано в этом примере, модуль поиска контактов 900 использует внутренний контекст сообщения, а именно адрес электронной почты получателя 902 , для косвенной идентификации одного или нескольких имен кандидатов через внешний контекст сообщения, а именно контактную запись в базе данных контактов . 114 .
РИС. 10 иллюстрирует метод косвенной идентификации одного или нескольких имен кандидатов с использованием читаемого пользователем контента приложения, из которого было инициировано составление электронного сообщения. Веб-браузеры, приложения социальных сетей и другие подобные приложения часто имеют возможность запускать или инициировать составление электронного сообщения. Для иллюстрации веб-браузер может отображать новостной веб-сайт, имеющий ссылку, которая, при выборе пользователем, связывается с приложением обмена сообщениями 102 , чтобы инициировать составление электронного сообщения, которое, например, используется для пересылки связанной новостной статьи на получатель.Сами по себе другие электронные сообщения могут иметь такие ссылки, которые запускают составление электронного сообщения. В таких случаях, с учетом того, что имя получателя часто находится в непосредственной близости от ссылки или другой функции в содержимом приложения, приложение, которое запускает составление электронного сообщения, может иметь читаемый пользователем контент, который может служить основа для идентификации одного или нескольких возможных имен получателя электронного сообщения. Таким образом, синтаксический анализатор , 600, может анализировать этот читаемый пользователем контент другого приложения, чтобы идентифицировать одно или несколько имен кандидатов.
Чтобы проиллюстрировать, в изображенном примере веб-страница, отображаемая веб-браузером, включает в себя читаемый пользователем контент 1002 , который включает текст, инструктирующий представление сделать резервирование на мероприятие, связавшись с «Хэ Юн Ким» по указанному адресу электронной почты «HYK1032» @ gmail.com », и при этом текст адреса электронной почты служит гипертекстовой ссылкой, которая при выборе пользователем через веб-браузер заставляет веб-браузер связываться с приложением обмена сообщениями 102 , чтобы инициировать составление адресованного электронного сообщения. на «HYK1032 @ gmail.com ». Поскольку с этого адреса электронной почты невозможно проанализировать полезные имена кандидатов, синтаксический анализатор 600 вместо этого может анализировать читаемое пользователем содержимое веб-страницы в непосредственной близости от гипертекстовой ссылки, чтобы идентифицировать одно или несколько имен кандидатов. В этом примере этот текст рядом включает фразу 1003 «Чтобы ответить на приглашение на мероприятие, пожалуйста, свяжитесь с Хэ Юн Ким по адресу [email protected]», которую синтаксический анализатор 600 может проанализировать, чтобы идентифицировать слова имени «Hae , »« Юн »и« Ким », и которые могут быть объединены, например, в имена кандидатов 1004 , 1006 , 1008 и 1010 -« Хэ »,« Юн »,« Хэ Юн »и« Ким », соответственно, и хранятся в базе данных имен кандидатов 116 .
Следует принять во внимание, что приложение, из которого было инициировано электронное сообщение, может быть отдельным от приложения обмена сообщениями 102 . В таких случаях синтаксический анализатор , 600, может быть реализован вне приложения обмена сообщениями , 102, , например, в другом приложении или в ОС 108 , чтобы иметь возможность доступа к контенту другого приложения. В качестве альтернативы, синтаксический анализатор , 600, может быть реализован как часть приложения обмена сообщениями , 102, , а читаемый пользователем контент другого приложения может быть передан синтаксическому анализатору , 600 как часть запроса на инициирование создания электронного сообщение.Например, вызов API, сделанный другим приложением в ответ на выбор гипертекстовой ссылки зрителем, может включать в себя унифицированный указатель ресурса (URL) веб-страницы, на которой находится читаемый пользователем контент, и синтаксический анализатор 600 , таким образом может использовать этот URL-адрес для доступа к веб-странице и анализа ее содержимого для идентификации слова имени.
РИС. 11 иллюстрирует пример реализации электронного устройства 100 по фиг. 1 в соответствии, по меньшей мере, с одним вариантом осуществления настоящего раскрытия.В изображенном примере электронное устройство 100 включает в себя по меньшей мере один процессор 1102 (например, центральное устройство обработки или ЦП), один или несколько энергонезависимых машиночитаемых носителей, таких как системная память 1104 или другой запоминающее устройство 1106 (например, флэш-память, оптический или магнитный диск, твердотельный жесткий диск и т. д.), сетевой интерфейс 1108 (например, интерфейс беспроводной локальной сети (WAN) или проводной интерфейс Ethernet), и пользовательский интерфейс (UI) 1110 , подключенный через одну или несколько шин 1112 или другие межсоединения.UI 1110 включает в себя, например, устройство отображения 1114 и клавиатуру или сенсорный экран 1116 , а также другие компоненты ввода / вывода 1118 , такие как динамик или микрофон, для приема ввода от или предоставить информацию пользователю.
Процессор 1102 выполняет набор исполняемых инструкций, хранящихся на машиночитаемом носителе данных, таком как системная память 1104 или флэш-память, при этом набор исполняемых инструкций представляет одно или несколько программных приложений 1120 , например как приложение обмена сообщениями 102 на фиг.1. Программные приложения , 1120, при выполнении манипулируют процессором , 1102, для выполнения различных программных функций для реализации по крайней мере части описанных выше методов, предоставляют визуальную информацию через устройство отображения , 1114, , реагируют на пользовательский ввод через сенсорный экран 1116 и т.п. Таким образом, большая часть изобретательских функциональных возможностей и многие из изобретательских принципов, описанных выше, хорошо подходят для реализации с программными программами или в них.Ожидается, что специалист с обычной квалификацией, несмотря на возможные значительные усилия и множество вариантов дизайна, мотивированных, например, доступным временем, текущими технологиями и экономическими соображениями, руководствуясь концепциями и принципами, раскрытыми в данном документе, легко сможет создать такое программное обеспечение. инструкции и программы минимальные эксперименты. Следовательно, в интересах краткости и минимизации любого риска затруднения понимания принципов и концепций в соответствии с настоящим раскрытием, дальнейшее обсуждение такого программного обеспечения, если таковое имеется, будет ограничено основополагающим в отношении принципов и концепций в предпочтительных вариантах осуществления. .
В этом документе относительные термины, такие как первый, второй и т.п., могут использоваться исключительно для того, чтобы отличать один объект или действие от другого объекта или действия, не обязательно требуя или подразумевая какие-либо фактические отношения или порядок между такими объектами или действиями. Термины «содержит», «содержащий» или любые другие их варианты предназначены для охвата неисключительного включения, так что процесс, метод, изделие или устройство, которые содержат список элементов, включают не только эти элементы, но может включать другие элементы, не указанные в явном виде или не присущие такому процессу, методу, изделию или устройству.Элемент, которому предшествует «содержит. . . a »не исключает, без дополнительных ограничений, наличие дополнительных идентичных элементов в процессе, способе, изделии или аппарате, которые составляют элемент. Термин «другой», используемый здесь, определяется как по меньшей мере второй или более. Термины «включающий» и / или «имеющий» в контексте настоящего описания определены как содержащие. Термин «связанный», используемый здесь в отношении электрооптической технологии, определяется как связанный, хотя и не обязательно напрямую, и не обязательно механически.Используемый здесь термин «программа» определяется как последовательность инструкций, предназначенных для выполнения в компьютерной системе. «Программа» или «компьютерная программа» может включать в себя подпрограмму, функцию, процедуру, объектный метод, реализацию объекта, исполняемое приложение, апплет, сервлет, исходный код, объектный код, совместно используемый библиотека / библиотека динамической загрузки и / или другая последовательность инструкций, предназначенная для выполнения в компьютерной системе.
Описание и чертежи следует рассматривать только как примеры, и объем раскрытия, соответственно, предназначен для ограничения только следующей формулой изобретения и ее эквивалентами.Обратите внимание, что не все действия или элементы, описанные выше в общем описании, являются обязательными, что часть определенного действия или устройства может не требоваться, и что одно или несколько дополнительных действий могут быть выполнены или элементы включены в дополнение к те, что описаны. Более того, порядок, в котором перечислены действия, не обязательно является порядком, в котором они выполняются. Шаги блок-схем, изображенных выше, могут быть в любом порядке, если не указано иное, и шаги могут быть исключены, повторены и / или добавлены, в зависимости от реализации.Кроме того, концепции были описаны со ссылкой на конкретные варианты осуществления. Однако специалист в данной области техники понимает, что различные модификации и изменения могут быть выполнены без выхода за пределы объема настоящего раскрытия, изложенного в формуле изобретения ниже. Соответственно, описание и фигуры следует рассматривать в иллюстративном, а не ограничительном смысле, и все такие модификации предназначены для включения в объем настоящего раскрытия.
Выгоды, другие преимущества и решения проблем были описаны выше в отношении конкретных вариантов осуществления.Тем не менее, выгоды, преимущества, решения проблем и любые особенности, которые могут привести к появлению каких-либо преимуществ, преимуществ или решений или стать более выраженными, не должны рассматриваться как критические, обязательные или существенные особенности любого или все претензии.
(PDF) Разбор нормальной формы для категориальных категориальных грамматик с обобщенной композицией и набором текста.
Ссылки
Боксвелл, Стивен, Деннис Мехей и Крис Брю.
2009. Brutus: Система обозначения семантических ролей в
, объединяющая функции CCG, CFG и зависимостей.
In Proceedings of the 47thACL / 4th IJCNLP, pages
37–45.
Кларк, Стивен и Джеймс Р. Карран. 2007. Эффективный статистический анализ с широким охватом
с CCG
и лог-линейными моделями. Компьютерная лингвистика,
33 (4): 493–552.
Карран, Джеймс, Стивен Кларк и Йохан Бос.
2007. Лингвистически мотивированное крупномасштабное НЛП
с C&C и боксером. In Proceedings of the 45th
ACL Companion Volume (Demo and Poster Ses-
ses), страницы 33–36, Прага, Чешская Республика.
Эйснер, Джейсон. 1996. Эффективный анализ нормальной формы —
для комбинаторной категориальной грамматики. В Pro-
заседаний 34-й ACL, страницы 79–86, Santa
Cruz, CA.
Эспиноза, Доминик, Майкл Уайт и Деннис
Мехей. 2008. Hypertagging: Supertagging для реализации поверхности
с CCG. In Proceedings of
ACL-08: HLT, pages 183–191, Columbus, Ohio.
Гильдеа, Даниэль и Джулия Хоккенмайер. 2003. Идентификация —
семантических ролей с использованием Combinatory Catego —
риальной грамматики.В материалах EMNLP, Sap-
poro, Япония.
Хеппл, Марк и Глин Моррилл. 1989. Анализ
и деривационная эквивалентность. In Proceedings of the
Fourth EACL, pages 10–18, Manchester, UK.
Хокенмайер, Джулия и Марк Стидман. 2007.
CCGbank: Корпус производных CCG и зависимых структур
, извлеченных из вымпельного дерева —
банк. Компьютерная лингвистика, 33 (3): 355–396.
Хоккенмайер, Юлия.2003. Данные и модели для статистического анализа
с комбинаторно-категориальной грамматикой
. Кандидат наук. докторская диссертация, Школа информатики,
Эдинбургский университет.
Хоффман, Берил. 1995. Вычислительный анализ
синтаксиса и интерпретации «свободного» порядка слов
на турецком языке. Кандидат наук. кандидатская диссертация, Университет Пенсыльвы —
ния. Отчет IRCS 95-17.
Хойт, Фредерик и Джейсон Болдриджи. 2008. Логарифмический базис для комбинатора D и нормальная форма
в CCG.В Proceedings of ACL-08: HLT, pages
326–334, Колумбус, Огайо.
Карттунен, Лаури. 1989. Радикальный лексикализм. В
Балтин М.Р. и А.С. Крох, редакторы, Альтернатива
Концепции структуры фраз. Чикагский университет —
sity Press, Чикаго.
Koehn, Philipp. 2005. Europarl: параллельный корпус
pus для статистического машинного перевода. В 10-м Саммите MT
, страницы 79–86, Пхукет, Таиланд.
Комагата, Нобо.1997. Генерирующая мощность
ПГУ с обобщенными типо-повышенными категориями. В
ACL35 / EACL8 (Студенческая сессия), страницы 513–515.
Комагата, Нобо. 2004. Решение проблемы ложной неоднозначности
для практических комбинаторных синтаксических анализаторов грамматики. Компьютерная речь и язык —
, 18 (1): 91 — 103.
Нив, Майкл. 1994. Психолингвистически мотивированный парсер для CCG. In Proceedings of The 32nd
ACL, Las Cruces, NM, pages 125–132.
Парески, Ремо и Марк Стидман. 1987. Ленивый
способ разбора диаграмм с категориальной грамматикой. In
Proceedings of the 25th ACL, pages 81–88, Stan-
ford, CA.
Шибер, Стюарт М., Ив Шабес и Фернандо
К. Н. Перейра. 1995. Принципы и реализация —
дедуктивного синтаксического анализа. Журнал Logic Pro —
,граммов, 24 (1–2): 3–36, июль – август.
Стидман, Марк. 2000. Синтаксический процесс. MIT
Press, Кембридж, Массачусетс.
Виджай-Шанкер, К. и Дэвид Дж. Вейр. 1993. Разбор
некоторых формализмов ограниченной грамматики. Компьютерная лингвистика,
, 19 (4): 591–636.
Уир, Дэвид. 1988. Характеризуя мягко контекст —
чувствительных грамматических формализмов. Кандидат наук. диссертация, Университет
, Пенсильвания. Tech. Отчет CIS-88-74.
Виттенбург, Кент Б. 1986. Анализ естественного языка —
с комбинационной категориальной грамматикой в формализме на основе графической унификации
.Доктор философии —
сестренка, Техасский университет в Остине.
Зеттлемойер, Люк С. и Майкл Коллинз. 2005.
Обучение отображению предложений в логическую форму: Структурная классификация
с вероятностно-категориальной
грамматиками. In Proceedings of the 21st UAI, pages
658–666, Эдинбург, Великобритания.
Зеттлемойер, Люк и Майкл Коллинз. 2007. On-
строковое изучение расслабленных грамматик CCG для пар-
ингтологической формы. InProceedings of EMNLP-
CoNLL, страницы 678–687, Прага, Чешская Республика.
Благодарности
Мы хотели бы поблагодарить Марка Стидмана за полезные обсуждения и Джейсона Эйснера за его очень щедрые
отзывы, которые помогли значительно улучшить
этой статьи. За все оставшиеся ошибки и упущения мы несем ответственность. J.H поддерживается
грантом NSF IIS 08-03603 INT2-Medium.
синтаксических ядер в разборе зависимостей — многоязычное исследование
@inproceedings {basirat-nivre-2021-syntactic, title = "Синтаксические ядра в разборе зависимостей {-} Многоязычное исследование", author = "Басират, Али и Нивр, Иоаким ", booktitle = "Труды 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: основной том", месяц = апр, год = "2021", address = "Онлайн", publisher = "Ассоциация компьютерной лингвистики", url = "https: // аклантология.org / 2021.eacl-main.117 ", pages = "1376--1387", abstract = "Стандартные модели синтаксического анализа зависимостей принимают слова за элементарные единицы, которые вступают в отношения зависимости. В этой статье мы исследуем, есть ли какие-либо преимущества от обогащения этих моделей более абстрактным понятием ядра, предложенным Тесни {\` e} re. Мы делаем это, показывая, как понятие ядра может быть определено в рамках универсальных зависимостей и как мы можем использовать функции композиции, чтобы сделать синтаксический анализатор зависимостей на основе переходов осведомленным об этой концепции.Эксперименты на 12 языках показывают, что состав ядра дает небольшие, но значительные улучшения в точности синтаксического анализа. Дальнейший анализ показывает, что улучшение в основном касается небольшого числа отношений зависимости, включая номинальные модификаторы, отношения координации, основные предикаты и прямые объекты. ", }
Xml version = "1.0" encoding = "UTF-8"?><моды> Синтаксические ядра в разборе зависимостей - многоязычное исследование Али Базират <роль>автор Иоаким Нивр <роль>автор 2021-апр текст Труды 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: основной том Ассоциация компьютерной лингвистики <место>В сети публикация конференции Стандартные модели синтаксического анализа зависимостей принимают слова как элементарные единицы, которые вступают в отношения зависимости.В этой статье мы исследуем, есть ли какие-либо преимущества от обогащения этих моделей более абстрактным понятием ядра, предложенным Теснером. Мы делаем это, показывая, как понятие ядра может быть определено в рамках универсальных зависимостей и как мы можем использовать функции композиции, чтобы сделать синтаксический анализатор зависимостей на основе переходов осведомленным об этой концепции. Эксперименты на 12 языках показывают, что состав ядра дает небольшие, но значительные улучшения в точности синтаксического анализа. Дальнейший анализ показывает, что улучшение в основном касается небольшого числа отношений зависимости, включая номинальные модификаторы, отношения координации, основные предикаты и прямые объекты. basirat-nivre-2021-syntactic <местоположение>https://aclanthology.org/2021.eacl-main.117 2021-апр 1376 1387
% 0 Материалы конференции Синтаксические ядра% T при разборе зависимостей - многоязычное исследование % А Басират, Али % A Nivre, Иоаким % S Труды 16-й конференции Европейского отделения Ассоциации компьютерной лингвистики: основной том % D 2021 г. % 8 апр % I Ассоциация компьютерной лингвистики % C в сети % F basirat-nivre-2021-синтаксис % X Стандартные модели синтаксического анализа зависимостей принимают слова за элементарные единицы, которые вступают в отношения зависимости.В этой статье мы исследуем, есть ли какие-либо преимущества от обогащения этих моделей более абстрактным понятием ядра, предложенным Теснером. Мы делаем это, показывая, как понятие ядра может быть определено в рамках универсальных зависимостей и как мы можем использовать функции композиции, чтобы сделать синтаксический анализатор зависимостей на основе переходов осведомленным об этой концепции. Эксперименты на 12 языках показывают, что состав ядра дает небольшие, но значительные улучшения в точности синтаксического анализа. Дальнейший анализ показывает, что улучшение в основном касается небольшого числа отношений зависимости, включая номинальные модификаторы, отношения координации, основные предикаты и прямые объекты.% U https://aclanthology.org/2021.eacl-main.117 % П 1376-1387
% PDF-1.4 % 53 0 объект > эндобдж xref 53 118 0000000016 00000 н. 0000002726 00000 н. 0000002839 00000 н. 0000002991 00000 н. 0000003637 00000 н. 0000004231 00000 п. 0000004271 00000 н. 0000004300 00000 н. 0000004884 00000 н. 0000005177 00000 н. 0000005545 00000 н. 0000005977 00000 н. 0000014595 00000 п. 0000015124 00000 п. 0000022881 00000 п. 0000022930 00000 п. 0000023363 00000 п. 0000023676 00000 п. 0000024179 00000 п. 0000037112 00000 п. 0000037496 00000 п. 0000037518 00000 п. 0000039399 00000 н. 0000039421 00000 п. 0000039617 00000 п. 0000039787 00000 п. 0000040034 00000 п. 0000040188 00000 п. 0000040561 00000 п. 0000040743 00000 п. 0000040968 00000 п. 0000041136 00000 п. 0000041270 00000 п. 0000041507 00000 п. 0000041558 00000 п. 0000041812 00000 п. 0000042013 00000 н. 0000042245 00000 п. 0000043982 00000 п. 0000044004 00000 п. 0000044266 00000 п. 0000044362 00000 п. 0000044593 00000 п. 0000044644 00000 п. 0000044839 00000 п. 0000045062 00000 п. 0000045152 00000 п. 0000045404 00000 п. 0000045605 00000 п. 0000045844 00000 п. 0000046014 00000 п. 0000046087 00000 п. 0000046139 00000 п. 0000046386 00000 п. 0000047220 00000 п. 0000047323 00000 п. 0000047376 00000 п. 0000047628 00000 п. 0000047680 00000 п. 0000047719 00000 п. 0000047922 00000 п. 0000048158 00000 п. 0000048448 00000 н. 0000048516 00000 н. 0000050317 00000 п. 0000050340 00000 п. 0000051709 00000 п. 0000051732 00000 п. 0000051979 00000 п. 0000052194 00000 п. 0000052465 00000 п. 0000052754 00000 п. 0000052951 00000 п. 0000053224 00000 п. 0000053492 00000 п. 0000053824 00000 п. 0000054199 00000 п. 0000054450 00000 п. 0000054670 00000 п. 0000054867 00000 п. 0000055122 00000 п. 0000055364 00000 п. 0000055631 00000 п. 0000055895 00000 п. 0000056127 00000 п. 0000056311 00000 п. 0000056458 00000 п. 0000056510 00000 п. 0000056689 00000 п. 0000056965 00000 п. 0000057138 00000 п. 0000057347 00000 п. 0000057571 00000 п. 0000057833 00000 п. 0000059544 00000 п. 0000059567 00000 п. 0000059672 00000 п. 0000059713 00000 п. 0000060044 00000 п. 0000063430 00000 п. 0000063769 00000 п. 0000064230 00000 п. 0000066054 00000 п. 0000066077 00000 п. 0000067727 00000 н. 0000067750 00000 п. 0000067791 00000 п. 0000067870 00000 п. 0000067940 00000 п. 0000070619 00000 п. 0000071862 00000 п. 0000074541 00000 п. 0000076049 00000 п. 0000076128 00000 п. 0000076335 00000 п. 0000076414 00000 п. 0000003053 00000 н. 0000003615 00000 н. трейлер ] >> startxref 0 %% EOF 54 0 объект > эндобдж 55 0 объект rV $.C} # [Ir : 2)] LXªiȧ: SKbꔾ ڑ «V Sd1 \ m`۴> 2Ak ߋ A’e. QT»
Написание сочинения о будущем
Каждая композиция имеет начала, , , середину, и конец . Середина, безусловно, самая длинная, но не менее важны начало и конец.
Если ваша композиция посвящена какой-то прогулке, не обязательно писать полстраницы о раннем вставании, завтраке, приготовлении обеденной корзины или вывозе машины из гаража. начало должно быть кратким, и нет причин, по которым композиция о прогулке, например, не должна начинаться с фактического места на пляже, в парке, зоопарке, гавани или где бы то ни было.
Точно так же , заканчивающееся , должно закончить Композицию быстро, четко и точно. Это не только завершает вашу историю, но часто может добавить тот «последний штрих», который отличает обычную композицию от хорошей.
Неожиданные концовки придают неожиданный поворот истории, и этот вид завершающего штриха часто используется в творческой композиции.Обычно он содержится не более чем в двух или трех предложениях, которые не длиннее, чем начальный абзац, который устанавливает сцену или приводит историю в движение.
средний Композиции составляет основную часть рассказа или описания и может состоять из трех или четырех абзацев. Он не должен содержать ничего, что не касается конкретной рассказываемой истории, и должен переходить от одного пункта к другому по мере того, как каждый происходит или описывается.
Чтобы избежать ошибок и использовать лучшие слова и фразы, каждое предложение следует тщательно продумать, прежде чем писать пером.Старайтесь не писать первое, что приходит вам в голову, но не ждите слишком долго, пока появятся идеи. Как только вы начнете, продолжайте, пока история не закончится. Не делайте фальстартов, вычеркивая или исключая и начиная все сначала.
Когда вы закончите сочинение, прочтите его до конца и посмотрите, как оно звучит для вас. Исправьте грамматические или пунктуационные ошибки. Не бойтесь использовать какое-либо громкое или незнакомое слово просто потому, что вы не можете его написать. Используйте свой словарь.
Перепишите свою Композицию после того, как вы ее закончили, где вы можете сказать что-то лучше. Вырежьте части, которые не нужны для вашего рассказа или описания.
Только написание множества Композиций поможет вам в этом преуспеть. Чтение и прослушивание рассказов, замечание в них хороших слов и фраз, их заимствование и использование некоторых хороших идей улучшат вашу способность писать сочинения.
Запомните свои абзацы.Несколько предложений составляют абзац, а несколько абзацев составляют композицию. Подобно тому, как предложение говорит вам определенную сумму и не более того, так и абзац. Когда достигается новая часть истории или описания, начинайте новый абзац.
ПРОШЛОЕ, НАСТОЯЩЕЕ ИЛИ БУДУЩЕЕ
Вот абзац о прошлом :
В прошлом году я ходил в школу каждый день. Я так регулярно посещал занятия, что получил за это сертификат. Я был не только постоянным, но и всегда пунктуальным, ни разу не опаздывая.Я гордился этим своим достижением.
Вот абзац о подарке :
Я люблю добираться до школы задолго до того, как прозвенит звонок, чтобы пойти в класс. Я могу поиграть со своими товарищами на детской площадке и пообщаться с ними перед началом уроков. Сейчас мы тренируемся со своими йо-йо и говорим о футболе и крикете в этом году.
Вот абзац о будущем :
В наступающем футбольном сезоне постараюсь попасть в школьную команду.Когда пройдут пробы, я буду настолько хорошо обучен, что у меня будут хорошие шансы на продажу товара
.действие. Я начну тренироваться еще до окончания сезона крикета. Сверчок закончится не раньше апреля или мая.
Если вы сложите эти три абзаца, вы получите Композицию, написанную о прошлом, настоящем и будущем. Любая композиция может включать в себя все эти периоды времени. С другой стороны, вы можете написать Композицию, которая все в прошлом, все в настоящем или все в будущем.
Даже в одном абзаце у вас могут быть предложения о разных временах, прошлом, настоящем или будущем. Но никогда не используйте более одного раза в одном предложении.
ПИСЬМО О БУДУЩЕМ
Помните, что ничего не произошло, и не происходит; они будут или может произойти , будет происходящим или происходящим, и так далее.
Каким будет мир через сто лет.
Пунктов:
- Больше всего — людей, домов, магазинов, автомобилей, заводов, ферм, плотин, электростанций и так далее.
- Различия в моде — одежда, прически, дизайн автомобилей, строительные конструкции — широкие дороги — надземные пешеходные переходы и пешеходные дорожки на уровне первого этажа высоких зданий в городах и т. Д.
- Новые города и предприятия в стране — новые ирригационные схемы, основанные на новых плотинах и каналах — новые гидроэлектрические системы — больше людей в деревне и более близкие сельскохозяйственные поселения.
- Развитие и продвижение [более бедных] стран [и]… увеличение торговли и путешествий между странами.
- То, что может привести к войне и спорам — вещи, которые могут привести к миру и соглашению — общение и переговоры, встречи и игры — богатые страны и бедные — образование, медицина, религии и верования.
Вот еще несколько тем, о которых вы можете писать:
- Что я планирую на следующий отпуск.
- Что сделает папа, если выиграет в лотерею.
- Что сделает мама на вечеринке.
- Что бы мы сделали, если бы пришла война.
Лейк, W.G. ок. 1965 г. Запланированная композиция, Книга 3. Сидней: Aidmasta Productions, стр. 3, 13, 18.
%! PS-Adobe-2.0 %% Создатель: dvipsk 5.55a Copyright 1986, 1994 Radical Eye Software %% Заголовок: eisner.acl96.dvi %% Страниц: 8 %% PageOrder: Ascend %% BoundingBox: 0 0 612 792 %% EndComments % DVIPSCommandLine: dvips eisner.acl96.dvi % DVIPSParameters: dpi = 300, сжато, комментарии удалены % DVIPS Источник: вывод TeX 2000.05.25: 1844 %% BeginProcSet: texc.профи / TeXDict 250 dict def Начало TeXDict / N {def} def / B {привязка def} N / S {exch} N / X {S N} B / TR {translate} N / isls false N / vsize 11 72 mul N / hsize 8,5 72 mul N / landplus90 {false} def / @ rigin {isls {[0 landplus90 {1 -1} {- 1 1} ifelse 0 0 0] concat} if 72 Разрешение div 72 VR Разрешение div neg масштаб isls {landplus90 {VResolution 72 div vsize mul 0 exch} {Разрешение -72 div hsize mul 0} ifelse TR}, если разрешение VResolution vsize -72 div 1 add mul TR [матрица currentmatrix {dup dup round sub abs 0.00001 lt {round} if} forall round exch round exch] setmatrix} N / @ landscape {/ isls true N} B / @ manualfeed {statusdict / manualfeed true put} B / @ копий {/ # копий X} B / FMat [1 0 0 -1 0 0] N / FBB [0 0 0 0] N / nn 0 N / IE 0 N / ctr 0 N / df-tail { / nn 8 dict N nn begin / FontType 3 N / FontMatrix fntrx N / FontBBox FBB N строка / базовый массив X / BitMaps X / BuildChar {CharBuilder} N / кодирование IE N end dup {/ foo setfont} 2 array copy cvx N load 0 nn put / ctr 0 N [} B / df { / sf 1 N / fntrx FMat N df-tail} B / dfs {div / sf X / fntrx [sf 0 0 sf neg 0 0] N df-tail} B / E {pop nn dup definefont setfont} B / ch-width {ch-data dup длина 5 sub get} B / ch-height {ch-data dup length 4 sub get} B / ch-xoff { 128 ch-data dup length 3 sub get sub} B / ch-yoff {ch-data dup length 2 sub получить 127 sub} B / ch-dx {ch-data dup length 1 sub get} B / ch-image {ch-data dup type / stringtype ne {ctr get / ctr ctr 1 add N} if} B / id 0 N / rw 0 N / rc 0 N / gp 0 N / cp 0 N / G 0 N / sf 0 N / CharBuilder {save 3 1 ролик S dup / base get 2 index get S / BitMaps get S get / ch-data X pop / ctr 0 N ch-dx 0 ch-xoff ch-yoff ch-height sub ch-xoff ch-width добавить ch-yoff setcachedevice ch-width ch-height true [1 0 0 -1 -.1 ч-хофф суб ч-йофф .1 sub] / id ch-image N / rw ch-width 7 добавить 8 idiv строка N / rc 0 N / gp 0 N / cp 0 N {rc 0 ne {rc 1 sub / rc X rw} {G} ifelse} восстановление маски изображения} B / G {{id gp get / gp gp 1 add N dup 18 mod S 18 idiv pl S get exec} loop} B / adv {cp add / cp X} B / chg {rw cp id gp 4 index getinterval putinterval dup gp add / gp X adv} B / nd {/ cp 0 N rw exit} B / lsh {rw cp 2 copy get dup 0 eq {pop 1} { dup 255 eq {pop 254} {dup dup add 255 и S 1 и или} ifelse} ifelse положить 1 adv} B / rsh {rw cp 2 copy get dup 0 eq {pop 128} {dup 255 eq {pop 127} {dup 2 idiv S 128 и or} ifelse} ifelse помещает 1 adv} B / clr {rw cp 2 index string putinterval adv} B / set {rw cp fillstr 0 4 index getinterval putinterval adv} B / fillstr 18 string 0 1 17 {2 copy 255 put pop} для N / pl [{adv 1 chg} {adv 1 chg nd} {1 add chg} {1 add chg nd} {adv lsh} {adv lsh nd} {adv rsh} { adv rsh nd} {1 add adv} {/ rc X nd} {1 add set} {1 add clr} {adv 2 chg} {adv 2 chg nd} {pop nd}] dup {bind pop} forall N / D {/ cc X dup type / stringtype ne {] } if nn / base get cc ctr put nn / BitMaps get S ctr S sf 1 ne {dup dup length 1 sub dup 2 index S get sf div put} if put / ctr ctr 1 add N} B / I { cc 1 add D} B / bop {userdict / bop-hook known {bop-hook} if / SI save N @rigin 0 0 moveto / V matrix currentmatrix dup 1 get dup mul exch 0 get dup mul добавлять .99 lt {/ QV} {/ RV} ifelse load def pop pop} N / eop {SI восстановить showpage userdict / eop-hook известный {eop-hook} if} N / @ start {userdict / start-hook известное {start-hook} if pop / VResolution X / Resolution X 1000 div / DVImag X / IE 256 array N 0 1 255 {IE S 1 string dup 0 3 index put cvn put} для 65781,76 дел / размер X 65781,76 дел / размер X} N / p {show} N / RMat [1 0 0 -1 0 0] N / BDot 260 string N / rulex 0 N / ruley 0 N / v {/ ruley X / rulex X V} B / V {} B / RV statusdict begin / product where {pop product dup length 7 ge {0 7 getinterval dup (Display) eq exch 0 4 getinterval (NeXT) eq или} {pop false} ifelse} {false} ifelse end {{gsave TR -.1 .1 TR 1 1 шкала rulex ruley false RMat {BDot} imagemask grestore}} {{gsave TR -.1 .1 TR rulex ruley scale 1 1 false RMat {BDot} imagemask grestore}} ifelse B / QV {gsave newpath transform round exch round exch itransform moveto rulex 0 rlineto 0 ruley neg rlineto rulex neg 0 rlinto fill grestore} B / a {moveto} B / delta 0 N / tail {dup / delta X 0 rmoveto} B / M {S p delta add tail} B / b {S p tail} B / c {-4 M} B / d {-3 M} B / e {-2 M} B / f {-1 M} B / g {0 M} B / h {1 M} B / i {2 M} B / j {3 M} B / k { 4 M} ч / б {0 rmoveto} B / l {p -4 w} B / m {p -3 w} B / n {p -2 w} B / o {p -1 w} B / q { p 1 w} B / r {p 2 w} B / s {p 3 w} B / t {p 4 w} B / x {0 S rmoveto} B / y {3 2 рулона p a} B / bos {/ SS сохранить N} B / eos {SS restore} B конец %% EndProcSet %% BeginProcSet: специальный.профи TeXDict begin / SDict 200 dict N SDict begin / @ SpecialDefaults {/ hs 612 N / vs 792 N / ho 0 N / vo 0 N / hsc 1 N / vsc 1 N / ang 0 N / CLIP 0 N / rwiSeen false N / rhiSeen false N / letter {} N / note {} N / a4 {} N / legal {} N} B / @ scaleunit 100 N / @ hscale {@scaleunit div / hsc X} B / @ vscale {@scaleunit div / vsc X} B / @ hsize {/ hs X / CLIP 1 N} B / @ vsize {/ vs X / CLIP 1 N} B / @ clip { / CLIP 2 N} B / @ hoffset {/ ho X} B / @ voffset {/ vo X} B / @ angle {/ ang X} B / @ rwi { 10 div / rwi X / rwiSeen true N} B / @ rhi {10 div / rhi X / rhiSeen true N} B / @ llx {/ llx X} B / @ lly {/ lly X} B / @ urx {/ urx X} B / @ ury {/ ury X} B / magscale true def end / @ MacSetUp {userdict / md известный {userdict / md тип получения / dicttype eq {userdict begin md length 10 add md maxlength ge {/ md md dup длина 20 add dict copy def} if end md begin / letter {} N / note {} N / Legal {} N / od {txpose 1 0 mtx defaultmatrix dtransform S atan / pa X newpath метка обрезки {преобразовать {itransform moveto}} {преобразовать {itransform lineto} } {6 -2 роликовое преобразование 6 -2 роликовое преобразование 6 -2 роликовое преобразование { itransform 6 2 roll itransform 6 2 roll itransform 6 2 roll curveto}} {{ closepath}} pathforall newpath counttomark array astore / gc xdf pop ct 39 0 положить 10 fz 0 fs 2 F / | ______ Courier fnt invertflag {PaintBlack} if} N / txpose {pxs pys scale ppr aload pop por {noflips {pop S neg S TR pop 1 -1 scale} если xflip yflip и {pop S neg S TR 180 повернуть 1 -1 масштаб ppr 3 получить ppr 1 get neg sub neg ppr 2 get ppr 0 get neg sub neg TR} if xflip yflip not и {pop S neg S TR pop 180 rotate ppr 3 get ppr 1 get neg sub neg 0 TR} if yflip xflip not и {ppr 1 get neg ppr 0 get neg TR} if} {noflips {TR pop pop 270 повернуть 1 -1 масштаб} если xflip yflip и {TR pop pop 90 повернуть 1 -1 scale ppr 3 get ppr 1 get neg sub neg ppr 2 get ppr 0 get neg sub neg TR} если xflip yflip not и {TR pop pop 90 rotate ppr 3 get ppr 1 get neg sub neg 0 TR} если yflip xflip not и {TR pop pop 270 rotate ppr 2 get ppr 0 get neg sub neg 0 S TR} if} ifelse scaleby96 {ppr aload pop 4 -1 roll add 2 дел 3 1 рулон прибавить 2 дел 2 копировать TR.96 dup scale neg S neg S TR} if} N / cp {pop pop showpage pm restore} N end} if} if} N / normalscale {Разрешение 72 div VResolution 72 div neg scale magscale {DVImag dup scale} if 0 setgray} N / psfts {S 65781.76 div N} N / startTexFig {/ psf $ SavedState save N userdict maxlength dict begin / magscale false def normalscale currentpoint TR / psf $ ury psfts / psf $ urx psfts / psf $ lly psfts / psf $ llx psfts / psf $ y psfts / psf $ x psfts currentpoint / psf $ cy X / psf $ cx X / psf $ sx psf $ x psf $ urx psf $ llx sub div N / psf $ sy psf $ y psf $ ury psf $ lly sub div N psf $ sx psf $ sy масштаб psf $ cx psf $ sx div psf $ llx sub psf $ cy psf $ sy div psf $ ury sub TR / showpage {} N / erasepage {} N / copypage {} N / p 3 def @MacSetUp} N / doclip { psf $ llx psf $ lly psf $ urx psf $ ury currentpoint 6 2 roll newpath 4 copy 4 2 рулон moveto 6 -1 рулон S lineto S lineto S lineto closepath clip newpath moveto} N / endTexFig {end psf $ SavedState restore} N / @ begin special {SDict begin / SpecialSave save N gsave normalscale currentpoint TR @SpecialDefaults count / ocount X / dcount countdictstack N} N / @ setspecial {CLIP 1 eq {newpath 0 0 moveto hs 0 rlineto 0 vs rlineto hs neg 0 rlineto closepath clip} if ho vo TR hsc vsc scale ang rotate rwiSeen {rwi urx llx sub div rhiSeen {rhi ury lly sub div} {dup} ifelse scale llx neg lly neg TR } {rhiSeen {rhi ury lly sub div dup scale llx neg lly neg TR} if} ifelse CLIP 2 eq {newpath llx lly moveto urx lly lineto urx ury lineto llx ury lineto closepath clip} if / showpage {} N / erasepage {} N / copypage {} N newpath } N / @ endpecial {count ocount sub {pop} repeat countdictstack dcount sub { end} повторить grestore SpecialSave restore end} N / @ defspecial {SDict begin} N / @ fedspecial {end} B / li {lineto} B / rl {rlineto} B / rc {rcurveto} B / np { / SaveX currentpoint / SaveY X N 1 setlinecap newpath} N / st {stroke SaveX SaveY moveto} N / fil {fill SaveX SaveY moveto} N / эллипс {/ endangle X / startangle X / yrad X / xrad X / savematrix matrix currentmatrix N TR xrad yrad scale 0 0 1 startangle endangle arc savematrix setmatrix} N конец %% EndProcSet Начало TeXDict 40258431 52099146 1000 300 300 (eisner.acl96.dvi) @start / Fa 1 85 df84 D E / Fb 1111 df110 D E / Fc 12 126 df16 DI26 DI32 DI40 DI122 DIII E / Fd 6 124 df98 DI102 D111 D 116 D123 D E / Fe 27122 df40 DI44 D48 DI55 D97 DIIIII105 D107 DIIIIIIII IIII121 D E / Ff 3 111 df0 D32 D110 D E / Fg 14 121 df12 DI21 D58 DIIII81 DII I110 D120 D E / Fh 13122 df21 D58 D81 DIII102 DII107 D110 D120 DI E / Fi 35 121 df40 DI47 DII60 D62 D65 DIII IIII76 D78 D80 D83 DI86 D88 D97 DI100 DII108 D110 DI114 DII119 DI E / Fj 18117 df40 DI47 D49 DI III78 D80 D83 D101 DI105 D109 DI115 DI E / Fk 70125 df12 D14 D34 D38 DIII44 DIIIIIIIIIIIIIII61 D63 D65 DI68 D70 DIIIII77 DII83 DII91 DII97 DIIIIIIIIIIIIIIIIIII IIII124 D E / Fl 2 111 df3 D110 D E / Fm 2 111 df 48 D110 D E / Fn 14 84 df40 DI47 DIIIIII73 D78 DII83 D E / Fo 36121 df12 D38 D42 D45 DI49 DI52 D58 D66 DI69 D76 D78 D83 DI97 D99 DIIIIII108 DIIIII IIIII120 D E / Fp 53122 df12 D34 D40 DI44 DII50 DI53 D55 DI58 D 65 DIIIIII73 D76 DIIII83 DII92 D97 DIIIIIIII108 DIIIIIIIIIIIII E / Fq 38123 df11 DII21 D27 DI58 DI III67 D79 D81 DIII97 D99 DIIIIII107 DIII112 D114 DIII119 DIII E / Fr 84 128 df11 DII я 34 D38 DIIIIIIIIIIIIIIIIIIIII61 D63 D65 DIII IIIIIIIIIIII82 DIIIII89 D91 DII97 DIIIIIIIIIIIIIIIIIIIIIIIIIII127 D E / Fs 13118 df46 D64 D99 DII105 DI108 D110 D112 D114 DI117 D E / Ft 36122 df44 DII48 DIIII54 D56 DI65 D67 DI73 D80 D83 D85 D97 D99 DIII104 DI108 DI III114 DII II121 D E / Fu 47122 df12 D34 D49 DIIIIII65 D67 DIIII73 DI78 DII82 DI87 D 92 D97 DII II IIII107 DIIIII114 DIIIIIII E / Fv 14 121 df 0 DI3 D15 D20 DI 33 D41 D50 D54 D106 D109 DI120 D E / Fw 23 122 df14 D45 D67 D69 DII78 D80 D97 DII
Google Ngram Viewer
Что делает программа просмотра Ngram?
Когда вы вводите фразы в программу просмотра Google Книг Ngram, отображается график, показывающий, как эти фразы встречаются в корпусе книг (например,г., «Британский английский», «Английская художественная литература», «Французский») вместо выбранных годы. Давайте посмотрим на пример графика:
Здесь показаны тенденции в трех граммах с 1960 по 2015 год: «питомник школа »( 2-грамм или биграмма ),« детский сад » ( 1-грамм или униграмма ), и «уход за детьми» (другой биграмма). Ось Y показывает следующее: из всех содержащихся биграмм в нашей выборке книг, написанных на английском языке и изданных в США Штаты, какой процент из них составляют «детские сады» или «детские сады»? Какой процент из всех униграмм «детский сад»? Здесь вы можете видеть, что использование фразы «уход за детьми» начало расти. в конце 1960-х, обогнав «детский сад» примерно в 1970 году, а затем «Детский сад» около 1973 года.Он достиг своего пика вскоре после 1990 г. с тех пор неуклонно падает.
(Интересно, что результаты заметно отличаются, когда корпус переведен на британский английский.)
Вы можете навести указатель мыши на линейную диаграмму, которая выделяет ее. С щелкнув левой кнопкой мыши по линейному графику, вы можете сосредоточиться на конкретной диаграмме, затемнение других диаграмм на диаграмме, если таковые имеются. Далее слева щелкнув по другим линейным графикам на диаграмме, несколько графиков могут быть сосредоточенным на. Вы можете дважды щелкнуть любую область диаграммы, чтобы восстановить все нграммы в запросе.
Вы также можете указывать подстановочные знаки в запросах, искать словосочетания, выполнять поиск без учета регистра, искать определенные части речи или складывать, вычитать и делить диаграммы. Подробнее о них в разделе «Расширенное использование».
Расширенное использование
Некоторые функции Ngram Viewer могут понравиться пользователям, которые хотят копать немного глубже в использовании фразы: поиск по шаблону , поиск перегиба , поиск без учета регистра , тегов частей речи и композиций ngram .
Поиск по шаблону
Если вы поставите * вместо слова, Ngram Viewer отобразит десять лучших замен. Например, чтобы найти самые популярные слова после «University of», введите «University of *».
Вы можете щелкнуть правой кнопкой мыши любую из заменяющих диаграмм, чтобы свернуть их все в исходный запрос с подстановочными знаками, в результате чего будет получена годовая сумма замен. Последующий щелчок правой кнопкой мыши расширяет запрос с подстановочными знаками обратно на все замены.Обратите внимание, что Ngram Viewer поддерживает только одно * на грамм.
Обратите внимание, что десять лучших замен рассчитываются для указанного временного диапазона. Поэтому вы можете получить разные замены для разных лет. Мы отфильтровали знаки препинания из первой десятки списка, но для слов, которые часто начинаются или заканчиваются предложениями, вы можете увидеть один из ограничивающих символов предложения (_START_ или _END_) в качестве одной из замен.
Поиск перегиба
Перегиб — это модификация слова для представления различных грамматических категорий, таких как аспект, падеж, пол, настроение, число, лицо, время и голос.Вы можете искать их, добавляя _INF к ngram. Например, поиск «book_INF a hotel» отобразит результаты для «книга», «забронировано», «книги» и «бронирование»:
Щелчок правой кнопкой мыши по любому перегибу сворачивает все формы в их сумму. Обратите внимание, что Ngram Viewer поддерживает только одно ключевое слово _INF на запрос.
Предупреждение: Вы не можете свободно смешивать поиск с использованием подстановочных знаков, флексию и поиск без учета регистра для одной конкретной ngram. Однако вы можете выполнить поиск с помощью любой из этих функций для отдельных ngram в запросе: «book_INF a hotel, book * hotel» — это нормально, а «book_INF * hotel» — нет.
Поиск без учета регистра
По умолчанию Ngram Viewer выполняет поисковых запросов с учетом регистра : использование заглавных букв имеет значение. Вы можете выполнить поиск без учета регистра, установив флажок «без учета регистра» справа от поля запроса. Затем средство просмотра Ngram отобразит сумму наиболее распространенных вариантов без учета регистра по годам. входного запроса. Вот две нграммы без учета регистра, «Фитцджеральд» и «Дюпон»:
Щелчок правой кнопкой мыши по любой годовой сумме приводит к расширению до наиболее распространенных вариантов без учета регистра.Например, щелчок правой кнопкой мыши на «Dupont (All)» приводит к следующим четырем вариантам: «DuPont», «Dupont», «duPont» и «DUPONT».
Теги части речи
Рассмотрим слово tackle , которое может быть глаголом («выполнить проблема «) или существительное (» рыболовные снасти «). Вы можете различать эти разные формы, добавив _VERB или _NOUN:
Полный список тегов выглядит следующим образом:
_НЕТ_ | Эти теги могут быть автономными (_PRON_) или могут быть добавлены к слову (she_PRON) | |
_VERB_ | ||
_ADJ_ | прилагательное | |
_ADV95 | ||
_ADV95_ | _местоимение | |
_DET_ | определитель или артикль | |
_ADP_ | сложение: либо предлог, либо постпозиция | |
_NUM_ | конъюнкция | |
частица | ||
_ROOT_ | корень дерева синтаксического анализа | Эти теги должны стоять отдельно (например,г., _START_) |
_START_ | начало предложения | |
_END_ | конец предложения |
Поскольку теги части речи не нужно прикреплять к определенным словам, вы можете использовать тег DET для поиска читать книгу , прочитал книгу , прочитал эту книгу , прочитал эту книгу , и так далее:
Если вы хотите узнать, каковы наиболее распространенные детерминаторы в этом контексте, вы можете объединить подстановочные знаки и теги части речи в read * _DET book :
Чтобы получить все различные склонения слова книга , за которыми следовали СУЩЕСТВИТЕЛЬНОЕ в корпусе можно выдать запрос book_ INF _NOUN_:
Наиболее частые теги части речи для слова можно получить с помощью функции подстановочного знака.Рассмотрим запрос cook_ * :
Ключевое слово склонения также можно комбинировать с тегами части речи. Например, рассмотрим запрос готовить _INF, готовить _VERB_INF ниже, который отделяет от словесного смысла слово «повар»:
Ngram Viewer помечает границы предложений, позволяя идентифицировать нграммы в начале и конце предложения с помощью тегов START и END:
Иногда полезно думать о словах с точки зрения зависимостей а не шаблоны.Допустим, вы хотите знать, как часто вкусно модифицирует десерт . То есть вы хотите количество упоминаний вкусных замороженных десертов , хрустящих, вкусных десерт , вкусный, но дорогой десерт , и все остальные случаи, когда слово вкусно применяется к десерт . Для этого Ngram Viewer предоставляет отношения зависимости с оператор =>:
У каждого проанализированного предложения есть _ROOT_. в отличие от других теги, _ROOT_ не означает конкретное слово или позицию в предложении.Это корень дерева синтаксического анализа, построенного анализ синтаксиса; вы можете думать об этом как о заполнителе того, что основной глагол предложения — модифицирующий. Итак, вот как определить как часто будет главным глаголом предложения:
Приведенный выше график будет включать предложение Ларри будет решать. , но не Ларри сказал, что он будет решать , так как will не является основным глаголом этого предложения.
Зависимости можно комбинировать с помощью подстановочных знаков.Например, рассмотрим запрос drink => * _ NOUN ниже:
Теги «чистой» части речи могут свободно смешиваться с обычными словами в 1, 2, 3, 4 и 5 граммах (например, тост _ADJ_ или _DET_ _ADJ_ тост).
Составы Ngram
Ngram Viewer предоставляет пять операторов, которые можно использовать для объединения нограммы: +, -, /, * и:.
+ | Суммирует выражения с обеих сторон, позволяя объединить несколько временных рядов ngram в один. |
— | Вычитает выражение справа из выражения слева, давая вам возможность измерить одну грамм относительно другой. Поскольку пользователи часто хотят искать фразы с дефисом, ставьте пробелы по обе стороны от знака -. |
/ | Делит выражение слева на выражение справа, что полезно для выделения поведения одной nграммы по отношению к другой. |
* | Умножает выражение слева на число справа, что упрощает сравнение диаграмм с очень разными частотами.(Обязательно заключайте всю nграмму в круглые скобки, чтобы * не интерпретировалось как подстановочный знак.) |
: | Применяет nграмму слева к корпусу справа, позволяя сравнивать nграммы в разных корпусах. . |
Ngram Viewer попытается угадать, применять ли эти поведение. Вы можете использовать круглые скобки, чтобы заставить их включиться, и квадрат скобки, чтобы отогнать их. Пример: и / или будет разделите и на или ; для измерения использования фраза и / или , используйте [и / или].И благонамеренные будут искать фраза благонамеренная ; если вы хотите вычесть смысл из хорошо, использовать (из лучших побуждений).
Чтобы продемонстрировать оператор +, вот как вы можете найти сумму игр, , игр, и игр, :
При определении того, писали ли люди больше о вариантах выбора из лет, ты мог сравнить выбор , выбор , вариант , и альтернатива , определяющая формы существительных, чтобы избежать формы прилагательного (e.г., отборный деликатес , альтернатива музыка ):
ВычитаниеNgram дает вам простой способ сравнить один набор ngram с другим:
Вот как можно комбинировать + и /, чтобы показать, как слово яблочное пюре расцвело за счет яблочного соуса :
Оператор * полезен, когда вы хотите сравнить диаграммы с разными частотами, например скрипка и более эзотерический терменвокс :
Оператор выбора: corpus позволяет сравнивать графики в разные языки, или американский или британский английский (или художественная литература), или между версиями отсканированных нами книг 2009, 2012 и 2019 гг.Вот чат на английском и та же униграмма на французском:
Когда мы создали исходный корпус Ngram Viewer в 2009 году, наши OCR было не так хорошо, как сегодня. Это было особенно очевидно в английский до 19-го века, где удлиненная медиальная часть (ſ) была часто интерпретируется как f , поэтому часто читается best как до . Вот свидетельство улучшений, которые мы сделали с тех пор затем, используя оператор корпуса для сравнения версий 2009, 2012 и 2019:
Сравнивая художественную литературу со всем английским, мы видим, что из волшебников в целом английский набирали в последнее время по сравнению с использованием в художественной литературе:
Корпуса
Ниже приведены описания корпусов, которые можно искать с помощью Программа просмотра Google Книг Ngram.Все корпуса были сгенерированы в июле. 2009 г., июль 2012 г. и февраль 2020 г .; мы обновим эти корпуса как нашу книгу сканирование продолжается, и обновленные версии будут иметь отчетливые постоянные идентификаторы. Книги с низким качеством распознавания текста и сериалы были исключены.
Неофициальное название корпуса | стенография | Постоянный идентификатор | Описание |
Американский английский 2019 | eng_us_2019 | googlebooks-eng-us-20200217 | Книги, изданные в США преимущественно на английском языке. |
Американский английский 2012 | eng_us_2012 | googlebooks-eng-us-all-20120701 | |
Американский английский 2009 | eng_us_2009 | googlebooks-eng-us-all-200 | |
Британский английский 2019 | eng_gb_2019 | googlebooks-eng-gb-20200217 | Книги, изданные в Великобритании преимущественно на английском языке. |
Британский английский 2012 | eng_gb_2012 | googlebooks-eng-gb-all-20120701 | |
Британский английский 2009 | eng_gb_2009 | googlebooks-eng-gb-all-200 | |
Английский 2019 | eng_2019 | googlebooks-eng-20200217 | Книги преимущественно на английском языке издаются в любой стране. |
Английский 2012 | eng_2012 | googlebooks-eng-all-20120701 | |
Английский язык 2009 | eng_2009 | googlebooks-eng-all-200 | |
Английская художественная литература 2019 | eng_fiction_2019 | googlebooks-eng-fiction-20200217 | Книги преимущественно на английском языке, которые библиотека или издатель сочли художественной. |
Английская художественная литература 2012 | eng_fiction_2012 | googlebooks-eng-fiction-all-20120701 | |
Английская художественная литература 2009 | eng_fiction_2009 | googlebooks-eng-fiction-all-200 | |
Английский Один миллион | eng_1m_2009 | googlebooks-eng-1M-200 | «Google Миллион».Все на английском языке с датами от С 1500 по 2008 год. Из любой книги было выбрано не более 6000 книг. год, что означает, что все отсканированные книги с ранних лет настоящее время, а книги более поздних лет выбираются случайным образом. Случайный выборки отражают тематические распределения за год (так что есть компьютерных книг в 2000 г. больше, чем в 1980 г.). |
Китайский 2019 | chi_sim_2019 | googlebooks-chi-sim-20200217 | Книги преимущественно упрощенным китайским шрифтом. |
Китайский 2012 | chi_sim_2012 | googlebooks-chi-sim-all-20120701 | |
Китайский 2009 | chi_sim_2009 | googlebooks-chi-sim-all-200 | |
Французский 2019 | fre_2019 | googlebooks-fre-20200217 | Книги преимущественно на французском языке. |
Французский 2012 | fre_2012 | googlebooks-fre-all-20120701 | |
Французский 2009 | fre_2009 | googlebooks-fre-all-200 | |
Немецкий 2019 | ger_2019 | googlebooks-ger-20200217 | Книги преимущественно на немецком языке. |
Немецкий 2012 | ger_2012 | googlebooks-ger-all-20120701 | |
Немецкий 2009 | ger_2009 | googlebooks-ger-all-200 | |
Еврейский 2019 | heb_2019 | googlebooks-heb-20200217 | Книги преимущественно на иврите. |
Еврейский 2012 | heb_2012 | googlebooks-heb-all-20120701 | |
Еврейский 2009 | heb_2009 | googlebooks-heb-all-200 | |
Испанский 2019 | spa_2019 | googlebooks-spa-20200217 | Книги преимущественно на испанском языке. |
Испанский 2012 | spa_2012 | googlebooks-spa-all-20120701 | |
Испанский 2009 | spa_2009 | googlebooks-spa-all-200 | |
Русский 2019 | rus_2019 | googlebooks-rus-20200217 | Книги преимущественно на русском языке. |
Русский 2012 | рус_2012 | googlebooks-rus-all-20120701 | |
Русский 2009 | rus_2009 | googlebooks-rus-all-200 | |
Итальянский 2019 | ita_2019 | googlebooks-ita-20200217 | Книги преимущественно на итальянском языке. |
Итальянский 2012 | ita_2012 | googlebooks-ita-all-20120701 |
По сравнению с версиями 2009 года версии 2012 и 2019 годов имеют больше книг, улучшенное распознавание текста, улучшенная библиотека и издатель метаданные. Версии 2012 и 2019 годов также не образуют перекрестные предложения. границ, и формируют диаграммы через границы страницы, в отличие от Версии 2009 г.
С корпусами 2012 и 2019 годов токенизация также улучшилась за счет использования набор правил, созданных вручную (кроме китайского, где статистическая система используется для сегментации).В корпусе 2009 г. токенизация была основана просто на пробеле.
Поиск в Google Книгах
Ниже графика показаны «интересные» диапазоны лет для вашего запроса. условия. Нажав на них, вы отправите свой запрос прямо в Google. Книги. Обратите внимание, что Ngram Viewer чувствителен к регистру, но Google Книги результаты поиска — , а не .
По этим запросам будут найдены фразы на любом из языков выбранный вами корпус, но результаты возвращаются из полной версии Google Корпус книг.Итак, если вы используете Ngram Viewer для поиска французского фразу во французском корпусе, а затем перейдите в Google Книги, этот поиск будет производиться по той же французской фразе, которая может встречаться в книга преимущественно на другом языке.
Часто задаваемые вопросы
Почему я не вижу ожидаемых результатов?
Возможно, по одной из следующих причин:
- Средство просмотра Ngram чувствительно к регистру. Попробуйте использовать в запросе заглавные буквы или установите флажок «без учета регистра» поле справа от поля поиска.
- Вы ищете в неожиданном корпусе. Например, Франкенштейн не встречается в русских книгах, поэтому, если вы выполните поиск в русском корпусе, вы увидите плоскую линию. Вы можете выбрать корпус через раскрывающееся меню под полем поиска или с помощью оператора выбора корпуса, например, Frankenstein: eng_2019.
- В вашей фразе есть запятая, плюс, дефис, звездочка, двоеточие, или косая черта. Это имеет особое значение для Ngram Зритель; см. Расширенное использование.Попробуйте заключить фразу в квадратные скобки (хотя с запятыми это не поможет).
Как Ngram Viewer обрабатывает знаки препинания?
Мы применяем набор правил токенизации, специфичных для конкретного язык. В английском языке сокращения превращаются в два слова (они становится биграммой, которой они являются, мы становимся нами буду и тд). Притяжательное также отделяется, но R’n’B остается одним токеном. Отрицания (нет) нормализовано так что не становится не делать. По-русски, диакритический знак ё нормализуется до e и так далее.Те же правила применяется для анализа как ngram, набранных пользователями, так и ngrams извлекается из корпусов, что означает, что если вы ищете не пугайтесь того факта, что Ngram Viewer переписывает, чтобы не делать; это точно изображает использование и того, и другого нет и нет в корпусе. Однако это означает, что нет возможности явно искать конкретный формы не могут (или не могут): получить нельзя и не может и не может сразу.
Как мне увидеть примеры использования в контексте?
Под диаграммой Ngram Viewer мы приводим таблицу предопределенных Поиск в Google Книгах сужался до определенного года.Мы выбираем диапазоны по интересности: если ngram имеет огромный пик в конкретный год, который появится сам по себе как поиск, с другие поисковые запросы, охватывающие более длительный период.
В отличие от корпуса Ngram Viewer 2019, корпус Google Книг не часть речи отмечена. Нельзя искать, скажем, глагольную форму из ура в Google Книгах. Так что любые нграммы с частичностью речи теги (например, cheer_VERB) исключаются из таблицы Google Книжные поиски.
Ngram Viewer имеет корпуса 2009, 2012 и 2019 годов, но Google Книги так не работает.Когда вы ищете в Google Книгах, вы поиск по всем доступным в настоящее время книгам, поэтому могут быть различия между тем, что вы видите в Google Книгах, и тем, что вы бы ожидайте увидеть данную диаграмму Ngram Viewer.
Почему я вижу больше всплесков и плато в ранние годы?
Издание было относительно редким событием в 16 и 17 гг. веков. (Есть опубликовано всего около 500000 книг на английском языке до 19 века.) Итак, если фраза встречается в одной книге, в одной год, но не в предыдущие или последующие годы, что создает более высокий шип, чем в последующие годы.
Плато обычно представляют собой просто сглаженные шипы. Измените сглаживание до 0.
Что означает «сглаживание»?
Часто тенденции становятся более очевидными, когда данные рассматриваются как движущиеся средний. Сглаживание 1 означает, что данные, показанные за 1950 год, будут среднее необработанное число за 1950 плюс 1 значение с каждой стороны: («счет за 1949 год» + «счет за 1950 год» + «счет за 1951 год»), деленный на 3. Таким образом, сглаживание 10 означает, что будет усреднено 21 значение: 10 на с любой стороны, плюс целевое значение в центре.
На левом и правом краях графика меньше значений в среднем. При сглаживании 3 крайнее левое значение (притвориться это 1950 год) будет рассчитываться как («счет за 1950» + «счетчик для 1951 «+» счет для 1952 «+» счет для 1953 «), разделенный на 4.
Сглаживание 0 означает отсутствие сглаживания: только необработанные данные.
В наши дни издается намного больше книг. Разве это не перекос результаты, достижения?
Было бы, если бы мы не нормализовали по количеству книг, изданных в каждый год.
Почему вы показываете ровную линию 0%, когда я знаю фразу в моем запрос встречается хотя бы в одной книге?
При большой нагрузке Ngram Viewer иногда возвращает ровная линия; перезагрузите, чтобы подтвердить, что на самом деле нет обращений для фраза. Кроме того, мы рассматриваем только те граммы, которые встречаются не менее чем в 40 книги. В противном случае набор данных вырастет в размерах, и мы не будем в состоянии предложить их все.
Насколько точна маркировка части речи?
Предсказываются теги части речи и отношения зависимости. автоматически.Оценка точности этих прогнозов сложно, но от современного английского мы ожидаем точности теги части речи должны быть около 95% и точность зависимости отношения около 85%. По старому английскому тексту и для других языков точность ниже, но, вероятно, выше 90% для тегов части речи и выше 75% для зависимостей. Это подразумевает значительное количество ошибки, которые следует учитывать при рисовании выводы.
Теги части речи состоят из небольшого обучающего набора (всего миллион слов для английского).Иногда это будет недостаточно представлены необычные употребления, такие как зеленый или собака или книга как глагол, или спросите как существительное.
Дополнительная информация о китайском языке: до 20 века классическая Китайский язык традиционно использовался для всех письменных коммуникация. Классический китайский основан на грамматике и словарный запас древнего китайского языка, а синтаксические аннотации будут поэтому ошибаться чаще, чем правы.
Также обратите внимание, что корпус 2009 года не был частью речи отмечен.
Я пишу статью по вашим результатам. Как я могу процитировать вашу работу?
Если вы собираетесь использовать эти данные для академической публикации, укажите исходную статью:
Жан-Батист Мишель *, Юань Куй Шен, Авива Прессер Эйден, Адриан Верес, Мэтью К. Грей, Уильям Брокман, команда Google Книг, Джозеф П. Пикетт, Дейл Хойберг, Дэн Клэнси, Питер Норвиг, Джон Орвант, Стивен Пинкер, Мартин А. Новак и Эрез Либерман Эйден *. Количественный анализ культуры с использованием миллионов оцифрованных Книги . Science (Опубликовано в Интернете перед печатью: 16.12.2010)
У нас также есть статья о тегах части речи:
Юрий Лин, Жан-Батист Мишель, Эрез Либерман Эйден, Джон Орвант, Уильям Брокман, Славянин Петров. Синтаксические аннотации для корпуса Ngram Google Книг . Поступления 50-го ежегодного собрания Ассоциации компьютерной лингвистики Том 2: Демо-документы (ACL ’12) (2012)
Могу ли я загрузить ваши данные для проведения собственных экспериментов?
Да! Данные ngram доступны для Скачать здесь.Сделать размеры файлов управляемым, мы сгруппировали их по начальной букве, а затем сгруппировали разные размеры ngram в отдельные файлы. Графики внутри каждый файл не отсортирован по алфавиту.
Для создания машиночитаемых имен файлов мы транслитерировали ngram для языков, использующих нелатинские шрифты (китайский, иврит, Русский) и использовал начальную букву транслитерированной нграммы как определить имя файла. Тот же подход был использован для персонажей например, ä на немецком языке.