Свела морфемный разбор: Словарь синонимов sinonim.org — РОСТОВСКИЙ ЦЕНТР ПОМОЩИ ДЕТЯМ № 7

Содержание

Синонимы и антонимы «свела» — анализ и ассоциации к слову свела. Морфологический разбор и склонение слов

Образовательные материалы:

В наличии:

Глаголы

16 275

Прилагательные

27 794

Существительные

68 384

Связи

Свойственные

5 229 366

Действенные

4 639 598

Ассоциативные

8 695 870

Синонимические

46 108

Словарные

1 049 874

Обработано:

13,32 Гб

Анализ прилагательных и глаголов производится с учетом морфологического признака — пол.

инфинитив
мужской род
женский род
средний род

Перевод
Ассоциации
Анаграммы
Антонимы
Синонимы
Гиперонимы
Морфологический разбор
Склонения
Спряжения

Перевод слова свести

Мы предлагаем Вам перевод слова свести на английский, немецкий и французский языки.
Реализовано с помощью сервиса «Яндекс.Словарь»

На английский
На немецкий
На французский

nullify — аннулировать
reduce — уменьшить
- свести к нулю — reduce to zero
bring — привести, положить
drive — управлять
flatten — сплющить

reduzieren — сводить
verkuppeln
zusammenbringen — сводить
zurückführen — сводить

zusammenführen — сводить
herunterführen
hinabführen

réduire à — привести
réunir — объединить
ramener — сводить, подвести
faire descendre — низвести
synthétiser — подвести
ramener à
mettre ensemble — собрать вместе
enlever — устранять
décrocher — добиться
contracter — уменьшать

Как можно свести?

простоокончательнонужноугоднобыстронеобходимоспособнопостепеннослучайнобуквальновнезапносуровонеожиданногрознозадумчиволегконевозможнонедоуменноскородействительнорезкострогонепременномоментальномгновенноосторожнотруднопреждевременнонемедленносердитомедленногневноличноточнонедовольнотвердоудивленнонемилосердноравноупряможелательностраннонеприятноодновременноблизкообязательносовершенноплотнохмуроспециальнозабавноразумномучительнонепроизвольноохотноспокойнонарочноудачнобезвременноскромномрачносильнорешительнопредварительно

Кто или что может свести?

судьбасудорогажизньбольболезньженщинасилакрасотавойнаулыбкаротбедалюбовьпланетаводаяростьненавистьревностьлуизаматьисповедьгримасапубликавластьдевчонкапедагогикаоливияфиллидазагадкамысльмузыкаопасностьдорогастрастькэтлинаннаприманкацельженитьбамагиямолитвадженнирешимостьалланинасистемаекатеринагордыняпневмонияисторияматушкаудачаулицахарриетвстречаольгаволчицаводказвездасестрагиперинфляциябабкасарбуря

Ассоциации к слову свести

умминимуммогиланульнапряжениешуткапрестолголодстрахпереносицахолодкемужасберегтремаживотсудорогагородамвонотвращениедворжеланиечеловекничьятаблицамессиртемакореньтронсистемафреднебоуровеньнаборлицояростьлестницаусталостьзаданиеспазмколеносветагрудьгневконецстенаступеньрубашкаконюшнявечусилиеконусзлостьстолбаняспинапутьгробземляцифрааннакредиткаледилюбовь

Синонимы слова свести

слитьобъединитьсорватьсодратьвырубить

Сфера употребления слова свести

Общая лексикаДипломатический терминПословицаРазговорное выражениеСленг

Морфологический разбор (часть речи) слова свела

Часть речи:

глагол

Род:

женский

Время:

прошедшее

Наклонение:

—

Лицо:

2-е лицо

Число:

единственное

Спряжение глагола свести

	Ед. число	Мн. число
1 лицо	сведу	сведём
2 лицо	сведёшь	сведёте
3 лицо	сведёт	сведут

В прошедшем времени

Мужской род:

свёл

Женский род:

свела

Средний род:

свело

«Мзда» морфологический разбор слова — ассоциации, падежи и склонение слов

Найти слова начинающиеся на «мзда»
Найти слова содержащие «мзда»
Найти слова заканчивающиеся на «мзда»

Прилагательные к слову мзда

Какой бывает мзда? Предлагаем подбор прилагательных на основе литературных произведений и статей.

греховной

изрядной

разовой

определенной

ежедневной

большой

корыстолюбивой

небольшой

необременительной

солидной

условленной

утренней

врученной

мерзостной

ничтожной

религиозной

взвешенной

привычной

большей

известной

особой

земной

щедрой

пятой

требующей

назначенной

недельной

скудной

достойной

приличной

скромной

взятой

малой

двойной

денежной

настоящей

грешной

обещанной

честной

соответствующей

лихой

нищенской

дополнительной

великой

хорошей

никакой

отдельной

мелкой

высокой

русской

крупной

справедливой

нужной

положенной

незначительной

полученной

умеренной

золотой

немалой

Глаголы к слову мзда

Что может мзда? Что можно сделать с мздой? Подбор подходящих глаголов на основе русского языка.

беречь

ждать

получаться

оставлять

взяться

дождаться

смочь

показаться

выяснить

свести

оказаться

купить

оставаться

велеть

сунуть

полагаться

химичить

передать

занять

посулить

Ассоциации к слову мзда

Подбор ассоциативного ряда. Слова, которые в той или иной степени ассоциируются с искомым.

вхождение

визирь

клуб

сотрудничество

скит

нарушитель

содержатель

починка

кошель

злодеяние

проститутка

чудовище

пересечение

уборка

рука

ларечник

владыка

майами

капитан

гривенник

размер

стойка

князь

полиция

максимум

зона

квартирант

защита

проситель

торг

место

купец

население

труд

цыган

чичиков

заслуга

основание

развод

контрабандист

принцип

время

ступень

казна

сие

эскиз

информация

молчание

приезжий

паломник

секс

деятельность

умаление

служба

проход

суд

мешочек

право

срыв

пристань

карман

дрова

Какого рода мзда (морфологический разбор)

Разбор слова по части речи, роду, числу, одушевленности и падежу.

Часть речи:

существительное

Род:

женский

Число:

единственное

Одушевленность:

неодушевленное

Падеж:

именительный

Склонение существительного мзда (какой падеж)

Склонение слова по падежу в единственном и множественном числах.

Падеж	Вопрос	Ед.число	Мн. число
Именительный	(кто, что?)	мзда	мзды
Родительный	(кого, чего?)	мзды	мзд
Дательный	(кому, чему?)	мзде	мздам
Винительный	(кого, что?)	мзду	мзды
Творительный	(кем, чем?)	мздой	мздами
Предложный	(о ком, о чём?)	мзде	мздах

Сфера употребления

Предложения со словом мзда

Наш робот составил несколько предложений в автоматическом режиме. Оцените его работу, тем самым Вы поможете ему стать более совершенным.

1. Мзда внезапно показалась у латинского берега

2. Угрюмо мзда свела с регулярной орбиты

3. Жалко мзда показалась в висячей тюрьме

4. Укоризненно мзда свела со монетного двора

5. Своевременно мзда показалась на батыева горе

Напишите свои варианты ассоциаций

Смотрите также

Перевод Ассоциации Анаграммы Синонимы и антонимы Морфологический разбор Склонения Спряжения

Буква в начале Буква в конце

Карта сайта

Перейти к содержанию

Search for:

Главная » Карта сайта

Чтобы найти все нужные материалы сайта по разделам, воспользуйтесь картой сайта:

Алфавит [6], Варианты ЕГЭ [9], Вопрос — ответ [1], ЕГЭ [3], Лексика [25], Морфемика [18], Морфология [39], Орфография [63], Пунктуация [8], Синтаксис [6], Фонетика [23]

Алфавит

[6] ↑

Буква В
Буква ц: характеристика буквы ц и звука ц
Буква Б — история буквы, прописи
Буква А
Буква Ы
Буква Е

Варианты ЕГЭ

[9] ↑

Вариант 9
Вариант 8
Вариант 7 ЕГЭ по русскому языку
Вариант 6
Вариант 5
Вариант 4
Вариант 3
Вариант 2
Вариант 1

Вопрос — ответ

[1] ↑

Ответы на вопросы

ЕГЭ

[3] ↑

Главная информация в тексте
Средства связей предложений в тексте
ЕГЭ по русскому языку — не очевидное и вероятное

Лексика

[25] ↑

В чем разница между синонимами
Невежа и невежда — в чем смысл этих слов
Подсказка — а знаете ли вы значение этого слова
Привет — что означает это слово
Категорически приветствую — что означает это выражение
Что такое риторический вопрос
Оксюморон в русском языке
Анафора — что это такое и как используется в русском языке
Синонимы определения, виды, подбор синонимов
Омонимы
Аллегория — что это такое и где применяется
Одеть или надеть
Фразеологизмы в русском языке
Зачем изучать русский язык иностранцам
Архаизмы
Как правильно: компания или кампания
Слово
Запасный или запасной выход
Лексическое значение слова снег
Лексика: характеристика, разновидности, понятия
Что означает высокая мечта
Лексическое значение слова солнце
Историзмы
Что означает слово «априори»
Что означает слово кэшбэк

Морфемика

[18] ↑

Разбор слова «корень» на морфемы
Корень в слове «жизнь»
Корень в слове «медведь»
Корень в слове «ветер» — разбираем слово по составу
Корень в слове «заяц»
Корень слова «вынуть» и разбор слова по составу
Приставка над — что она означает и примеры слов с этой приставкой
Слова с суффиксом «н»
Слова с суффиксом «к»
Приставки
Морфемный разбор слова
Окончания в русском языке
Корень слова
Снегурочка разбор слова по составу
Суффиксы в русском языке
Однокоренные слова к слову снег
Морфемика
Однокоренные слова к слову дом

Морфология

[39] ↑

Я — это местоимение или существительное
Несклоняемые существительные
Сочи род существительного
Какого рода пони
Кофе род существительного мужской или средний
Наречие это что — характеристика и разряды наречий
Пенальти — род существительного
Имя прилагательное
Какой род существительного калибри
Глагол
Склонение по падежам
Супплетивизм: понятие, характеристика, примеры
Какого рода существительное «кашне»
Какой род у существительного «иваси»
Какой род у существительного жюри
Какой род у существительного «цеце»
Салями — какого рода это слово
Определяем род существительного шампунь
Какого рода существительное бра
Какаду род существительного мужской или женский
Какой род у существительного какао
Шимпанзе род существительного мужской или женский
Кольраби какого рода ?
Какой род у существительного авеню
Род имен существительных
Имя существительное
Возвратные местоимения
Склонение имени Данила по падежам
Как отличить именительный падеж от винительного
Какой падеж у слова «юг»
Именительный падеж фамилии
Анастасия склонение по падежам
Имя Наталья склонение по падежам
Предложный падеж
Именительный падеж: единственное и множественное число
Склонение слова земля по падежам
Склонение имени Мария по падежам
Морфологический разбор слова «каждый»
Деепричастие

Орфография

[63] ↑

Двоечник или двоешник
Налить чая или чаю — как правильно
Длиной или длинной
Обратиться или обратится — как правильно написать
Ознакомиться или ознакомится
Ровняться или равняться
Как пишется слово «медвежонок»
Как пишется «никак» или «ни как»
Платьице или платьеце как правильно говорить и писать
Как написать имя без ошибки: Олечка или Оличка
Не совсем или несовсем как пишется слитно или раздельно
Слово «настежь»: трудности написания
Как пишется слово «серьезно»
Как пишется «в начале» или «вначале» слитно или раздельно
Слово заранее как пишется правильно
Кардинально или координально — как правильно писать и говорить
Поболтаем или по болтаем — как правильно писать
Как правильно писать «цифра» или «цыфра»
Заря или зоря — как правильно
В одиночку как пишется слитно или раздельно
Как пишется «все равно» или «всеравно» слитно или раздельно
Что насчет завтра или как пишется слово «насчет»
Вовремя или во время: слитно или раздельно
Полгода или пол года как пишется правильно
Обожаю или обажаю как правильно писать эти слова
Также слитно или раздельно — раскрываем правило
Нигде как пишется слитно или раздельно: нигде, негде, ни где
Проверочное слово к слову «поздно»
Как правильно говорить ноль или нуль?
Какое проверочное слово к слову «кора»?
По разному как пишется правильно — слитно или раздельно?
Как писать слово «неправильно» — не правильно или неправильно
Помощник или помошник — как правильно написать это слово
Частицы не и ни: не с разными частями речи слитно или раздельно
Все таки как пишется
Девченки или девчонки правописание
Как пишется слово обжора
В продолжение разговора или в продолжении
Ненадолго — слитно или раздельно
Чудесный или чудестный ?
Как пишется слово «не знаю»
Во сколько или восколько
Правописание гласных в корне слова
Слово «закладка» как подобрать проверочное слово
Собака: проверочное слово или словарная форма
Раздается, раздаваться: как правильно
«Свела» или «свила»: как правильно?
Как пишется слово: «поздно» или «позно»
Ухажер или ухажор
Склеенный или склеянный как правильно пишут
Смола проверочное слово
Проверочное слово к слову лодка
Двусложные слова, которые нельзя перенести
Шалун — как подобрать проверочное слово
Понапрасну как пишется слитно или раздельно
Росинка проверочное слово
Редиска проверочное слово
Как будто — как пишется правильно
Прийти или придти
Притензия или претензия как правильно
Чересчур как пишется правильно
Как пишется слово здесь
Безударные гласные в корне слова

Пунктуация

[8] ↑

Пунктуация и её трудности: союз «как… так и» нужны ли запятые
Случаи обособления слова «пожалуйста» запятыми
«Да конечно» или «нет конечно» выделяется запятыми или нет
Деепричастный оборот в предложении или когда ставить запятые
Дефис и тире — в чем разница
Запятая перед «и»: правила и примеры
Многоточие как знак препинания
Точка — знак препинания

Синтаксис

[6] ↑

Подлежащее и сказуемое
Грамматическая основа предложения: как правильно найти и выделить
Вводные слова в русском языке
Предложение
Подчинительная связь в предложении
Сочинительные союзы

Фонетика

[23] ↑

Фонетический разбор слова «змея»
Как справиться с затруднением, выбирая ударение для глагола «начала» и причастия «начата»
Правильное ударение в слове «оптовый»
Ударение в слове «столяр»
Завидно — как правильно поставить ударение в этом слове
Банты ударение на первый слог или на второй
Как правильно в слове «поняла» ударение поставить
Как правильно поставить ударение в слове ракушка
Тренеры или тренера как правильно говорить и писать
Ударение в слове торты
Как поставить ударение в слове цепочка правильно

Артикуляционная классификация согласных
Артикуляционная классификация гласных
Правильное ударение в слове дефис
Договоры или договора: как верно?
Ударение в слове безудержный
Ударение в слове заговор
Фонетика
Ударение в русском языке
Ударение в слове «щавель»: в словарях и современной речи
Ударение в слове творог
Где ставится ударение в слове «обеспечение»
Ударение в слове свекла

Маркировка

турецких PoS за счет уменьшения разреженности с помощью морфемных тегов в небольших наборах данных — arXiv Vanity

Бурку Банка 1Кафедра вычислительной техники, Университет Хаджеттепе
Бейтепе, Анкара, 06800, Турция
Ахмет Устюн 2Отдел когнитивных наук, Институт информатики
Ближневосточный технический университет (ODTÜ)
Анкара, 06800, Турция
Муратан Курфалы 2Отдел когнитивных наук, Институт информатики
Ближневосточный технический университет (ODTÜ)

Анкара, 06800, Турция

Abstract

Разреженность — одна из основных проблем обработки естественного языка. Проблема становится еще более серьезной в агглютинирующих языках, которые очень склонны к флективности. Мы боремся с разреженностью в турецком языке, применяя морфологические признаки для обозначения частей речи. Мы изучаем флективные и деривационные теги морфем в турецком языке, используя условные случайные поля (CRF), и мы используем теги морфем в тегах частей речи (PoS), используя скрытые марковские модели (HMM) для уменьшения разреженности. Результаты показывают, что использование тегов морфем в тегировании PoS помогает уменьшить разреженность вероятностей эмиссии. Наша модель превосходит другие модели тегов PoS на основе скрытой марковской модели для небольших наборов обучающих данных на турецком языке. Получаем точность 94,1% в тегировании морфем и 89,2% в тегировании PoS в наборе обучающих данных 5K.

Ключевые слова:

морфология, синтаксис, маркировка частей речи, разреженность, условные случайные поля (CRF), скрытые марковские модели (HMM)

1 Введение

Турецкий язык является агглютинирующим языком, в котором слова строятся путем склеивания смысловых единиц, называемых морфемами. При склеивании морфем интенсивно применяются гармония гласных и ассимиляция согласных, что приводит к орфографическим преобразованиям в морфемах. Например, суффикс дир может быть преобразован в дир, дур, дур в зависимости от последней гласной в слове, к которому он присоединяется. Это называется гармонией гласных. Более того, эта же морфема может трансформироваться в tir, tır, tur, tür, на этот раз в зависимости от последней согласной в слове. Это называется ассимиляцией согласных. И гармония гласных, и ассимиляция согласных вводят разные реализации одной и той же морфемы, которые называются алломорфами (например, дир, дир, дур, дур, тир, тир, тур, тюр — все алломорфы).

Агглютинация уже создает проблему разреженности при обработке естественного языка для особенно агглютинирующих языков. Проблема разреженности становится более острой, когда морфема имеет разные реализации. Идентификация морфем, которые являются реализациями друг друга, является отправной точкой этой работы.

Системы морфологической сегментации обычно предоставляют только сегменты слов без каких-либо тегов морфем. Однако для некоторых задач обработки естественного языка требуется помеченная сегментация. Например, при анализе тональности турецкий суффикс отрицания ma (и его алломорф me) необходимо отличать от производного суффикса ma (и его алломорфа me), который превращает глагол в существительное, чтобы извлечь правильное настроение. То же самое относится и к машинному переводу, ответам на вопросы и другим приложениям обработки естественного языка.

Маркировка морфем стала забытым аспектом морфологической сегментации. В этой статье мы используем условные случайные поля (CRF) для маркировки морфем в условиях слабого контроля. Мы используем полученные теги морфем в тегировании части речи (тегирование PoS), чтобы уменьшить разреженность в случае, когда предоставляется небольшой объем данных. Действительно, проблема разреженности довольно серьезна в тегировании PoS для особенно агглютинирующих языков, где для борьбы с разреженностью применялись различные методы (например, сглаживание). Разреженность значительно уменьшается за счет использования тегов морфем, а не использования лексических экземпляров, таких как слова или суффиксы.

Этот документ организован следующим образом: раздел 2 указывает на соответствующую работу в литературе, раздел 3 описывает модель CRF, принятую в тегировании морфем, и описывает HMM, используемые в тегировании PoS, в разделе 4 представлены экспериментальные результаты обеих задач и, наконец, раздел 5 завершает статью оставшейся будущей работой.

2 Связанная работа

Был проведен значительный объем работы по неконтролируемой морфологической сегментации. Ювелир [10] , Кройц и Лагус [5] построить системы морфологической сегментации на основе минимальной длины описания (MDL). Creutz и Lagus [6] вводят скрытую марковскую модель (HMM), которая использует распределения вероятностей между различными категориями морфем, такими как префикс, основа и суффикс. Пун и др. [15] представляет логарифмически-линейную модель для неконтролируемой морфологической сегментации, которая включает в себя априорные данные, вдохновленные MDL.

Все эти модели обеспечивают только морфологическую сегментацию слов, а не какие-либо морфологические теги, определяющие роли морфем в слове. Изучение тэгов морфем включает в себя различение гомофонных морфем ¹ ¹ 1 Морфемы с одинаковыми поверхностными формами, но с разным значением. и изучение алломорфов. Oflazer [14] вводит деривационные границы и флективные группы в турецкий морфологический анализ. Это выполняется с помощью двухуровневой морфологии (PC-KIMMO [2, 12] ), которая формулирует морфологическую сегментацию через каскад преобразователей с конечным состоянием с использованием морфофонемных чередований. Все орфографические и морфофонемные правила реализуются набором правил конечного автомата (FSA). Их модель дает помеченный морфологический анализ, основанный на этих правилах.

Allomorphessor [20] — одна из моделей, целью которой является выполнение морфологической сегментации на основе алломорфов путем моделирования мутаций между различными поверхностными формами морфем, а именно алломорфами. Джан и Манандхар [3] разработали агломеративную иерархическую кластеризацию для поиска классов морфем в неконтролируемой среде.

Насколько нам известно, Ryan et al. [4] впервые вводит помеченную морфологическую сегментацию в контролируемой структуре обучения без использования каких-либо правил. Они моделируют морфотактику полумарковской моделью. Вводятся различные уровни наборов тегов, которые охватывают разные уровни детализации. Наша модель напоминает их модель с точки зрения морфологической разметки.

Теги морфемы использовались во многих задачах обработки естественного языка. El-Kahlout и Oflazer [7] используют морфологические теги, чтобы уменьшить разреженность путем сопоставления турецких морфем, имеющих один и тот же морфологический тег, с одним и тем же английским переводом в задаче статистического машинного перевода. Они обращают внимание на то, что использование морфологических тегов обеспечивает существенное улучшение оценки BLUE.

Теги морфемы использовались для устранения неоднозначности морфологии/PoS в турецком языке. Эхсани и др. [8] использовать условные случайные поля для устранения неоднозначности тегов PoS на турецком языке с использованием морфологических тегов. Они вводят некоторые зависимости между флективными группами морфем, чтобы упростить вероятности перехода. Сак и др. [16] применяют алгоритм персептрона для морфологического устранения неоднозначности. Хаккани-Тур и др. [11] сформулировать триграмму HMM на основе флективных групп, чтобы устранить неоднозначность морфологического разбора данного слова. Результаты показывают, что использование зависимостей между флективными группами соседних слов повышает точность тегирования PoS. Многие из этих моделей выбирают полный морфологический анализ для каждого слова, а не предоставляют один тег PoS.

Динсер и др. [19] формулируют HMM, выделяя суффиксы, а не слова, чтобы уменьшить разреженность. Однако они не используют теги морфем. В этом отношении наша модель PoS во многом похожа на их работу. Мы используем теги морфем, чтобы справиться с разреженностью вероятностей эмиссии, а не используем окончания слов фиксированной длины.

3 Модель

3.1 Турецкая морфология

Турецкий язык является агглютинирующим языком с продуктивной флективной и деривационной суффиксацией. Это приводит к проблеме разреженности в задачах nlp из-за большого словарного запаса, введенного языком. Размер словарного запаса корпуса из 1 миллиона слов становится 106 547 9DB+Verb+Zero+Past+A3sg (это был лоб)

Здесь ˆDB обозначают границы деривации, а остальные теги морфем обозначают флективные группы (ИГ). Большинство слов имеют более одного морфологического анализа в турецком языке, и морфологическое устранение неоднозначности направлено на поиск правильного морфологического анализа слова, данного в конкретном контексте.

В этой работе мы используем только теги морфем (как производные, так и флективные) слов, чтобы найти один тег PoS для каждого слова. Мы считаем, что теги морфем дают наилучшую подсказку для тега PoS. Этого достаточно, если нас интересует только синтаксис, но не смысл. Например, анализы alındı, оканчивающиеся на A3sg, можно рассматривать как глаголы, тогда как единственный анализ, оканчивающийся на Nom, можно рассматривать как существительное. Чтобы найти теги морфем, мы используем только морфотактические признаки морфем внутри слов, тогда как мы используем контекстуальные признаки и морфологические признаки в тегировании PoS.

3.2 Морфологическая маркировка с использованием CRF

Условные случайные поля (CRF) [13] — это неориентированные графические модели, которые обычно используются для сегментации и маркировки заданной последовательности. В отличие от HMM, CRF являются дискриминационными моделями, которые определяют условное распределение P(Y|M), а не совместное распределение вероятностей P(M,Y), где Y соответствует последовательности меток Y={y0,y1,⋯,yn} и M соответствует входной (т. е. наблюдениям) последовательности M={m0,m1,⋯,mn}. В нашем случае последовательность меток Y относится к тегам морфем, а последовательность наблюдений M относится к морфемам.

Условное распределение P(Y|M) в нашей модели CRF дается следующим образом:

p(Y|M)=1Z(M)N∏nIn∏iλF(Y,M)

(1)

, который перебирает морфемы каждого слова в корпусе из N слов, каждое из которых имеет морфемы In, определенные на наборе признаков F. Здесь Z(M) — коэффициент нормализации:

Z(M)=∑yiN∏nIn∏iλF(Y,M)

(2)

Здесь λ соответствует вектору весов для набора признаков F. Функция признаков F состоит из двух типов: функций признаков состояния s(y,m,i) и функций признаков перехода s(y′,y,m, i) где i обозначает входную позицию. Функция признаков состояния не равна нулю, когда метка yi соответствует метке, определенной в функции, тогда как функции перехода зависят от последовательности меток yi-1,yi.

Рисунок 1: Наша наивная модель для условного случайного поля. Каждое состояние обозначает тег морфемы, где слово w определяется как w=mi/yi+mi+1/yi+1+mi+2/yi+2.

Наша модель представлена на рисунке 1. Мы используем наивную модель, в которой между каждой парой состояний строится ребро. Поэтому предполагается, что теги морфем в одном и том же слове зависят друг от друга, тогда как каждое слово считается независимым от других. Таким образом, мы имеем дело только с морфотактическими правилами в рамках одного и того же слова для задания маркировки морфем без использования каких-либо контекстуальных признаков.

3.3 Принятие морфологических тегов в тегировании PoS

Мы используем теги морфем, полученные из модели CRF, чтобы вывести теги PoS слов. Мы изучаем теги PoS в соответствии со следующей формулировкой, находя последовательность тегов PoS, которая максимизирует вероятность для данной последовательности слов:

argmaxt1⋯tnP(t1⋯tn|w1⋯wn)

(3)

, где t1⋯tn обозначает теги PoS, а w1. ..wn обозначает последовательность слов. Правило Байеса просто применяется для апостериорной вероятности следующим образом:

	argmaxt1⋯tnP(t1⋯tn\|w1…wn)	=	argmaxt1⋯tnP(w1…wn\|t1⋯tn)P(t1⋯tn)P(w1⋯wn)
		∝	argmaxt1⋯tnP(w1⋯wn\|t1⋯tn)P(t1⋯tn)

, где P(w1⋯wn) отбрасывается, поскольку оно одинаково для всех назначений тегов для данной последовательности слов.

Мы формулируем апостериорную вероятность в виде триграммы HMM, предполагая, что каждый тег PoS зависит только от двух предыдущих тегов:

P(t1⋯tn)=p(t1)p(t2|t1)∏ip(ti|ti−2,ti−1)

(5)

Мы применяем интерполяцию, чтобы сгладить вероятности перехода, чтобы исключить нули в переходах с уравнением, приведенным ниже:

Пинтер(ti|ti-1i-n+1)=βti-1i-n+1P(ti|ti-1i-n+1)+(1-βti-1i-n+1)Пинтер(ti|ti- 1i−n+2)

(6)

, который определяет сглаженную модель n-го порядка, где Pinter(ti|ti−1i−n+1) соответствует вероятности перехода после рекурсивного применения интерполяции. Мы оцениваем параметры β, настраивая нашу модель на наборе для разработки.

Рисунок 2: Наша триграмма HMM, принятая для маркировки PoS. Единицы, выделенные жирным шрифтом, выделены из состояний. Первое слово Şimdi выделяется из t1, тег последней морфемы во втором слове Dat выделяется из t2, а тег последней морфемы в третьем слове A1sg выделяется из t3.

Проблема разреженности также проявляется в вероятностях эмиссии. Мы выделяем тег последней морфемы в слове, если слово имеет более двух сегментов. В противном случае из тега PoS выдается само слово, как показано на рис. 2. Таким образом, вероятности выдачи оцениваются следующим образом:

p(wi|ti)={p(yn−1|ti), если wi={m1/y1+⋯+mn−1/yn−1}p(wi|ti), иначе

(7)

, где yn−1 — тег морфемы последнего суффикса в слове. Применим интерполяцию к гладкому p(wi|ti) для слов, которые не существуют в корпусе и не могут быть сегментированы дальше:

Пинтер(wi|ti)=αP(wi|ti)+(1−α)max(f(wi),1)N

(8)

Здесь Pinter(wi|ti) соответствует сглаженным вероятностям эмиссии, f(wi) – количество словесных токенов типа wi, N – размер словаря, α – интерполяционный коэффициент.

Алгоритм

Витерби применяется для поиска последовательности тегов PoS, которая максимизирует апостериорную вероятность, указанную в уравнении 3.3.

4 Эксперименты и результаты

4.1 Данные

Для экспериментов мы использовали несколько разных корпусов. Один из них — METU-Sabancı Turkish Treebank [17] , который состоит из 56 тыс. токенов слов и 5600 предложений. Набор данных включает теги PoS и морфологический анализ слов.

Для дополнительных экспериментов, чтобы сравнить нашу модель CRF с полумарковской моделью Ryan et al. [4] , мы использовали их набор данных, который состоит из 3573 морфологически сегментированных и помеченных токенов слов, из которых 1987 слов принадлежат набору поездов и 1586 слов — тестовому набору.

Чтобы сравнить нашу модель маркировки PoS с Sak et. др. [16] , мы использовали их обучающую и тестовую выборку, собранную из различных газетных архивов. Этот набор данных состоит из ~800 тыс. токенов слов и ~47,5 тыс. предложений.

Для всех экспериментов мы использовали отдельный набор для разработки, состоящий из 6 тысяч слов, для настройки коэффициентов интерполяции. Мы присвоили α = 0,9 для вероятностей испускания, β1 = 0,6 (биграмма) и β2 = 0,4 (униграмма) для вероятностей перехода биграммы, и β1 = 0,5 (триграмма), β2 = 0,3 (биграмма) и β3 = 0,2 (униграмма). ) для интерполяции, используемой в триграммных переходах.

Для экспериментов по тегированию морфем мы удалили все знаки препинания из наборов данных и вновь ввели конечную пунктуацию для задачи тегирования PoS, поскольку границы слов имеют решающее значение для тегирования PoS.

4.2 Эксперименты по морфологическому мечению

В задаче тегирования морфем мы предполагаем, что морфологическая сегментация слов обеспечена. Мы получили сегментации и метки морфем с помощью морфологического анализатора с открытым исходным кодом под названием Zemberek [1] , чтобы построить набор поездов для задачи маркировки морфем. Земберек определяет 84 различных тега морфем в банке деревьев Metu-Sabancı. Мы использовали пакет CRF с открытым исходным кодом [18] для обучения нашей собственной модели на нашем обучающем наборе. Некоторые из морфем, принадлежащих к одному и тому же тегу морфемы, полученному из тестового набора с использованием обученной модели CRF, приведены в таблице 1. Окончательные теги морфем показывают, что наша модель может изучать алломорфы. Например, la, le, yla и yle — все алломорфы.

Таблица 1: Некоторые морфемы и их теги (с частотами), полученные из нашей модели CRF.0002 Мы снова использовали Zemberek для создания золотых наборов для задачи по тегированию морфем. Баллы F1 для морфологической маркировки для разных размеров поездов и тестовых наборов, полученных из турецкого банка дерева Metu-Sabancı, приведены в таблице 2. ² ² мы делаем только теги морфем, а не какую-либо сегментацию. Показатель F1 модели составляет 80,7% для тренировочного набора с 500 словами, тогда как показатель F1 увеличивается до 94,1% на тренировочном наборе 5K.

Таким образом, оценка F1 значительно улучшается на больших тренировочных наборах.

Мы также проверили нашу модель на собранных вручную газетных архивах, которые намного больше, чем турецкое дерево Мету-Сабанчи. Мы получили оценку F1 93,7% на наборе поездов 5K и тестовом наборе 700K. Это показывает, что производительность нашей модели существенно не падает для больших наборов тестов. Результаты приведены в таблице 3.

Таблица 3: Результаты мечения морфем в газетных архивах, собранных вручную.

Мы сравнили нашу модель с бурундуком [4] , используя их набор тегов и наборы данных. Результаты представлены в таблице 4. Наша модель CRF превосходит их модель по точности, тогда как их модель превосходит нашу по показателю F1. Однако следует отметить, что в наборе данных Chipmunk отсутствуют теги морфем деривации, тогда как в нашей модели мы также изучаем теги морфем деривации.

Таблица 4: Сравнение бурундука [4] и нашей модели CRF для маркировки морфем

4.

3 Эксперименты по тегированию PoS

Наш набор тегов PoS состоит из 13 основных тегов PoS [8] , а именно Adj, Adv, Conj, Det, Interj, Noun, Num, Postp, Pron, Punc, Verb, Ques, Dup.

Таблица 5: Показатели точности маркировки PoS на Metu-Sabancı Turkish Treebank

Мы протестировали нашу модель на двух разных наборах данных. Первая серия экспериментов была проведена на турецкой отмели Мету-Сабанджи. Результаты приведены в таблице 5 для разных размеров поездов/испытательных наборов и для разных типов выбросов. Мы предоставляем результаты для эмиссий слов, эмиссий последнего суффикса и тега эмиссии последней морфемы. Для обучающего набора 5K точность выделения слов составляет 84,8%, точность выделения суффиксов — 86,2%, а точность выделения тегов морфем — 88,9.%. Это показывает, что использование эмиссии тегов морфем превосходит как эмиссию слов, так и эмиссию последнего суффикса в небольших наборах данных. Точность увеличивается на наборе поездов ~ 40K, но по-прежнему использование выбросов тегов морфем превосходит использование выбросов слов и последних суффиксов.

Результаты, полученные из газетных архивов, собранных вручную, приведены в таблице 6. На этот раз использование эмиссии слов превосходит использование последней эмиссии суффикса и последней морфемной метки, потому что разреженность больше не становится проблемой в больших наборах поездов.

Таблица 6: Показатели точности тегирования PoS в газетных архивах, собранных вручную алгоритм персептрона [16] на наборах данных, полученных из банка деревьев Metu Sabancı Turkish Treebank.

Чтобы измерить влияние терминальной пунктуации на маркировку PoS, мы провели две серии экспериментов на Metu Sabancı Turkish Treebank. В первую серию экспериментов мы включили терминальную пунктуацию, тогда как во вторую серию экспериментов мы исключили терминальную пунктуацию. Включая терминальную пунктуацию, сначала мы построили один HMM для каждого предложения в обучающем наборе, во-вторых, мы построили только один HMM для всего корпуса, где все слова связаны друг с другом на одном и том же HMM, которые разделены терминальной пунктуацией. Мы получили точность 88,9% для нескольких подходов HMM, тогда как мы получили точность 88,6% для одного подхода HMM на наборе поездов 5K. Во второй серии экспериментов мы полностью исключили терминальную пунктуацию и повторили эксперименты для нескольких HMM и одного HMM. Мы получили точность 87,5% для нескольких HMM, тогда как мы получили точность 86,3% для одного HMM. Результаты представлены в Таблице 7. Она показывает, что, несмотря на то, что терминальная пунктуация играет важную роль в маркировке PoS, поведение каждого предложения как одного HMM, предполагая, что предложения независимы друг от друга, приводит к небольшому повышению точности.

Мы сравнили нашу модель с Sak et al. [16] и Dincer et al. [19] на берегу турецкого дерева Мету Сабанчи. Мы использовали последние 5 букв каждого слова с HMM второго порядка для реализации тега на основе суффикса, разработанного Dincer et al. [19] , так как их модель дает лучшие результаты для последних 5 букв. Результаты представлены в таблице 8. Результаты показывают, что наша модель превосходит две другие модели на меньших наборах данных (т. е. 5K и 18K).

Получение данных является одной из основных проблем в задачах обработки естественного языка. Использование небольших наборов данных за счет уменьшения разреженности — одна из проблем обработки естественного языка. Здесь мы стремились повысить точность маркировки PoS для агглютинирующего языка в небольших наборах данных, когда большие наборы данных недоступны. Наши результаты показывают, что можно использовать своего рода языковую модель на основе классов, группируя морфемы в соответствии с их синтаксическими ролями в слове, маркируя их, а затем используя их для маркировки PoS, чтобы уменьшить разреженность в небольших наборах данных.

5 Заключение и будущая работа

Мы представили модель CRF для синтаксической маркировки морфем и модель HMM для маркировки PoS, которая использует эти метки морфем, чтобы уменьшить разреженность маркировки турецких PoS для небольших наборов данных. Нам удалось получить теги морфем с оценкой F1 94,1% на ограниченном тренировочном наборе с использованием CRF. Затем мы обучили модель HMM второго порядка с последним тегом морфемы каждого слова, испускаемого из каждого состояния HMM, для выполнения маркировки PoS, в отличие от традиционного подхода, использующего поверхностные формы слов, испускаемые из состояний HMM. Результаты показывают, что использование тегов последней морфемы помогает справиться с разреженностью, особенно в небольших наборах поездов.

Мы полагаем, что морфологические особенности контекстных слов также будут информативны в задаче тегирования морфем, поскольку Eryigit et al. [9] показывает, что использование флективных групп в качестве единиц при синтаксическом анализе турецких зависимостей повышает производительность синтаксического анализа. Мы оставляем использование контекстной информации в тегах морфем как будущую работу.

6 Благодарностей

Это исследование поддерживается Советом по научным и технологическим исследованиям Турции (TUBITAK) с номером проекта EEEAG-115E464, и мы благодарны TUBITAK за их финансовую поддержку.

Каталожные номера

[1] Акин, А.А., Акин, доктор медицинских наук: Zemberek, инфраструктура NLP с открытым исходным кодом для тюркские языки. Структура 10, 1–5 (2007)
[2] Antworth, LE: PC-KIMMO: двухуровневый процессор для морфологического анализа. Периодические публикации по академическим вычислениям, Даллас (1990 г.)
[3] Кан, Б., Манандхар, С.: Алгоритм агломеративной иерархической кластеризации для маркировка морфем. В: Труды последних достижений в области естественных наук. Языковая обработка 2013. RANLP 2013 (2013)
[4] Коттерелл, Р., Мюллер, Т., Фрейзер, А., Шютце, Х.: Маркировка морфологическая сегментация с полумарковскими моделями. В: Материалы Девятнадцатая конференция по компьютерному изучению естественного языка. стр. 164–174. Ассоциация компьютерной лингвистики, Пекин, Китай (июль 2015 г.), http://www.aclweb.org/anthology/K15-1017.
[5] Кройц М., Лагус К.: Открытие морфем без присмотра. В: Материалы Семинар ACL-02 по морфологическому и фонологическому обучению — Том 6. стр. 21–30. MPL ’02, Ассоциация компьютерной лингвистики, Страудсбург, Пенсильвания, США (2002)
[6] Кройц М., Лагус К.: Создание морфологического словаря естественного языка из неаннотированного текста. В: Труды Международного и Междисциплинарная конференция по адаптивному представлению знаний и Рассуждение (АКРР’05) (2005)
[7] Дургар Эль-Кахлут, И., Офлазер, К.: Первоначальные исследования на английском языке для Турецкий статистический машинный перевод. В: Материалы семинара по Статистический машинный перевод. стр. 7–14. Ассоциация вычислительных Лингвистика, Нью-Йорк (июнь 2006 г.), http://www.aclweb.org/anthology/W06-3102
[8] Эхсани, Р., Альпер, М.Е., Эрийгит, Г., Адали, Э.: Устранение неоднозначности основного положения теги для турецкого языка. В: Труды ROCLING — Конференция по вычислительной технике Лингвистика и обработка речи. Ассоциация компьютерной лингвистики и обработка китайского языка (ACLCLP), Тайвань (2012 г.)
[9] Эригит, Г. , Нивре, Дж., Офлазер, К.: Разбор зависимостей турецкого языка. вычисл. Лингвист. 34 (3), 357–389 (сентябрь 2008 г.)
[10] Голдсмит, Дж.: Неконтролируемое изучение морфологии естественного языка. Компьютерная лингвистика 27 (2), 153–19.8 (июнь 2001 г.)
[11] Хаккани-Тюр, Д.З., Офлазер, К., Тюр, Г.: Статистическая морфология устранение неоднозначности для агглютинативных языков. Компьютеры и гуманитарные науки 36(4), 381–410 (2000)
[12] Коскенниеми, К.: Двухуровневая морфология: общая вычислительная модель для распознавание и производство словоформ. Кафедра общего языкознания, Хельсинкский университет (1983 г.)
[13] Лафферти, Дж. Д., МакКаллум, А., Перейра, Ф. К. Н.: Условные случайные поля: Вероятностные модели для сегментации и маркировки данных последовательности. В: Материалы восемнадцатой Международной конференции по машинному обучению. стр. 282–289.. ICML ’01, Morgan Kaufmann Publishers Inc., Сан-Франциско, Калифорния, США (2001)
[14] Офлазер, К. : Двухуровневое описание турецкой морфологии. В: Материалы Шестая конференция Европейского отделения Ассоциации вычислительных Лингвистика. стр. 472–472. EACL ’93, Ассоциация вычислительных Лингвистика, Страудсбург, Пенсильвания, США (1993)
[15] Пун, Х., Черри, К., Тутанова, К.: Неконтролируемая морфологическая сегментация с логлинейными моделями. В: Proceedings of Human Language Technologies: The 2009 г.Ежегодная конференция Североамериканского отделения Ассоциации Компьютерная лингвистика. стр. 209–217. NAACL ’09, Ассоциация Компьютерная лингвистика, Страудсбург, Пенсильвания, США (2009 г.)
[16] Сак, Х., Гюнгор, Т., Сарачар, М.: Морфологическое устранение неоднозначности турецкого текста с помощью алгоритма персептрона. В: Компьютерная лингвистика и интеллектуальная обработка текста: 8-я международная конференция, CICLing 2007. стр. 107–118. Springer Berlin Heidelberg, Берлин, Гейдельберг (2007 г.)
[17] Сэй Б., Зейрек Д., Офлазер К., Озге У.: Разработка корпуса и treebank для современного письменного турецкого языка. В: Материалы одиннадцатой Международная конференция турецкого языкознания. стр. 183–192 (2002 г.)
[18] Ша, Ф., Перейра, Ф.: Поверхностный анализ с условными случайными полями. В: Материалы конференции 2003 года Североамериканского отделения Ассоциация компьютерной лингвистики по технологиям человеческого языка-Volume 1. С. 134–141. Ассоциация компьютерной лингвистики (2003 г.)
[19] Танер Динчер, Бахар Караоглан, Т.К.: суффикс, основанный на части речи. тег для турецкого языка. В: Труды Международного и Междисциплинарная конференция по адаптивному представлению знаний и Рассуждение (АКРР’05) (2005)
[20] Вирпиоя, С., Кохонен, О., Лагус, К.: Неконтролируемый анализ морфем с алломорфесор. В: Оценка многоязычного доступа к информации I. Текст Поисковые эксперименты: 10-й семинар Форума межъязыковой оценки, CLEF 2009. стр. 609.–616. Springer Berlin Heidelberg, Берлин, Гейдельберг (2010)

ноль морфем | Оксфордская исследовательская энциклопедия лингвистики

Аккема, П. (1995). Синтаксис ниже нуля (Неопубликованная докторская диссертация). Утрехтский университет.
Андерсон С.Р. (1992). А-морфная морфология . Кембридж, Великобритания: Издательство Кембриджского университета.
Арад, М. (2003). Ограничения местности на интерпретацию корней: случай еврейских именных глаголов. Естественный язык и лингвистическая теория , 21 , 737–778.
Аронофф, М. (1994). Морфология сама по себе . Кембридж, Массачусетс: MIT Press.
Арреги, К., и Невинс, А. (2012). Морфотактика: баскские вспомогательные средства и структура Spellout . Дордрехт, Нидерланды: Springer.
Бауэр, Л., и Валера, С. (2005). Подходы к конверсии/нулевой деривации . Мюнстер, Германия: Ваксманн.
Бауэр, Л., Либер, Р., и Плаг, И. (2013). Оксфордский справочник по морфологии английского языка . Оксфорд, Великобритания: Издательство Оксфордского университета.
Борода, Р. (1995). Базовая морфология лексемы-морфемы . Нью-Йорк, штат Нью-Йорк: SUNY Press.
Бермудес-Отеро, Р. (2012). Архитектура грамматики и разделение труда в экспоненте. В J. Trommer (Ed.), Морфология и фонология экспоненты (стр. 8–84). Оксфорд, Великобритания: Издательство Оксфордского университета.
Бхатт Р. и Панчева Р. (2006). Неявные аргументы. В M. Everaert & H. van Riemsdijk (Eds.), . Компаньон Блэквелла к синтаксису (стр. 558–588). Лондон, Великобритания: Блэквелл.
Бьезма, М. (2009). О последствиях маленького роста: императивы в испанском языке. В А. Шардле, М. Уолкоу и М. Абдуррахмане (редакторы), NELS 38: Материалы 38-го ежегодного собрания Северо-восточного лингвистического общества (том 1, стр. 89–101). Амхерст, Массачусетс: GLSA.
Блох, Б. (1947). Изменение английского глагола. Язык , 23 , 399–418.
Бобаджик, Дж. Д. (2017). Распределенная морфология. В The Oxford Research Encyclopedia of Linguistics . Издательство Оксфордского университета.
Бонет, Э. (1991). Морфология после синтаксиса (неопубликованная докторская диссертация). Массачусетский технологический институт, Кембридж.
Борер, Х. (2013). Принятие формы . Оксфорд, Великобритания: Издательство Оксфордского университета.
Борьярс, К., и Донохью, М. (2000). Много шума из ничего: черты и нули в германских словосочетаниях. Studia Linguistica , 54 , 309–353.
Бошкович, З. (1997). Синтаксис бесконечного дополнения: экономичный подход . Кембридж, Массачусетс: MIT Press.
Бреснан, Дж. (1995). Лексико-функциональный синтаксис (Барселонская версия). Неопубликованная MS., Стэнфордский университет. Представлено на Европейской летней школе по логике, языку и информации . Университет Барселоны, 13–25 августа.
Броуди, М. (2000). Теория зеркала: синтаксическое представление в совершенном синтаксисе. Лингвистическое исследование , 31 , 29–56.
Байби, Дж. (1991). Естественная морфология: организация парадигм и овладение языком. В T. Huebner & CA Ferguson (Eds.), Перекрестные течения в овладении вторым языком и лингвистической теории (стр. 67–92). Амстердам, Нидерланды: Джон Бенджаминс.
Каха, П. (2009). Наносинтаксис случая (неопубликованная докторская диссертация). Университет Тромсё.
Хомский, Н. (2001). Вывод по фазам. В М. Кенстович (ред.), Кен Хейл: жизнь в языке (стр. 1–52). Кембридж, Массачусетс: MIT Press.
Кларк, Э. В., и Кларк, Х. Х. (1979). Когда существительные появляются как глаголы. Язык , 55 , 767–811.
Корбетт, Г. Г. (1991). Пол . Кембридж, Великобритания: Издательство Кембриджского университета.
Корбетт, Г.Г. (2006). Соглашение . Кембридж, Великобритания: Издательство Кембриджского университета.
Декани, Э. (2012). Профиль венгерского DP (неопубликованная докторская диссертация). Университет Тромсё.
Дон, Дж. (1993). Морфологическая конверсия (неопубликованная докторская диссертация). Утрехтский университет.
Дон, Дж. (2004). Категории в лексиконе. Языкознание , 42 , 931–956.
Дресслер, У. У. (1987). Словообразование как часть естественной морфологии. В WU Dressler, W. Mayerthaler, O. Panagl, & WU Wurzel (Eds.), Лейтмотивы в естественной морфологии (стр. 99–127). Амстердам, Нидерланды: Джон Бенджаминс.
Дресслер, В.У., Майерталер, В., Панагль, О., и Вурцель, В.У. (1987). Лейтмотивы природной морфологии . Амстердам, Нидерланды: Джон Бенджаминс.
Эмбик, Д., и Халле, М. (2005). О статусе стеблей в морфологической теории. В T. Geerts & H. Jacobs (Eds.), Proceedings of Going Romance 2003 (стр. 59–88). Амстердам, Нидерланды: Джон Бенджаминс.
Эмбик, Д. (2010). Локализм против глобализма в морфологии и фонологии . Кембридж, Массачусетс: MIT Press.
Фасанелла, А. (2014). О том, как механизмы обучения формируют естественные языки (Неопубликованная докторская диссертация). CLT-Автономный университет Барселоны.
Фасанелла, А., и Фортуни, Дж. (2011). Вывод лингвистических вариаций из условий обучения: процедура разделения на фрагменты (неопубликованная рукопись). Автономный университет Барселоны.
Фрухтер Дж., Стоколл Л. и Маранц А. (2013). MEG замаскировал начальные доказательства разложения неправильных глаголов на основе формы. Границы нейронауки человека , 7 , 1–16.
Жервен, Дж., и Мелер, Дж. (2010). Восприятие речи и овладение языком в первый год жизни. Ежегодный обзор психологии , 61 , 191–218.
Хейл, К., и Кейзер, С.Дж. (1993). О структуре аргумента и лексическом представлении синтаксических отношений. В K. Hale & SJ Keyser (Eds.), Вид из здания 20 (стр. 53–109). Кембридж, Массачусетс: MIT Press.
Хейл, К., и Кейзер, С.Дж. (2002). Пролегомены к теории структуры аргумента . Кембридж, Массачусетс: MIT Press.
Халле М. и Маранц А. (1993). Распределенная морфология и части перегиба. В K. Hale & SJ Keyser (Eds.), Вид из здания 20 (стр. 111–176). Кембридж, Массачусетс: MIT Press.
Харли, Х., и Нойер, Р. (2000). Формальные и энциклопедические свойства лексики: данные номинализации. В Б. Питерс (ред.), Интерфейс словаря-энциклопедии . Амстердам, Нидерланды: Elsevier.
Hockett, CF (1947). Проблемы морфемного анализа. Язык , 23 , 321–343.
Кипарский, П. (1982). Лексическая фонология и морфология. В IS Yang (Ed.), Языкознание в утреннем затишье (стр. 3–91). Сеул, Южная Корея: Хансин.
Курису, К. (2001). Фонология реализации морфем (Неопубликованная докторская диссертация). Калифорнийский университет в Санта-Круз.
Лашарите, Д., и Веллингтон, Дж. (1999). Пассивный залог в ямайском креольском: фонетически пустой, но синтаксически активный. Журнал пиджинских и креольских языков , 14 , 259–283.
Лейвада, Э. (2016). Природа и пределы различий между языками и патологиями (неопубликованная докторская диссертация). Университет Барселоны.
Либер, Р. (1981). Об организации лексики (Неопубликованная докторская диссертация). Университет Нью-Гэмпшира, Дарем.
Либер, Р. (2004). Морфология и лексическая семантика . Чикаго, Иллинойс: University of Chicago Press.
Манова, С. , и Дресслер, В. У. (2005). Морфологический прием преобразования по флективно-фузионному типу. В L. Bauer & S. Valera (Eds.), Подходы к преобразованию / нулевой деривации (стр. 67–102). Мюнстер, Германия: Ваксманн.
Маранц, А. (1997). От синтаксиса никуда не деться: не пытайтесь проводить морфологический анализ в уединении собственного лексикона. В А. Димитриадис, Л. Сигел, К. Сурек-Кларк и А. Уильямс (ред.), Труды 21-го ежегодного коллоквиума по лингвистике Пенсильвании (стр. 201–225). Филадельфия: кафедра лингвистики Пенсильванского университета.
Маранц, А. (2013). Невозможно избежать морфем при морфологической обработке. Язык и когнитивные процессы , 28 , 905–916.
Маркус, А. (2015). Укрощение венгерского (не) транзитивного зоопарка (неопубликованная докторская диссертация). Университет Тромсё.
Майерталер, В. (1987). Системно-независимая морфологическая естественность. В WU Dressler, W. Mayerthaler, O. Panagl, & WU Wurzel (Eds.), Лейтмотивы в естественной морфологии (стр. 25–59). Амстердам, Нидерланды: Джон Бенджаминс.
Мельчук И. (2002). На пути к формальному понятию «нулевой лингвистический знак». В Сабрине Бенджабалла, В. У. Дресслер, О. Э. Пфайффер и М. Д. Воейкова (ред.), Morphology 2000 (стр. 241–258). Амстердам, Нидерланды: Джон Бенджаминс.
Майерс, С. (1984). Нулевой вывод и перегиб. Рабочие документы Массачусетского технологического института по лингвистике , 7 , 53–69.
Невинс, А. (2012). Гаплологическое диссимиляция на разных стадиях экспоненты. В Дж. Троммер (ред.), Морфология и фонология экспоненты (стр. 84–117). Оксфорд, Великобритания: Издательство Оксфордского университета.
Нида, Э. (1948). Идентификация морфем. Язык , 24 , 414–441.
Нойер, Р. (1997). Признаки, позиции и аффиксы в автономной морфологической структуре . Нью-Йорк, штат Нью-Йорк: Гарленд.
Олтра-Массуэ И. (1999). О понятии тематической гласной: новый подход к каталонской глагольной морфологии (Неопубликованная магистерская диссертация). Массачусетский технологический институт.
Перлмуттер, Д. (1971). Ограничения глубинной и поверхностной структуры в синтаксисе . Нью-Йорк, штат Нью-Йорк: Холт, Райнхарт и Уинстон.
Пескарини, Д. (2011). Отображение романтических клитических последовательностей. Quaderni di lavoro ASIt , 12 , 1–29.
Песецкий Д. (1995). Нулевой синтаксис: эксперименты и каскады . Кембридж, Массачусетс: MIT Press.
Пфау, Р. (2000). Особенности и категории языкового производства (Неопубликованная докторская диссертация). Университет Франкфурта.
Пинкер, С. (1991). Правила языка. Наука , 253 , 530–534.
Плаг, И. (2003). Словообразование в английском языке . Кембридж, Великобритания: Издательство Кембриджского университета.
Плиацикас, К., Уилдон, Л., Лахири, А., и Хансен, П. К. (2014). Обработка слов, производных от нуля, в английском языке: исследование фМРТ. Нейропсихология , 53 , 47–53.
Князь А., Смоленский. (2004 [1993]). Теория оптимальности: взаимодействие ограничений в порождающей грамматике . Лондон: Издательство Блэквелл.
Рэдфорд, А. (1997). Теория синтаксиса и структура английского языка . Кембридж, Великобритания: Издательство Кембриджского университета.
Рамчанд, Г. (2008). Синтаксис первой фазы . Кембридж, Великобритания: Издательство Кембриджского университета.
Робертс, П. (1993). Западные индейцы и их язык . Кембридж, Великобритания: Издательство Кембриджского университета.
Скализ, С. (1984). Генеративная морфология . Дордрехт, Нидерланды: Foris.
Сиддики, Д. (2006). Минимизация степени: влияние экономии на модель морфосинтаксического компонента грамматики (неопубликованная докторская диссертация). Университет Аризоны, Тусон.
Старке, М. (2009). Наносинтаксис: краткий учебник по новому подходу к языку. Нордлыд , 36 , 1–6.
Стюарт, Т., и Стамп, Г. (2007). Морфология парадигмальных функций и интерфейс морфология-синтаксис. В G. Ramchand & C. Reiss (Eds.), Оксфордский справочник лингвистических интерфейсов (стр. 383–422). Оксфорд, Великобритания: Издательство Оксфордского университета.
Свенониус, П. (2016). Пролеты и слова. В Д. Сиддики и Х. Харли (ред.), Морфологическая метатеория (стр. 201–222). Амстердам, Нидерланды: Джон Бенджаминс.
Троммер, Дж. (2012) Ø-экспонента. В J. Trommer (Ed.), Морфология и фонология экспоненты (стр. 326–355). Оксфорд, Великобритания: Издательство Оксфордского университета.
Вильдген В. (1982) . Теоретическая семантика катастроф . Амстердам, Нидерланды: Джон Бенджаминс.
Вундерлих Д. и Фабри Р. (1995). Минималистская морфология: подход к перегибу. Zeitschrift für Sprachwissenschaft , 14 , 236–294.
Зануттини, Р. (1997). Отрицание и клаузальная структура . Оксфорд, Великобритания: Издательство Оксфордского университета.

этимология — Можно ли преобразовать иностранные слова в английские морфемы?

Я полагаю, это зависит от того, как вы определяете два термина «иностранные слова» и «английские морфемы». Я бы не назвал английское слово «компаньон» иностранным словом; для меня это просто его этимологическое происхождение.

Я думаю, что морфемы обычно считаются немного более абстрактными и общими, чем то, что вы имеете в виду. В частности, я не знаю ни одного требования, чтобы они были очевидны для лингвистически наивных носителей языка. Но на самом деле производные от латыни морфемы, такие как префикс com-, настолько распространены в современной английской лексике, что я думаю, неправильно утверждать, что они ничего не значат для носителей английского языка. Я также не думаю, что существует какое-либо правило, согласно которому все заимствованные слова автоматически становятся мономорфными.

Относительно образования новых слов из этих морфем (продуктивность): Существуют морфемы исконно английского языка, которые не являются продуктивными, например префикс gain- перед gainsay . Это все еще считается морфемой.

Вы согласны со своим профессором, что -корабль — отдельная морфема.

Это дает нам товарищеский корабль .

Компания против компаньона = суффикс

-на или -ion ?

Слова Компания и компаньон кажутся мне родственными морфологически. Если вы согласны, вы можете видеть, что «наибольший общий знаменатель» этих слов — это что-то вроде compani- или compani- (последнее работает, если мы рассматриваем и как чисто графические варианты, а /i/ и /j/ должны быть аллофоническими или алломорфными вариантами, которые обусловлены наличием или отсутствием следующей гласной).

Если компаньон и компаньон морфологически родственны, мне кажется, что спутник не может быть одной морфемой; в конце должна быть какая-то другая морфема. Существуют такие пары слов, как , отношение / , отношение, и , un-ite / , союз , которые показывают предполагаемую морфему -ion в другом контексте, поэтому кажется разумным разделить компаньон. в компаньон . (Примечание: «-tion» на самом деле рассматривается многими лингвистами как морфема; « -tion в творении» указана как связанная морфема в этих конспектах лекций по курсу «Лингвистика 101», который читает Марк Либерман в Пенсильванском университете. Я полагаю, вы могли бы сказать, что оно несет в себе значение части речи, так как этот суффикс обычно появляется у существительных.) С другой стороны, компаньон действительно ведет себя немного аномально в некоторых отношениях для слова с суффиксом -(t )ion :

обычно этот суффикс принимает форму -tion или -сион. Слово union на самом деле аномально из-за отсутствия t/s.
обычно эти слова являются абстрактными или представляют собой результаты абстрактных процессов; но компаньон относится к конкретному человеку.
обычно буквы а, е, или o получают свое «напряженное» или «долгое» произношение, когда за ними следует один согласный (на «основном» уровне; то есть, не считая одиночных звуков, представленных удвоенными буквы типа «сс» в одержимость ) и суффикс -ion. Например, создание и истирание. Но компаньон произносится с кратким/расслабленным а.

Если мы посмотрим на историю, компаньон на самом деле не был образован суффиксом -ion. Предполагается, что гипотетический латинский предок compāniō состоял из префикса com-, комбинации формы pani- от panis «хлеб» и увеличительного суффикса 9.0398 -ō ( n-) (также встречается в таких именах, как Цицерон ). Латинское слово перешло во французский язык, который является непосредственным источником английского слова.

Мне не имеет смысла анализировать морфологию на основе этимологических знаний, недоступных большинству носителей языка. Однако эта информация, а также ранее упомянутые аномалии, если мы интерпретируем суффикс как -ion, , делают меня более склонным анализировать слово как compani-on.

Во всяком случае, на количество морфем это не влияет. Это дает нам компаньонов на корабле или компаньонов на корабле.

Идентификация

com- из компаньона как префикса
Как говорят mkennedy и Adam, com- существует как префикс во многих английских словах, обычно означающий что-то вроде «вместе» или «с». Да, большинство слов с этим префиксом были взяты из латыни целиком, а не объединены в английском языке, но теперь они все еще являются английскими словами. Итак, мы можем выделить это как отдельную морфему. Грег Ли указывает в своем ответе на еще одно убедительное доказательство: пониженное качество первой гласной. По-видимому, в «Звуковом образце английского языка» Хомского и Галле упоминается тот факт, что морфологически простые слова имеют тенденцию не уменьшать гласный начального закрытого слога, когда второй слог имеет ударение: рассмотрим произношение «Монтана», «спонтанный», «фондю». , «бомбардный», «напыщенный», «тромбоновый», «раковистый». Обратите внимание, что есть причины идентифицировать «com-» как отдельную морфему, даже если мы смотрим для сравнения только на другие английские слова, а не на исходные латинские слова.
Это дает нам com-pani-ion-ship или com-pani-on-ship .
Но является ли
pan или pani английской морфемой?
Я согласен с тем, что pan(i) как морфему сомнительно идентифицировать (особенно ту, что имеет конкретное значение «хлеб»), поскольку я не могу придумать какие-либо другие общеупотребительные английские слова, в которых используется это pan(i). ) морфема «хлеб» (она есть в pannier и panini , но ни одна из них не кажется мне полностью натурализованной, и она есть в кладовая, но в не очень узнаваемом виде). Морфема должна быть значимой единицей, и не похоже, чтобы носители английского языка связывали какое-либо значение с pan(i) сами по себе.
Однако эта проблема не ограничивается одним этим словом. Двумя известными примерами являются cranberry- и rasp- (или /ræz/ фонематически) в словах cranberry и raspberry . Насколько я знаю, это обычно считаются морфемами, которые не имеют никакого значения, кроме их использования в этих конкретных словах. Но мы можем сказать, что это морфемы, потому что berry — явно отдельная морфема.
С товариществом, после того, как мы удалим четко идентифицируемые английские морфемы com- и -ship, и менее ясную, но явно присутствующую морфему -ion или -on, мы останемся с тем, что появляется быть морфемой pan , даже если этот тип анализа не говорит нам, что означает эта морфема.

	argmaxt1⋯tnP(t1⋯tn\|w1…wn)	=	argmaxt1⋯tnP(w1…wn\|t1⋯tn)P(t1⋯tn)P(w1⋯wn)
		∝	argmaxt1⋯tnP(w1⋯wn\|t1⋯tn)P(t1⋯tn)