этимология — Общий способ описания слов типа «понимать», основанный на архаичных значениях их составных частей
спросил
Изменено 2 года, 11 месяцев назад
Просмотрено 499 раз
Слово «понимать» завораживает. Поверхностный анализ слова дает мало информации о том, как компоненты связаны с понятием, связанным со словом. Напротив, в таких словах, как «остатки», нетрудно установить связь между кусочками и концепцией («слева» имеет смысл, поскольку какая-то часть целого была «слева», а «сверху», потому что часть то, что осталось, — это «сверху» часть, которая использовалась). А вот «понять» сложнее. Как выясняется, «под» используется в том смысле, в котором его использование в «понимать» больше не применяется к понятию «среди» или «между». Таким образом, «понимать» означает что-то вроде «стоять посреди» того, что понимается.
Мой вопрос: есть ли общий способ описать такое явление, когда слова состоят из компонентов, которые больше не имеют того значения, которое привело к их использованию в качестве такого компонента? Есть ли у этого явления название или связанный с ним массив исследований?
- однословные запросы
- этимология
- морфология
- сложные слова
- клюквенные морфемы
6
Этимология — это название области изучения того, как слова меняют свое значение с течением времени.
Все слова состоят как минимум из одной морфемы. Морфема – это наименьшая часть слова, несущая смысловую нагрузку. Например, «самый маленький» имеет две морфемы: «маленький» и «-ест», а «слово» имеет только одну морфему: «слово». Морфемы атомарны, потому что они больше не несут своего значения, если их еще уменьшить.
Этимология говорит нам, откуда взялись слова, но не говорит нам, что они означают сегодня, поскольку слова часто меняют свое значение по сравнению с тем, что они значили в прошлом.
Таким образом, для «понимать» у нас есть слово, в котором есть морфемы «понимать» и «стоять». Однако это не значит «стоять под», это значит «понимать». Значения обеих морфем настолько разошлись, что мы уже не понимаем (ха!) и не признаем их древних значений, тогда как слово в целом имеет значение, на которое не намекают составляющие его морфемы.
Этимология предназначена для того, чтобы найти смысл там, где история, основанная на нынешнем значении, затемнена.
Зарегистрируйтесь или войдите в систему
Зарегистрируйтесь с помощью Google
Зарегистрироваться через Facebook
Опубликовать как гость
Электронная почта
Обязательно, но не отображается
Опубликовать как гость
Электронная почта
Требуется, но не отображается
Нажимая «Опубликовать свой ответ», вы соглашаетесь с нашими условиями обслуживания, политикой конфиденциальности и политикой использования файлов cookie
.Как машины понимают текст. Большинство людей учатся читать через… | Алекс Митрани
Большинство людей учатся читать на практике. На уроке вас просили прочитать отрывок вслух. Если вы встретите слово, которое не можете произнести, скорее всего, вы не знаете, что это означает . Когда это происходит, вы либо спрашиваете кого-нибудь в классе, либо ищете слово. Вы делаете это несколько раз, пока у вас не будет достаточно понимания, чтобы перейти к более сложным текстам. С другой стороны, машины не могут научиться читать точно так же, как люди, однако с появлением обработки естественного языка (NLP) мы можем приблизиться к этому.
Языки содержат слова с одним или несколькими значениями и грамматическими правилами, определяющими структуру предложения. Машины блестяще изучают правила. Английский язык содержит множество правил построения предложений.
Корректное предложение состоит из одного или нескольких существительных, глаголов и артиклей. Например, давайте рассмотрим предложение « Базз Олдрин, Нил Армстронг и Майкл Коллинз отправились на Луну ». Это предложение содержит четыре существительных (« Базз Олдрин », « Нил Армстронг », « Майкл Коллинз », и « луна »), союз (« и »), глагол («
Первым шагом к тому, чтобы машины могли понимать язык , является кодификация этих правил. Мы должны закодировать правила грамматики и пометить все слова (или токенов ) их частями речи, потому что машины изначально не знают их значения. Context Free Grammar (CFG) представляет собой набор систематизированных грамматических правил, которые позволяют машинам определять, является ли предложение грамматически правильным или нет. Программисты могут писать CFG для коротких предложений, содержащих несколько слов, однако эта задача становится утомительной и почти невыполнимой, когда мы хотим исследовать большие корпуса.
Набор инструментов для работы с естественным языком (NLTK) содержит сводку грамматических правил и примеры их реализации на Python. NLTK предоставляет вам CFG, поэтому вам не нужно систематизировать каждое грамматическое правило и слово в английском языке. эти грамматические правила таким образом, чтобы программа могла анализировать текст.
Что делать, если фраза имеет более одного значения? Что, если слово может принадлежать нескольким частям речи и иметь несколько значений? Возьмем, к примеру, слово «ломтик». В предложении «Я собираюсь в
NLTK приводит несколько примеров того, как применять НЛП к неоднозначному тексту, включая шутку из фильма «Animal Crackers». Шутка, показанная на изображении выше, высмеивает двусмысленную структуру предложения. Если бы мы закодировали CFG, допускающий двусмысленный текст, мы получили бы два предложения, объясняющие, что Граучо носит пижаму, а Граучо — со слоном 9. 0065 в пижаме . Дерево синтаксического анализа визуализирует все возможные действительные значения, которые может быть прочитано одним предложением в соответствии с кодифицированной CFG. Дерево синтаксического анализа для шутки Граучо выглядит так:
Дерево синтаксического анализа для шутки Граучо Маркса. Изменено из размещенной книги NLTK, глава 8. Анализ структуры предложения, раздел 1.2 Вездесущая двусмысленность.NLTK позволяет нам генерировать теги POS, видимые в дереве синтаксического анализа, с помощью предварительно закодированных CFG. Ниже приведен код для получения этих тегов:
Код для получения тегов POS из текста с использованием NLTKВывод метода POS NLTK. Вывод метода NLTK .pos_tag()
представляет собой список кортежей, где первым элементом кортежа является слово, а вторым элементом является тег POS. Список POS-тегов и сокращений можно найти на веб-сайте факультета лингвистики Пенсильванского университета.