111111111111111111118 2011 2011 2011 2011 2011 2011 2011 2011 г. 2011 года. исследует состязательное обучение для изучения контекстных кодировщиков, которые создают инвариантные представления для разных языков, чтобы облегчить межъязыковую передачу, и предлагает использовать неаннотированные предложения из вспомогательных языков, чтобы помочь в изучении языково-независимых представлений.
Неконтролируемая перекрестная адаптация адаптации диапазонов зависимости с использованием CRF AutoEncoders Z. Li, Kewei TU Компьютерная наука
Результаты
2020 фреймворк для задачи межъязыковой адаптации парсеров зависимостей без аннотированных целевых корпусов и параллельных корпусов.
Двуязычные вложения слов на основе зависимостей без выравнивания слов . выравнивания (BilBOWA) с использованием линейных контекстов Bag-of-words и контекстов на основе зависимостей, чтобы предоставить доказательства того, что использование функций зависимости в двуязычных встраиваниях слов имеет различный эффект, основанный на синтаксическом сходстве и сходстве структуры предложения языковой пары.
с показателем 1-10 из 46 ссылок
Sort Byrelevancemost, под влиянием PapersRecency
Селективное совместное использование для многоязычного парирования зависимости Tahira Naseem, R. Barzilay, A. Globersing Computer Science, Linguiste, R. Barzilay, A. Globerson
, Computer Science, Linguiste, R. Barzilay, A. Globerson
, Computer Science, Linguiste, R. Barzilay, A. Globerson
.
Мы представляем новый алгоритм анализа многоязычных зависимостей, который использует аннотации из различных наборов исходных языков для анализа нового языка без аннотаций. Наша мотивация – расширить…
Адаптация и проекция анализатора с квази-синхронной грамматикой Дэвид А. Смит, Джейсон Эйснер Компьютерная наука
EMNLP
2009 We Connect Two Scendaries in Structure Learning. одного корпуса в другой стиль аннотаций и проецирование синтаксических аннотаций с одного языка на другой. Мы предлагаем…
Индукция грамматики зависимостей через ограничения проекции битекста Кузман Ганчев, Дженнифер Гилленуотер, Б. Таскар Информатика
ACL
2009 ограничивает пространство возможных целевых деревьев и оценивает подход к данным общих задач CoNLL в Болгарии и Испании и показывает, что он последовательно превосходит неконтролируемые методы и может превзойти контролируемое обучение для ограниченных обучающих данных.
Анализ межъязыковых зависимостей с использованием двуязычного лексикона Чжао Хай, Ян Сонг, К. Кит, Годун Чжоу Информатика
ACL
2009 4 9 Китайский синтаксический анализатор дает современный результат.
Межъязыковые кластеры слов для прямого переноса лингвистической структуры Оскар Тэкстрем, Райан Т. Макдональд, Якоб Ушкорайт Информатика, Лингвистика
NAACL
2012 Показано, что при дополнении систем прямого переноса межъязыковыми кластерными функциями относительная погрешность делексикализованных синтаксических анализаторов зависимостей, обученных на английских банках деревьев и переведенных на иностранные языки, может быть снижен до 13%.
Адаптация к целевому языку анализаторов различительного перевода Оскар Тэкстрем, Райан Т. Макдональд, Йоаким Нивре Информатика
NAACL
2013 В этой работе показано, как последние идеи по выборочному совместному использованию параметров могут быть применены к дискриминационному синтаксическому анализатору путем тщательной декомпозиции функций его модели, а также показано, как синтаксический анализатор можно повторно лексизировать и адаптировать с помощью немаркированного целевого объекта. языковые данные и метод обучения, который может включать различные источники знаний с помощью неоднозначных обозначений.
Передача из нескольких источников делексикализованных синтаксических анализаторов зависимостей Райан Т. Макдональд, Слав Петров, Кит Б. Холл Информатика
EMNLP
2011 Эта работа демонстрирует, что парсеры, производящие делексикализованные парсеры, могут быть значительно выше, чем парсеры, производящие делексикализованные парсеры, могут быть напрямую переданы между языками, делексикализованными парсерами и показывает, что простые методы введения нескольких исходных языков могут значительно улучшить общее качество результирующих синтаксических анализаторов.
Общая задача CoNLL-X по анализу многоязычных зависимостей S. Buchholz, E. Marsi Информатика
CoNLL
2006 Описано, как деревья деревьев для 13 языков были преобразованы в один и тот же общий формат зависимостей и как анализ производительности был преобразован в один и тот же общий формат зависимостей -языковой разбор.
Парсеры начальной загрузки посредством синтаксической проекции на параллельные тексты Использование параллельного текста для решения проблемы создания синтаксических аннотаций на других языках путем аннотирования английской стороны параллельного корпуса, перенос анализа на второй язык , и обучить стохастический анализатор на полученных зашумленных аннотациях.
Кросслингвальная индукция смысловых ролей Иван Титов, А. Клементьев Информатика
ACL
2012 В этой работе рассматривается неконтролируемая индукция семантических ролей из предложений, аннотированных автоматически прогнозируемыми представлениями синтаксической зависимости, и для этого используется современная генеративная байесовская непараметрическая модель. так.
разбор — Является ли слово «лексер» синонимом слова «парсер»? спросил 11 лет, 6 месяцев назад
Изменено
11 лет, 6 месяцев назад
Просмотрено
647 раз
В заголовке вопрос: Слова «лексер» и «парсер» синонимы или разные? Похоже, что в Википедии эти слова взаимозаменяемы, но английский не мой родной язык, поэтому я не уверен.
синтаксический анализ язык-агностик лексер синоним 2
Лексер используется для разделения входных данных на токены, тогда как синтаксический анализатор используется для построения абстрактного синтаксического дерева из этой последовательности токенов.
Теперь вы можете просто сказать, что токены — это просто символы и напрямую использовать синтаксический анализатор, но часто бывает удобно иметь синтаксический анализатор, которому нужно только просмотреть один токен, чтобы определить, что он собирается делать дальше.
Поэтому лексер обычно используется для разделения ввода на токены до того, как его увидит синтаксический анализатор.
Лексер обычно описывается с помощью простых правил регулярных выражений, которые проверяются по порядку. Существуют такие инструменты, как lex
, которые могут автоматически генерировать лексеры из такого описания.
[0-9]+ Номер
[A-Z]+ Идентификатор
+ Плюс
Анализатор, с другой стороны, обычно описывается путем указания грамматики . Опять же, существуют инструменты, такие как yacc
, которые могут генерировать синтаксические анализаторы из такого описания.
выражение ::= выражение Плюс выражение
| Число
| Идентификатор
Нет. Лексер разбивает входной поток на «слова»; парсер обнаруживает синтаксическую структуру между такими «словами». Например, при вводе:
скорость = путь/время;
вывод лексера:
скорость (идентификатор)
= (оператор присваивания)
путь (идентификатор)
/ (бинарный оператор)
время (идентификатор)
; (разделитель операторов)
и тогда синтаксический анализатор может установить следующую структуру:
= (назначить)
lvalue: скорость
rvalue: результат
/ (разделение)
дивиденд: содержимое переменной "путь"
делитель: содержимое переменной "время"
Нет. Лексер разбивает исходный текст на лексемы, тогда как синтаксический анализатор соответствующим образом интерпретирует последовательность лексем.
Они разные.
Лексер принимает поток входных символов в качестве входных данных и создает токены (также известные как «лексемы») в качестве выходных данных.
Синтаксический анализатор принимает токены (лексемы) в качестве входных данных и создает (например) абстрактное синтаксическое дерево, представляющее операторы.
Однако они достаточно похожи, поэтому многие люди (особенно те, кто никогда не писал ничего похожего на компилятор или интерпретатор) рассматривают их как одно и то же или (чаще) используют «анализатор», когда они действительно имеют в виду это «лексер».
Насколько мне известно, лексер и парсер близки по значению, но не являются точными синонимами. Хотя многие источники используют их как аналогичные, лексер (аббревиатура от лексического анализатора) идентифицирует токены, относящиеся к языку, из входных данных; в то время как синтаксические анализаторы определяют, соответствует ли поток токенов грамматике рассматриваемого языка.