Разбор слова па саставе онлайн: Словарь синонимов sinonim.org

Структура маркировки от грубой до точной для совместной сегментации слов, маркировки POS и разбора составляющих

Ян Хоу, Хоуцюань Чжоу, Чжэнхуа Ли, Ю Чжан, Мин Чжан, Чжэн Ван, Баосин Хуай, Николас Цзин Юань


Abstract
Самый простой подход к сегментации объединенных слов (WS), маркировке частей речи (POS) и анализу составляющих заключается в преобразовании дерева на уровне слов в дерево на уровне символов, которое, однако приводит к двум серьезным проблемам. Во-первых, больший набор меток (например, ≥ 600) и более длинные входные данные увеличивают вычислительные затраты. Во-вторых, трудно исключить недопустимые деревья, содержащие конфликтующие продукционные правила, что важно для надежной оценки модели. Если тег POS (например, VV) находится над тегом фразы (например, VP) в дереве вывода, определить границы слов становится довольно сложно. Чтобы справиться с обеими проблемами, в этой работе предлагается двухэтапная структура маркировки от грубой до точной для совместного WS-POS-PAR. На этапе грубой маркировки совместная модель выводит дерево в квадратных скобках, в котором каждый узел соответствует одной из четырех меток (то есть фразе, подфразе, слову, подслову). Гарантируется, что дерево является допустимым благодаря ограниченному декодированию CKY. На этапе тонкой маркировки модель расширяет каждую грубую метку до конечной метки (например, VP, VP*, VV, VV*). Эксперименты с китайскими Penn Treebank 5.1 и 7.0 показывают, что наша совместная модель стабильно превосходит конвейерный подход как при использовании без, так и при использовании BERT, и достигает нового современного уровня производительности.

Идентификатор антологии:
2021.conll-1.23
Том:
Материалы 25-й конференции по вычислительному естественному языку
Месяц:
ноябрь
Год:
20211111111111111111111111110.
Место проведения:
CoNLL
SIG:
SIGNLL
Издатель:
Ассоциация компьютерной лингвистики
Примечание: 199010
40012 290–299
Язык:
URL:
https://aclanthology. org/2021.conll-1.23
doi:
10.18653/v1/2021.conll-1.23
11111111111111111111110 гг. Процитируйте (ACL):
Ян Хоу, Хоуцюань Чжоу, Чжэнхуа Ли, Ю Чжан, Мин Чжан, Чжефэн Ван, Баосин Хуай и Николас Цзин Юань. 2021. Структура маркировки от грубой до точной для совместной сегментации слов, маркировки POS и составного анализа. In Материалы 25-й конференции по компьютерному изучению естественного языка , страницы 290–299, онлайн. Ассоциация компьютерной лингвистики.
Процитируйте (неофициально):
Структура маркировки от грубой до точной для совместной сегментации слов, тегирования POS и разбора составляющих (Hou et al., CoNLL 2021)
Копия цитирования:
PDF:
https://aclanthology.org/2021.conll-1.23.pdf
Видео:
 https://aclanthology.org/2021.conll-1.23.mp4
Код
6
Код
1 /совместныйпарсер

  • BibTeX
  • MODS XML
  • Конечная сноска
  • Предварительно отформатировано
 @inproceedings{hou-etal-2021-coarse,
    title = "Среда маркировки от грубой до точной для совместной сегментации слов, тегов {POS} и разбора составляющих",
    автор = "Хоу, Ян и
      Чжоу, Хоуцюань и
      Ли, Чжэнхуа и
      Чжан, Ю и
      Чжан, Мин и
      Ван, Чжэфэн и
      Хуай, Баосин и
      Юань, Николас Цзин",
    booktitle = "Материалы 25-й конференции по компьютерному изучению естественного языка",
    месяц = ​​ноябрь,
    год = "2021",
    адрес = "Онлайн",
    издатель = "Ассоциация вычислительной лингвистики",
    url = "https://aclanthology. org/2021.conll-1.23",
    doi = "10.18653/v1/2021.conll-1.23",
    страницы = "290--299",
    abstract = "Самый простой подход к объединенной сегментации слов (WS), маркировке частей речи (POS) и разбору составляющих заключается в преобразовании дерева на уровне слов в дерево на уровне символов, что, однако, приводит к двум серьезным проблемам. проблемы. Во-первых, больший набор меток (например, {\mbox{$\geq$}} 600) и более длинные входные данные увеличивают вычислительные затраты. Во-вторых, трудно исключить недопустимые деревья, содержащие конфликтующие продукционные правила, что важно для надежная оценка модели. Если тег POS (например, VV) находится над тегом фразы (например, VP) в дереве вывода, определение границ слов становится довольно сложным. Чтобы справиться с обеими проблемами, в этой работе предлагается двухэтапный грубый структура точной маркировки для совместного WS-POS-PAR На этапе грубой маркировки совместная модель выводит дерево в квадратных скобках, в котором каждый узел соответствует одной из четырех меток (т.
е. фраза, подфраза, слово, подслово). допустимость дерева гарантируется декодированием CKY с ограничениями.На этапе тонкой маркировки модель e преобразует каждую грубую метку в конечную метку (например, VP, VP*, VV, VV*). Эксперименты с китайскими Penn Treebank 5.1 и 7.0 показывают, что наша совместная модель стабильно превосходит конвейерный подход как при использовании без так и при использовании BERT, и достигает нового современного уровня производительности.", }
 

<моды>
    <информация о заголовке>
        Среда маркировки от грубой к точной для совместной сегментации слов, тегов POS и составного анализа
    
    <название типа="личное">
        Ян
        
Хоу
<роль> автор <название типа="личное"> Хоуцюань Чжоу <роль> автор <название типа="личное"> Чжэнхуа Ли <роль> автор <название типа="личное"> Ю Чжан <роль> автор <название типа="личное"> Мин Чжан <роль>
автор <название типа="личное"> Чжэфэн Ванг <роль> автор <название типа="личное"> Баосин Хуай <роль> автор <название типа="личное"> Николай Цзин Юани <роль> автор <информация о происхождении> 2021-11 текст
<информация о заголовке> Материалы 25-й конференции по компьютерному изучению естественного языка <информация о происхождении> Ассоциация компьютерной лингвистики <место> Онлайн публикация конференции Самый простой подход к сегментации объединенных слов (WS), маркировке частей речи (POS) и разбору составляющих — это преобразование дерева на уровне слов в дерево на уровне символов, что, однако, приводит к двум серьезным проблемам. проблемы. Во-первых, больший набор меток (например, \geq 600) и более длинные входные данные увеличивают вычислительные затраты. Во-вторых, трудно исключить недопустимые деревья, содержащие конфликтующие продукционные правила, что важно для надежной оценки модели. Если тег POS (например, VV) находится над тегом фразы (например, VP) в дереве вывода, определить границы слов становится довольно сложно. Чтобы справиться с обеими проблемами, в этой работе предлагается двухэтапная структура маркировки от грубой до точной для совместного WS-POS-PAR. На этапе грубой маркировки совместная модель выводит дерево в квадратных скобках, в котором каждый узел соответствует одной из четырех меток (то есть фразе, подфразе, слову, подслову). Гарантируется, что дерево является допустимым благодаря ограниченному декодированию CKY. На этапе тонкой маркировки модель расширяет каждую грубую метку до конечной метки (например, VP, VP*, VV, VV*). Эксперименты с китайскими Penn Treebank 5.1 и 7.0 показывают, что наша совместная модель стабильно превосходит конвейерный подход как при использовании без так и при использовании BERT, и достигает нового уровня производительности.
hou-etal-2021-coarse 10.18653/v1/2021.conll-1.23 <местоположение> https://aclanthology.org/2021.conll-1.23 <часть> <дата>2021-11 <единица экстента="страница"> <начало>290 <конец>299
 %0 Материалы конференции
%T Платформа маркировки от грубой до точной для совместной сегментации слов, маркировки POS и разбора составляющих
%А Хоу, Ян
%А Чжоу, Хоуцюань
%А Ли, Чжэнхуа
%А Чжан, Ю.
%A Чжан, мин.
%А Ван, Чжэфэн
%A Хуай, Баосин
% А Юань, Николас Цзин
%S Материалы 25-й конференции по компьютерному изучению естественного языка
%D 2021
%8 ноябрь
%I Ассоциация компьютерной лингвистики
%С онлайн
%F hou-etal-2021-грубый
%X Самый простой подход к сегментации объединенных слов (WS), тегированию частей речи (POS) и синтаксическому анализу составляющих — это преобразование дерева на уровне слов в дерево на уровне символов, что, однако, приводит к двум серьезным проблемам.
. Во-первых, больший набор меток (например, \geq 600) и более длинные входные данные увеличивают вычислительные затраты. Во-вторых, трудно исключить недопустимые деревья, содержащие конфликтующие продукционные правила, что важно для надежной оценки модели. Если тег POS (например, VV) находится над тегом фразы (например, VP) в дереве вывода, определить границы слов становится довольно сложно. Чтобы справиться с обеими проблемами, в этой работе предлагается двухэтапная структура маркировки от грубой до точной для совместного WS-POS-PAR. На этапе грубой маркировки совместная модель выводит дерево в квадратных скобках, в котором каждый узел соответствует одной из четырех меток (то есть фразе, подфразе, слову, подслову). Гарантируется, что дерево является допустимым благодаря ограниченному декодированию CKY. На этапе тонкой маркировки модель расширяет каждую грубую метку до конечной метки (например, VP, VP*, VV, VV*). Эксперименты с китайскими Penn Treebank 5.1 и 7.0 показывают, что наша совместная модель стабильно превосходит конвейерный подход как при использовании без, так и при использовании BERT, и достигает нового современного уровня производительности. %R 10.18653/v1/2021.conll-1.23 %U https://aclanthology.org/2021.conll-1.23 %U https://doi.org/10.18653/v1/2021.conll-1.23 %Р 290-299
Уценка (неофициальная)

[Основа маркировки от грубой до точной для совместной сегментации слов, тегирования POS и разбора составляющих] (https://aclanthology.org/2021.conll-1.23) (Hou et al., CoNLL 2021)

  • Структура маркировки от грубой до точной для совместной сегментации слов, маркировки POS и разбора составляющих (Hou et al., CoNLL 2021)
ACL
  • Ян Хоу, Чжоуан Чжоу, Хоуцюань, Хоуцюань Юй Чжан, Минь Чжан, Чжэфэн Ван, Баосин Хуай и Николас Цзин Юань. 2021. Структура маркировки от грубой до точной для совместной сегментации слов, маркировки POS и составного анализа. В Материалы 25-й конференции по компьютерному изучению естественного языка , страницы 290–299, онлайн. Ассоциация компьютерной лингвистики.

Совместный анализ видео и текста для понимания событий и ответов на запросы


Аннотация

Мы предлагаем платформу для совместного анализа видео и текста, повествовательные текстовые описания и ответы на запросы пользователей. Наша структура создает граф синтаксического анализа, который представляет композиционные структуры пространственной информации (объекты и сцены), временной информации (действия и события) и причинно-следственная информация (причинно-следственные связи между события и флюиды) в видео и тексте. Знание представление нашей структуры основано на пространственно-временно-причинной И-ИЛИ-граф (S/T/C-AOG), который совместно моделирует возможные иерархические композиции предметов, сцен и событий, а также их взаимодействий и взаимных контекстов, а также определяет предшествующие вероятностное распределение графов разбора. Мы представляем вероятностная порождающая модель для совместного разбора, которая фиксирует отношения между входным видео/текстом, их соответствующий разбор графы и граф совместного разбора. На основе вероятностной модели мы предлагаем совместную систему парсинга, состоящую из трех модулей: видео синтаксический анализ, синтаксический анализ текста и совместный вывод. Разбор видео и текст синтаксический анализ создает два графа разбора из входного видео и текста соответственно. Модуль совместного вывода создает совместный граф синтаксического анализа. путем сопоставления, вывода и проверки видео и текста разбирать графики. Предлагаемая структура преследует следующие цели: Во-первых, мы стремимся к глубокому семантическому разбору видео и текста, за пределами традиционных подходов с набором слов; Во-вторых, мы выполняем анализ и рассуждение в пространственном, временном и каузальном размеры основаны на совместном представлении S/T/C-AOG; В-третьих, мы показать, что глубокий синтаксический анализ облегчает последующие приложения, такие как как создание описательных текстовых описаний и ответы на вопросы в формы кто, что, когда, где и почему. Мы эмпирически оценили наша система основана на сравнении с достоверной информацией, а также точность ответов на запросы и полученные удовлетворительные результаты.

Примеры

Пример 1: (a) Пример видео наблюдения и текст описание сцены на парковке. (b) График разбора видео, текст граф синтаксического анализа и совместный граф синтаксического анализа.

admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *