Мягкие фонетический разбор слова: Фонетический разбор слова и звуко-буквеннный анализ

Программное обеспечение для лингвистики

Инструменты на этой странице — это программы, которые я разрабатывал для различных языковых анализов или аннотаций в течение ряда лет. Их можно свободно использовать в некоммерческих целях по лицензии GPL 3.0.

По просьбе некоторых коллег я недавно также создал 32-битные версии для большинства программ. Они будут работать в более старых версиях Windows, их можно легко переносить на карту памяти для использования на любом компьютере с Windows, а также запускать в Mac OS X и Linux с помощью Wine. Однако, поскольку 64-битные компьютеры все больше и больше становятся нормой, с этого момента я буду производить 32-битные версии только по специальному запросу (пт, 03 мая, 14:30:15 2019 г.).), хотя.

Эта страница будет расширена, т.е. путем добавления дополнительных инструментов и более подробных описаний со временем. Пожалуйста, сообщайте мне о любых ошибках, которые вы можете обнаружить, чтобы я мог их исправить и сделать программы более полезными/удобными. Также не стесняйтесь присылать мне предложения по улучшению или дополнительным функциям. Однако обратите внимание, что в настоящее время я «перевожу» свои программы с Perl и Perl/Tk на Python и PyQt, так что, вероятно, в обозримом будущем я не буду вносить каких-либо серьезных изменений.

Инструкции по установке

Мои инструменты обычно не требуют установки, но я иногда предоставляю установщики для удобства пользователей, не имеющих опыта извлечения из zip-архивов. Однако основное преимущество извлечения из zip-файлов заключается в том, что вы также должны иметь возможность запускать программы с карты памяти без установки.

Поскольку большинство программ предназначены для того, чтобы позволить более опытным пользователям изменять/настраивать файлы конфигурации или сохранять связанные данные в папке «данные» в той же папке, в которой находится инструмент, всегда следует извлекать все файлы из zip-архива в место, где у вас есть доступ для записи. Обычно это должно не — это папка «Program files», потому что эта папка ограничивает доступ для записи, а вместо этого папка типа «C:\», где — это имя соответствующего инструмента, в идеале без пробелов. Для частого использования вы также можете настроить ярлык для исполняемого файла на рабочем столе. Обычно это можно сделать, щелкнув правой кнопкой мыши исполняемый файл в файловом менеджере, удерживая и перетаскивая его на рабочий стол, а затем, отпустив правую кнопку мыши, выбрав «Создать ярлык здесь».

Недавно я также заметил, что установка в папку, содержащую китайские или другие «неанглийские» символы, вызывает проблемы в некоторых программах с поиском файлов конфигурации и т. д. Если вы столкнулись с такой проблемой, переместите файлы программы в папка, содержащая только основные латинские символы.


The Dialogue Annotation and Research Tool (DART; версия 3.0)

Чт, 30 мая, 11:36:06 2019: Выпущена версия 3.0.1.

Инструмент аннотирования и исследования диалогов — это инструмент аннотирования и среда лингвистических исследований, которая не только позволяет автоматически аннотировать большое количество диалогов, но также предоставляет средства для предварительного и последующего редактирования данных диалогов, а также проведения различных типов анализа аннотированных и неаннотированных данных с целью улучшения процесса аннотирования. Чтобы решить, может ли DART быть интересным/полезным для вас, вы можете сначала ознакомиться с Руководством по DART. Новая версия теперь идентифицирует 162 речевых акта автоматически, а также имеет ряд дополнительных функций и улучшений как интерфейса, так и параметров вывода из отдельных модулей анализа, а также совершенно новое средство подсчета паттернов.

PDF-файл, содержащий текущую таксономию речевых актов, используемую в DART, доступен здесь.

Чтобы «установить», просто извлеките все файлы в папку, к которой у вас есть доступ для записи, в идеале «C:\DART» или что-то подобное. Затем вы можете запустить программу, запустив dart.exe. Наряду с программой и ее файлами ресурсов полная неаннотированная версия корпуса SPAADIA (см. ниже) предоставляется в папке «spaadia» для практики, так что вы можете самостоятельно протестировать функцию аннотаций и посмотреть, какие функции аннотаций могут потребоваться Постобработка.

Если вы установили версию 3 до 30 th мая 2019 года, замените ее версией 3. 0.1, которая содержит некоторые незначительные исправления ошибок и улучшения в некоторых файлах ресурсов.

Текущая версия: 3.0

  • DART 3.0 (только 64-битный zip-архив). Выпущено 03 мая 2019 г., обновлено до версии 3.0.1 30 мая 2019 г.

Старые версии:

  • DART 2.0 (64-битный zip-архив). Выпущено 25 июля 2017 г.
  • DART 2.0 (32-битный zip-архив). Выпущено 25 июля 2017 г.
  • DART 1.1 (только 32-битный zip-архив). Выпущено 18 мая 2015 г.
  • 64-битный установочный файл Windows, выпущенный 05 марта 2014 г.
  • 32-битный установочный файл Windows, выпущенный 25 сентября 2014 г.
  • 32-разрядный ZIP-архив для Windows, выпущенный 15 февраля 2015 г.

Инструмент текстовых аннотаций и исследований (TART; в разработке)

Текстовый аннотаций и инструмент исследований (TART) будет письменным аналогом DART для определения эквивалентов речевых актов на письменном языке. Хотя я уже начал разрабатывать первоначальные идеи дизайна и простой прототип на основе модели DART несколько лет назад, а также представил некоторые из них на CL 2015 в Ланкастере, различные другие обязательства до сих пор задерживали разработку.

Помимо очень похожих на DART функций аннотаций и анализа, TART также будет содержать функции, более конкретно ориентированные на анализ письменной речи, некоторые из которых будут получены из функций, реализованных в Text Feature Analyzer, таких как меры лексической плотности. , различные коэффициенты, основанные на различных единицах анализа (целые тексты, абзацы, предложения и, возможно, другие типы текстовых частей), большинство из которых можно вычислить со стоп-словами или без них и включая переменный нормирующий коэффициент для облегчения сравнения между различными текстами неравных значений. длина.

Одна из основных частей текущей разработки состоит в моделировании всех соответствующих необходимых функций, которые позволят TART аннотировать тексты различных жанров/типов текстов, а также предоставлять различные средства анализа или фильтрации по этим конкретным функциям.

На данный момент основной интерфейс уже перенесен из DART, а новая категория документов XML для категорий письменного текста определена (включая уровни текста, заголовка и абзаца) и интегрирована в инструмент. Кроме того, реализован ряд подпрограмм для некоторой автоматической предварительной обработки (разбиение абзацев на основе основных знаков препинания и т. д.), а также создан ряд инструментов преобразования и/или извлечения для преобразования данных из существующих справочных корпусов в позволяют тестировать подпрограммы TART, используя различные типы данных.


Инструмент Simple Corpus (SCT)

Инструмент Simple Corpus (версия 3): Комбинация инструмента аннотирования и анализа для использования либо с простыми файлами XML, либо с простыми текстовыми файлами. Новая версия Python теперь обеспечивает более или менее ту же функциональность, что и другие инструменты, такие как AntConc или WordSmith, и включает модули для согласования как в потоковом (например, KWIC), так и в построчном режиме, анализ слов и n-грамм, анализ ключевых слов / фраз. , анализ сочетаний и подсчет шаблонов, но больше не предоставляет возможность тегирования PoS.

Файлы, выбранные для открытия, отображаются в списке «Входные файлы» в левой части программы. Двойной щелчок по имени файла откроет соответствующий файл во встроенном редакторе. Если щелкнуть хит в модуле «Конкордансер», это также откроет соответствующий файл в редакторе, на этот раз отобразив хит в его полном контексте, но также позволяя добавить аннотации.

Панель с вкладками в середине содержит отдельные модули анализа. В отличие от других инструментов, они включают средство «Подсчет шаблонов», где вы можете связать регулярные выражения с подходящими метками для подсчета шаблонов во всех открытых файлах. Как следует из названия, модуль «Ключевые фразы» позволяет искать не только ключевые слова, но и фразы на основе взвешенного относительного соотношения. Все модули, кроме «счетчика шаблонов», а также сам SCT, также легко настраиваются и предоставляют различные сложные параметры фильтрации, которые также позволяют обрабатывать загруженные файлы без необходимости редактирования исходных данных.

Встроенный редактор с правой стороны позволяет добавлять теги и атрибуты из настраиваемых пользователем панелей инструментов и меню. Сам редактор основан на виджете PyQt «QTextEdit» и предоставляет стандартизированные ярлыки для функций копирования и вставки и отмены/повтора, как и во многих стандартных текстовых редакторах. Он также поддерживает операции поиска и замены, поддерживающие регулярные выражения, что позволяет выполнять расширенное редактирование, включая преобразование в формат DART XML.

Расширенный файл справки в формате PDF вызывается через соответствующее меню или нажатием F1.

Текущие версии (v. 3.0)

  • Windows (64-разрядная): Эта версия Windows поставляется с надлежащим установщиком. Однако, к сожалению, единственный способ, который я нашел для его компиляции, включает в себя все соответствующие библиотеки Python, так что некоторые антивирусные инструменты могут сообщать об этом как об угрозе, которую вы можете безопасно игнорировать.
  • MacOS:
    1. Создайте папку с именем «SCT» в папке «Документы».
    2. Загрузите zip-архив SCT3_Mac.zip.
    3. Скопируйте его содержимое в папку «SCT», если файл не будет автоматически разархивирован туда. Однако иногда имя папки может соответствовать имени zip-архива, и в этом случае вам необходимо переименовать эту папку в «SCT».
    4. Запустить SCT. В некоторых версиях MacOS вы можете получить сообщение об ошибке, что файл не может быть проверен. Если это произойдет, перейдите в настройки, выберите «Безопасность и конфиденциальность» и разблокируйте приложение. В других версиях вам может потребоваться щелкнуть правой кнопкой мыши по приложению и выбрать «открыть», а затем подтвердить один раз, что вы хотите открыть приложение.
    5. Запустите еще раз.

Старые версии (версия 2.0 выпущена 19 июня 2018 г.)

  • Zip-архив (64-разрядная версия Windows): следуйте общим инструкциям по установке и запустите «SCT64.exe».
  • Zip-архив (32-битная Windows): как указано выше, но затем запустите «SCT32.exe».

Компилятор веб-корпуса (WCC)

Преемник ICEweb (см. далее ниже), который позволяет искать и загружать данные корпуса из Интернета. Эта программа гораздо более гибкая и простая в использовании, чем ее предшественница, а также позволяет легко работать с разными языками. В отличие от ICEweb, он также имеет встроенный браузер, так что вы можете удобно искать, исследовать и загружать из того же инструмента. Чтобы лучше понять его возможности, вы можете взглянуть на руководство WCC. К сожалению, руководство нельзя открыть из инструмента на Mac, поэтому вам нужно будет найти его в папке приложения и открыть вручную.

Текущие версии (v. 1.0)

  • Windows (64-разрядная): Эта версия Windows поставляется с надлежащим установщиком. Однако, к сожалению, единственный способ, который я нашел для его компиляции, включает в себя все соответствующие библиотеки Python, так что некоторые антивирусные инструменты могут сообщать об этом как об угрозе, которую вы можете безопасно игнорировать.
  • MacOS:
    1. Создайте папку с именем «WCC» в папке «Документы».
    2. Загрузите zip-архив WCC_Mac. zip.
    3. Скопируйте его содержимое в папку «WCC», если файл не будет автоматически разархивирован туда. Однако иногда имя папки может соответствовать имени zip-архива, и в этом случае вам необходимо переименовать эту папку в «WCC».
    4. Запустить WCC. В некоторых версиях MacOS вы можете получить сообщение об ошибке, что файл не может быть проверен. Если это произойдет, перейдите в настройки, выберите «Безопасность и конфиденциальность» и разблокируйте приложение. В других версиях вам может потребоваться щелкнуть правой кнопкой мыши по приложению и выбрать «открыть», а затем подтвердить один раз, что вы хотите открыть приложение.
    5. Запустите еще раз.

Оптимизатор тегов

Оптимизатор тегов (версия 1.0; выпущен 2 октября 2018 г.) помогает пользователям корпуса автоматически повышать точность тегов и читаемость выходных данных трех бесплатных тегировщиков: TreeTagger, Stanford POS Tagger и Simple PoS Tagger (см. ниже). Это достигается за счет разнообразия исходного набора тегов, исправления некоторых ошибок, вызванных вероятностными механизмами, лежащими в основе тегировщиков, и улучшения читаемости тегов за счет расширения их имен.

Подробности о наборе тегов можно найти в сопроводительном руководстве.

Оптимизатор тегов доступен как 64- или 32-битная программа:

  • Оптимизатор тегов (64-битный)
  • Оптимизатор тегов (32 бита)

Для установки просто следуйте приведенным выше общим инструкциям по установке и запустите tagOpt64.exe или tagOpt32.exe соответственно.


The Simple PoS Tagger

Simple PoS Tagger (версия 1.0) представляет собой интерфейс к слегка модифицированной версии модуля Perl Lingua::EN::Tagger, который позволяет пользователю добавлять к тексту морфосинтаксические теги. автоматически, а затем отредактируйте результат с цветовой кодировкой. Чтобы «установить», просто извлеките файлы из zip-архива в папку, к которой у вас есть доступ для записи, и запустите исполняемый файл («Tagger.exe»). Интерфейс должен быть относительно интуитивным в использовании, но некоторая основная информация об использовании предоставляется в меню «Справка».

Вывод в моем интерфейсе немного отличается от исходной версии, созданной тегировщиком, в том, что я заменил исходные косые черты, разделяющие слова и теги, более «традиционным» форматом подчеркивания, который обеспечивает лучшую читаемость.

В будущих выпусках я планирую добавить еще несколько функций, которые позволят исследовать текст с тегами различными способами, например. путем включения или выключения некоторых цветовых кодов для визуальной идентификации таких структур, как NP и т. д.

Версии:

  • 64-битный ZIP-архив для Windows, выпущенный 07 мая 2014 г.
  • 32-разрядный ZIP-архив Windows, выпущенный 29 августа 2014 г.

Конкордансер SPAADIA

Конкордансер SPAADIA (32-битная версия Windows): конкордансер (в основном) для использования с корпусом SPAADIA (см.). Теоретически конкордансер может работать с любыми текстовыми файлами, такими как файлы .txt, (X)HTML и XML, при условии, что правильное расширение установлено в поле в верхней правой части интерфейса. Предполагаемая входная кодировка для файлов — UTF-8, и согласование лучше всего работает для файлов, в которых теги и текст разделены. Concordancer позволяет выполнять поиск по одной или двум комбинациям поисковых строк, используя полный набор регулярных выражений Perl. Любой пробел в выражении должен быть заключен в кавычки через \s и, возможно, определен количественно, если пробелов может быть несколько. Теперь в значительной степени вытеснено выше.


The Text Feature Analyzer

Text Feature Analyzer (версия 2.1; только для 64-разрядной версии Windows; выпуск 07 мая 2014 г.): инструмент для исследования текстовых функций, который может помочь в выявлении и измерении проблем, связанных со сложностью текста. . Базовый дизайн и использование описаны в моей оригинальной статье об этом инструменте, которую можно скачать на странице моих публикаций. Обратите внимание, что некоторые функции, обсуждаемые в этой статье, такие как функция согласования, уже были добавлены с тех пор.

Этот инструмент скоро будет (значительно) переписан. Самая последняя версия уже содержит исправление ошибки для подсчета слогов, которая приводила к некоторым ошибкам в более ранней версии, а теперь также добавляет вывод, который перечисляет количество (оценочных) слогов в документе. Будущие версии будут не только содержать улучшенную документацию (которой, по общему признанию, на данный момент очень мало), но, вероятно, также интерфейс с вкладками, где анализ для каждого нового документа будет указан на отдельной вкладке и т. д.


ICEweb

Версия 2

ICEWeb — небольшая и простая утилита для компиляции и анализа веб-корпусов. Название было выбрано потому, что основная цель этого инструмента — позволить исследователям дополнять существующие или создавать новые корпуса для Международного корпуса английского языка (ICE).

Он спроектирован так, чтобы быть максимально удобным для пользователя, но при этом допускает довольно сложную обработку любых загружаемых веб-страниц, включая удаление шаблонов. Для более полного обзора его функций вы можете взглянуть на мой ICAME 39.презентация. Для получения подробной информации обратитесь к Руководству по ICEweb2 (включено в дистрибутив).

Вы можете скачать 64-битную версию отсюда. Если кому-то все еще нужна 32-битная версия, пожалуйста, пришлите мне письмо по электронной почте, и я скомпилирую ее и добавлю сюда. Чтобы «установить», просто следуйте инструкциям по установке, а затем запустите «iceWeb2_64bit.exe».

Пт, 06 марта 2020 г., 09:48:38: Версия 2.2 теперь также позволяет изменить язык, указанный при создании запросов через файл конфигурации с использованием кода страны IANA.

Обратите внимание, что в версии 2.0 были некоторые ошибки, которые могли препятствовать открытию запросов в поисковых системах, если у вас есть более двух исходных терминов и каталогов для создания URL-файлов. Если вы скачали версию 2.0, замените ее на 2.2.

Версия 1

Обратите внимание, что эта версия заменена версией 2, описанной выше, в которой значительно расширены функции. Тем не менее, я пока держу эту версию в сети, так как она описана в разделе 4.2.4 моего учебника «Введение в корпусную лингвистику» и используется там для упражнений.

ICEWeb (версия 1; 32-разрядная версия Windows):

  • 32-битный файл установки Windows
  • 32-битный ZIP-архив для Windows

Редактор (фонетической) транскрипции

Редактор (фонетической) транскрипции (версия для 32-разрядной Windows): как следует из названия, в основном это редактор для создания фонетической транскрипции, который позволяет сохранять вывод в текстовый файл с кодировкой UTF-8. или (с двойным интервалом) HTML-страница, подходящая для отправки заданий. В программе также предусмотрена возможность преобразования графемы в фонему, которая, однако, имеет серьезные ограничения, так как ничего не «знает» о сильных и слабых слогах и особенностях связной речи.


Дом — Согласие

Новое в соответствии?

Попробуйте Accordance Basic Starter БЕСПЛАТНО в течение 90 дней!

Начните использовать полнофункциональную версию Accordance вместе с более чем 60 ресурсами стоимостью 239 долларов США СЕГОДНЯ. По истечении 90 дней заплатите всего 19,75 долл. США, чтобы получить постоянное владение своим программным обеспечением и библиотекой! Узнать больше

Загрузить сейчас:

В программе Accordance Bible Software есть все необходимое для изучения Библии.

Вдохновение

Самая полная библейская программная платформа на рынке.

Известный своей скоростью, простотой использования и гибкостью, Accordance устраняет распространенные препятствия на пути к пониманию Священных Писаний, сохраняя Библию в центре вашего изучения.

Узнать больше

Связаться

Все, что вам нужно от подготовки до доставки.

Accordance дает вам все инструменты, необходимые для беспрепятственного перехода от учебы к кафедре, передавая пастырское вдохновение тем, кто слушает вашу законченную проповедь.

Узнать больше

Перейти

Идите туда, куда ведет вдохновение.

Возьмите цифровую библиотеку с тысячами томов на ладони.

Скачать Мобильный

Специальные предложения

Идите туда, куда ведет вдохновение

Вот уже более 25 лет компания Accordance Bible Software помогает пасторам, студентам, профессорам и серьезным мирянам глубоко изучать Библию. Программа Accordance, известная своей скоростью, простотой использования и гибкостью, устраняет распространенные препятствия на пути к пониманию Священных Писаний, сохраняя Библию в центре вашего изучения. С выпуском версии 13, наряду с его мобильными аналогами, программное обеспечение Accordance Bible Software действительно позволяет вам идти туда, куда ведет вдохновение.

Отзывы клиентов

Несколько слов от наших клиентов.

Я пользовался другими библейскими программами, и ни одна из них не сравнится по мощности, эффективности и простоте с соответствие. Я рекомендую это с энтузиазмом.

Доктор Крейг Эванс Автор и профессор

Соответствие было моим основным инструментом изучения Библии, подготовки проповеди, исследования и проповеди с тех пор, как 2003. Обширная цифровая библиотека, настраиваемые рабочие процессы и удобный интерфейс также делают Accordance — идеальный компаньон для подготовки лекций, статей и книг.

Доктор Водди Баучам Бывший пастор, основатель церкви, писатель, декан теологии Африканского христианского университета и преданный отец

Accordance — это первое место, где я ищу информацию о чем-либо на языке оригинала. Это, безусловно, лучший инструмент для работы с оригинальным языком!

Доктор Дэн Уоллес Автор и профессор

Преимущество соответствия

  • Лучшие инструменты — качество имеет значение.
  • Быстрый поиск — не надо мигать или вы пропустите его.
  • Более глубокое изучение исследовать Писание.
  • Ориентирован на Библию — Наша основная философия.

Программа Accordance предназначена для того, чтобы Библия была в центре вашего изучения. Для того, чтобы облегчить это, многие функции и инструменты Accordance были напрямую интегрированы в текст самой Библии.

admin

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *