Инструменты лингвистического анализа — * Лингвистика
Общие
- DHbox — среда для цифровых гуманитарных вычислений, которую можно быстро и легко развернуть из облака. Включены готовые конфигурации Omeka, NLTK, IPython, R Studio и Mallet. (бесплатно)
- Каталог инструментов для цифровых исследований (DiRT). DiRT упрощает поиск и сравнение ресурсов, доступных для интеллектуального анализа текста, визуализации данных и т. д.
- Seeing Speech — Обеспечивает видео речи с ультразвуковой визуализацией языка (ИМП), видео речи с помощью магнитно-резонансной томографии (МРТ) и 2D-анимацию средней сагиттальной головы на основе данных МРТ и ИМП.
- TokenX — инструмент для визуализации, анализа и воспроизведения текста. Создан Университетом Небраски-Линкольн. (бесплатно)
Документация по языку
- FLEx (Fieldwork Language Explorer) от SIL (Летний институт лингвистики) — помогает в составлении словарей и связывает словарные статьи с текстовыми документами, чтобы облегчить аннотирование.
- FileMaker — Реляционная база данных, очень полезная для сбора различных типов информации (фонологической, флективной, семантической) для лексем. (Это проприетарная программа; она доступна на компьютерах студентов нашего факультета, и студенты не должны ее покупать.)
- CMDI Maker — инструмент для компиляции метаданных для записей H
- HandBrake , Avidemux и Audacity для преобразования и редактирования видео и/или аудио.
Фонетический анализ и аннотация
- Elan – анализ и комментирование аудио- и видеофайлов. Позволяет использовать несколько уровней транскрипции. (с открытым исходным кодом, бесплатно) Доступны учебные пособия YouTube
- Праат — Научный анализ речи в фонетике; записывать и визуализировать речь/просматривать спектрограммы. (с открытым исходным кодом, бесплатно) Доступны учебные пособия YouTube
Моделирование
- МОЛОТОК (MAchine Learning for Language Toolkit) — Набор инструментов для классификации документов, тегирования последовательностей и тематического моделирования. Существует также дополнительный набор инструментов (Графические модели в MALLET) для визуализации. (с открытым исходным кодом, бесплатно)
Интеллектуальный анализ/анализ текста
Визуализация текста
- Книжный червь — Создано Гарвардом. Инструмент для визуализации трендов в репозиториях оцифрованных текстов. Использует метаданные и книги, собранные Открытой библиотекой. Он сразу описывает содержимое библиотеки в целом полезным и интуитивно понятным способом.
- Voyant — Простой в использовании и бесплатный инструмент для анализа текста. Загрузите текст, и Voyant автоматически определит частоты слов и колокации и отобразит их графически.
Работа с веб-страницами
- import.io — Мгновенное преобразование веб-страниц в данные
- Tapor . Этот набор инструментов для анализа текста, размещенный Университетом Альберты, обеспечивает анализ XML, HTML и обычного текста. Загружайте документы для извлечения общих слов, определения колокаций, разделения тегов HTML и извлечения информации с тегами XML.
Что такое декодирование? — OPEPP
Добро пожаловать в OPEPP
Партнерство штата Огайо за совершенствование парапрофессиональной подготовки
Вернуться к: Модуль: Помощь учащимся в чтении
Письменный язык — это код. Обучение чтению включает взлом кода — или расшифровку . В английском языке письменные символы обозначают звуки, из которых состоит каждое слово. Это было бы просто, если бы каждая буква представляла отдельный звук (или фонему). Но, как мы видели, в английском языке 26 букв и 44 различных фонемы. По этой причине декодирование фокусируется на различных единицах текста, называемых графемами.
Графемы — это наименьшие единицы письменности, используемые для обозначения одного произносимого звука или фонемы. Графемы имеют длину от одной до четырех букв, и одну и ту же фонему может представлять множество различных графем. Например, фонема /т/ в слове «крыса» выражается графемой «т». А вот фонема /т/ в слове «погремушка» выражена графемой «тт». Точно так же в слове «пчела» графема «ее» указывает на фонему /ē/ (или долгий звук е). Однако в слове «любой» та же самая фонема представлена графемой «у».
По сути, научиться читать означает овладеть несколькими важными навыками: переводить символы (буквы и графемы) в их звуки (фонемы), комбинировать последовательность звуков для составления слов, а затем находить слова и их значения, хранящиеся в вашей памяти. . Многие первые читатели, хорошо знающие английский язык, уже понимают значение многих слов, с которыми они сталкиваются, когда только начинают читать. Но это может быть не для всех студентов: например, для изучающих английский язык. Диаграмма ниже основана на частях модели обработки данных Зайденберга и Макклелланда, состоящей из четырех частей (1989) — иллюстрирует эти ключевые навыки декодирования.
Три основных шага декодирования
Стратегии декодирования
Читатели используют два основных инструмента для декодирования. Это подсказки звуковых символов, фонетическое декодирование и подсказки значений слов или структурный анализ. Мы обсудим фонетическое декодирование в этом разделе и структурный анализ в следующем.
Фонетическая расшифровка
Начинающие читатели чаще всего используют звуковые символы. Раннее обучение чтению с использованием фонетики учит читателей связывать звуки с буквами и буквосочетаниями. Когда вы используете звуковые символы для расшифровки, вы смотрите на буквы и их комбинации и слышите их звуки. Вы смешиваете звуки вместе, чтобы произнести слова вслух или про себя.