КАТАЛОГ ДИССЕРТАЦИЙ     
   ГЛАВНАЯ   ОПЛАТА И ДОСТАВКА   КАТАЛОГ РАБОТ   НА ЗАКАЗ   ПОДТВЕРЖДЕНИЕ ОПЛАТЫ   ГАРАНТИИ ДОСТАВКИ   КОНТАКТЫ  
 

Каталог работ

Тема: Разработка методов представления и обработки естественного языка для проблемно-ориентированный систем автоматического понимания речи

Содержание
СОДЕРЖАНИЕ
Введение...4
Положения, выносимые на защиту:...12
Глава 1. Анализ подходов и средств представления и обработки естественного языка в системах понимания речи...13
¦/ 1.1. Основные проблемы...13
1.2. Подходы к представлению и обработке естественного языка...15
1.2.1. Лингвистические подходы...16
1.2.2. Экспериментальный подход...24
1.2.3. Прагматически-ориентированный подход...29
1.3. Средства представления предметной области...31
1.3.1. Семантические сети и фреймы...31
1.3.2. Диаграммы сущность-связь...32
1.3.3. Онтологии...33
Выводы по главе 1...41
Глава 2. Модифицированная модель представления естественного языка в рамках интегрального подхода к пониманию речи...42
2.1. Модель представления естественного языка...42
2.1.1. Ситуативная модель...48
2.1.2. Модель языка - ассоциативная модель...52
2.2. Модель интегрального понимания...55
2.2.1. Базовый ассоциативный анализ...56
2.2.2. Базовый ситуативный анализ...57
2.2.3. Интегральная оценка...60=
2.2.4. Избыточность информации в базовой модели интегрального понимания...61
2.3. Модификация модели представления естественного языка...64
, 2.3.1. Особенности использования онтологии...65
^' 2.3.2. Модификация ситуативной модели...67
2.3.3. Модификация ассоциативной модели...70
2.3.4. Модификация словаря предметной области...70
2.3.5. Модификация структуры входной гипотезы...„71
Вывод по главе 2...73
Глава 3. Разработанные методы обработки гипотез фраз в модуле естественно-языкового анализа...74
3.1. Метод верификации онтологического подмножества гипотезы входной фразы...74
3:1.1. Алгоритм верификации онтологического подмножества...75
3.1.2. Оценка работы алгоритма верификации онтологического подмножества...83
31-1.3. Оценка эффективности представления перефразировок...84
3.2. Метод оценки лексической близости ситуативных переходов и гипотез фраз...85
3.2.1. Обработка гипотез в базовой модели понимания...85
3.2.2. Оценка лексической близости ситуативных переходов и гипотез фраз...89
3
3.2.3. Тестирование метода оценки лексической близости в задаче голосового
управления подвижным объектом...93
3.3. Модификация модуля естественно-языковой обработки...99
Выводы по главе 3...101
Глава 4. Практическое использование разработанных в диссертации методов...102
4.1. Модель голосового управления подвижным объектом...102
Описание программного комплекса, реализующего модель понимания речи...102
Модель представления естественного языка в задаче голосового управления самолетом ...108
4.2. Модель понимания речи для информационной системы «Автомаркет»...111
Выводы по главе 4...121
Заключение...122
Литература...124
Введение
Введение
Некоторые определения. В данной, быстроразвивающейся; области, используются некоторые термины, заимствованные из смежных областей; знаний. Поэтому во избежание недоразумений здесь целесообразно привести * некоторые определения.
Распознаванием речи называют представление речевого сигнала ., последовательностью слов, которая ему соответствует.
Пониманием речи называют представление: смысла, передаваемого? речевым сигналом, в некоторой канонической форме, непосредственно' пригодной- для? вызова: действий; в автоматической системе, угодных говорящему человеку [5].
Естественный язык (ЕЯ) — язык, словарь и грамматические правила которого обусловлены, практикой- применения; и не всегда формально; зафиксированы.
Онтология является- системой понятий, предположительно существующих в некоторой! области знаний, для; обозначения* которых использован определенный естественный язык. В- простейшем^ случае онтология описывает иерархию связных представлений, которые используются» для: обозначения типовых множеств объектов, обладающих общими; признаками.
Актуальность,темы диссертаци и.¦ Обеспечение взаимодействия; с 3BMi Ш, на естественном языке является важнейшей задачей исследований; по
искусственному интеллекту. Сейчас речевые технологии активно включаются в различные сферы нашей жизни, способствуя ускорению процессов информационного обмена: в различных предметных областях, что привело? к развитию проблемно-ориентированных систем понимания; речи. При! этом< наиболее остро * проявилась проблема разрешения? языковой; неоднозначности [25];. а также* проблема: учетам информации об иерархии? понятий* ш терминов* определенной предметной области. Первая: проблема обусловлена; многозначностью слов естественного языка; ошибками* распознавания отдельных слов и синтаксическими неточностями^ в речи диктора. Вторая s -
ведет к терминологической путанице, возникающей из-за разницы в толковании терминов у системы и пользователя. Решение этих проблем связано с адекватным отображением естественного языка во* внутреннее машинное представление. Для этого следует эффективно использовать всю доступную > априорную информацию, включая синтаксис, семантику и прагматику [18]..
Как правило, подходы к представлению и обработке естественного языка используют только два вида информации: синтаксическую и семантическую. Причем: основной упор делается; на. синтаксис, т.е. методы грамматического разбора [16]. Синтаксический анализ становится самоцелью и приводит к построению грамматически правильных предложений- которые, однако, могут содержать, смысловую неоднозначность. В результате многолетних исследований в области обработки естественного языка и речи было» установлено, что для решения проблемы, неоднозначности необходимо* использовать информацию о соотнесении знаков естественного языка, объектов > и событий реальной действительности, к которым относятся- семантическая ш прагматическая; информация, и которые представляют собой по существу информацию о предметной области. Стало очевидным, что сложность понимания и методы обработки естественного языка определяются не только структурой и особенностями- входного текста, но и представлением. о предметной области, в рамках которой осуществляется! человеко-машинное взаимодействие.
Существует достаточно обширный набор средств представления знаний© (щ?: предметной области, наиболее эффективным на сегодняшний день считается
онтология, [23]. Применение этих средств для представления'семантической и прагматической информации? в области речевых технологий является актуальной темой исследования, поскольку ведет к разрешению проблем-языковойiнеоднозначности и учета ¦ иерархии понятий>предметной областипри понимании речи.
Цель работы и задачи исследования. Основной целью диссертационной работы является разработка методов разрешения, неоднозначности^ естественного языка и учета иерархии понятий при представлении и обработке естественного языка в. системах автоматического понимания речи. Для
достижения поставленной цели; в диссертационной! работе поставлены^ и решены следующие задачи:
1. Анализ;основных подходов к представлению и обработке естественного языка;
2. Построение эффективной модели представления, и обработки естественного языка;
3; Разработка методов эффективного семантико-прагматического анализа.
Методы! исследования. Для решения поставленных задач в работе используются; методы теории- информации, теории! множеств, экспертного,, статистического и эвристического анализа, а также: методы итерационного поиска. Компьютерная, реализация, разработанных алгоритмов производилась на основе объектно-ориентированного подхода.
Научная новизна работы состоит в следующем:
1. Разработана эффективная модель представления естественного языка; за счет использования онтологии^ предметной- области в виде иерархии? понятий предметной области, которая учитывает семантическую' информацию и позволяет легко расширять предметную область.
2. Разработан алгоритм верификации онтологического подмножества' гипотезы входной фразы, позволяющий оценить его семантическую связность, и существенно ускорить процесс обработки речи за* счет предварительного отсечения гипотез, содержащих семантически>; не: связные понятия.
3; Разработан метод оценки*лексической близости: ситуативных переходов> гипотезе входной фразы, позволяющий избежать последовательного перебора всех возможных канонических перефразировок при; определении квантитативной; оценки расстояния? между входной; гипотезой и каноническими перефразировками.
Обоснованность ш достоверность научных положений; основных выводов? и результатов диссертации обеспечиваетсяу за счет тщательного анализа состояния; исследований Bi данной* области, подтверждается корректностью предложенных моделей, алгоритмов % и согласованностью* результатов, полученных при компьютерной реализации^ а также апробацией;
основных теоретических положении диссертации в печатных трудах и докладах на научных конференциях.
Практическая ценность работы.. Разработанные модели и алгоритмы направлены на разрешение проблемы адекватного отображения: естественноязыкового представления во внутреннюю информационную модель, которая представлена в виде матрицы межсловных ассоциаций, ситуативной? базой данных и онтологией предметной области.
ш Разработанный метод верификации онтологического подмножества
входной гипотезы позволяет оценить семантическую связность гипотезы входной фразы и обеспечивает систему понимания; механизмом обобщения? терминов предметной области; В результате пользователь может использовать. широкий спектр понятий и терминов предметной области при взаимодействии; с прикладной системой автоматического понимания речи;
Разработанный в рамках настоящего диссертационного исследования i алгоритм оценки лексической близости ситуативных переходов гипотезе входной фразы позволяет уйти от последовательного перебора всех канонических перефразировок за счет предварительного анализа ситуативных переходов и отсечения заведомо бесперспективных, что позволило существенно повысить скорость ситуативной обработки.
За счет внесения онтологии, использования алгоритмов верификации
онтологического подмножества и метода оценки лексической* близости
ситуативных переходов достигается сокращение избыточности модели=
(¦» представления естественного языка и повышение скорости обработки гипотез,
входной фразы.
Реализация результатов! работы. Исследования, отраженные в? диссертации,, проведены в рамках научно-исследовательских работ: СПб НЦ РАН: «Разработка методов автоматического перевода устной^ речи» (№01.2.00309944) и «Перевод устнойфечи на основе интегрального подхода: исследование и применение ситуативной информации» (№01.2.00309949)' (2002-2003гг.); ФЦП «Интеграция»: Образовательно-исследовательский' центр языка и речи, № 326.81; проект МНТЦ № 1993Р (задача 4) «Модель голосового управления подвижным объектом». Кроме: того, результаты диссертационной;
8
работы использованы при разработке средств голосового доступа к информационной системе «Автомаркет» для компании «BridgeQuest».
Апробация; результатов* работы: Основные положения? и результаты диссертационной работы представлялись на Международных конференциях «Речь и Компьютер» SPEGOM (Санкт-Петербург 2000 ¦ Москва; 2001, Санкт-Петербург 2002, Москва 2003, Санкт-Петербург 2004), IX международной-конференции «Региональная информатика РИ-2004» (Санкт-Петербург 2004).
Публикации.. Основные результаты по материалам диссертационной* работы опубликованы в 9 печатных работах.
Структура»и= объем;работы.,Диссертация объемом 132 машинописные страницы, содержит введение, четыре главы и заключение,.список литературы; (106 наименований), 15 таблиц, 42 рисунка.
Основные результаты. В' результате проведенной работы был разработан метод верификации онтологического подмножества с использованием онтологии предметной области, которая вносит информацию> об иерархии понятий, а также за счет метода оценки лексической близости ситуативных переходов был усовершенствован ситуативный; анализ, позволяющий устранить смысловую неоднозначность высказывания.
1. Внесение онтологии предметной области и использование метода: верификации онтологического подмножества позволило учесть иерархические связи между терминами предметной области и проверить их семантическую связность. За счет предварительного отсечения^ гипотез, содержащих семантически не связные понятия, удалось существенно ускорить процесс обработки речи. Кроме того, обеспечена естественность взаимодействия пользователя; с прикладной системой понимания? речи за; счет возможности использования широкого спектра понятий, и; терминов; предметной области;
2. Метод оценки лексической близости ситуативных переходов позволил оценить релевантность анализируемой гипотезы конкретному ситуативному переходу без перебора^ всех перефразировок, и таким образом, ускорил процесс разрешения семантической неоднозначности: при ситуативном? анализе.
31 На основе разработанных методов была проведена модификация ; базовой модели интегрального понимания, в результате чего появилась возможность разрешать семантическую неоднозначность высказываний, содержащих термины различных уровней обобщения, без избыточного представления ситуативной информации.
Краткое содержание работы. В первой главе диссертации рассмотрен анализ состояния дел в области автоматического понимания речи. Качественному пониманию речи препятствуют факторы, связанные с соотнесением естественно-языкового высказывания с ожидаемыми действиями * системы. К ним относятся неоднозначности, обусловленные синтаксическими* неточностями, оговорками диктора и многозначностью слов,. а. также наличие различных уровней обобщения тех или иных специфических терминов? предметной области, которое ведет к терминологической путанице. Поэтому основными проблемами понимания речи являются семантико-синтаксическая* неоднозначность речевого высказывания, а также учет иерархии понятий предметной области. Эти проблемы возникают в условиях недостаточности априорной информации о естественном языке, поэтому решение этих проблем в первую очередь связано с адекватным отображением априорной информации о естественном языке во внутреннее машинное представление.
Bi результате многолетних исследований в области проблем автоматического понимания речи и естественно-языковой неоднозначности была осознана необходимость комплексного подхода к построению семантико- синтаксической модели языка и прагматической модели ПО [21,37]. При таком подходе синтаксическая информация используется5 как вспомогательная и позволяет оценить грамматическую корректность естественно-языковых конструкций, семантическая; информация накладывает связи между знаками? естественного языка, а прагматическая информация» соотносит знаки» естественного языка с реальными объектами и ситуациями.
Таким- образом, анализ существующих подходов к представлению? и обработке естественного языка показал, что существует ряд средств эффективного представления и обработки естественного языка; применение
10
которых в системах автоматического понимания речи позволит решить проблему неоднозначности и учесть иерархию понятий ПО.
Во второй главе приводится описание интегральной модели понимания; речи (разработанной ранее в группе речевой информатики СПИИРАН). Модель содержит модули акустического и естественно-языкового анализа. В> данной; работе более полно рассматривается уровень естественно-языкового анализа, поскольку он претерпел изменения? за. счет модификации представления и
-, обработки естественного языка, учитывающих иерархию терминов ПО.
В*результате внесения' онтологии ПО в рамках ситуативной модели было > модифицировано представление канонической перефразировки. Кроме того; наличие обобщающих понятий- обеспечивает уменьшение неоднозначности на ассоциативном уровне и значительное сокращение соответствующей5 базы данных за счет объединения нескольких элементов одного уровня-и их оценок семантической связности с остальными словами в одну группу. Таким образом; внесение онтологии позволило учесть иерархию понятий в ходе семантико-прагматического анализа и устранить избыточность в представлении ситуативной и ассоциативной информации;
Третья: глава описывает разработанные автором метод верификации онтологического подмножества на основе онтологии ПО и метод оценки лексической близости ситуативных переходов гипотезе входной фразы. Оба метода направлены на предварительную оценку поступающих на ситуативный анализ гипотез фраз. В методе верификации онтологического подмножества
¦*> выполняется поиск элементов подмножества в онтологии ПО, выявляется;
наличие или отсутствие прямых родственных связей между этими элементами;, а также определяются обобщающие понятиям для каждого из элементов: В^ результате внесения онтологии ПО в модель представления естественного языка и использование метода верификации онтологического подмножества были учтены иерархические связи между терминами предметной области и получена оценка их семантической связности.
Во второй части третьей1 главы, рассматривается метод оценки лексической; близости возможных ситуативных переходов гипотезе входной фразы, который позволяет заранее отсечь бесперспективные для; поступившего
11
набора гипотез ситуативные переходы и таким образом, значительно ускорить процесс ситуативного анализа..
Bi заключение третьей главы рассмотрена модификация модуля-естественно-языковой обработки. Модификация проведена на. основе разработанных методов,, которые обеспечивают сокращение гипотез; фраз выходящих с модуля ситуативного' анализа по двум; аспектам. Во-первых, сокращается; количество' гипотез, поступающих с уровня ассоциативного анализа. Во-вторых, сокращается ¦ число канонических перефразировок, поступающих на ситуативный< анализ. Таким: образом,- проведенная; модификация привела к ускорению работы ситуативного анализа^ и интегральной модели понимания» речи, в. целом; например, на 50% для модели i голосового управления самолетом.
В= четвертой; главе; приводятся- данные по реализации разработанных алгоритмов в экспериментально-исследовательских моделях речевого диалога. Разработанные в диссертации методы были; успешно реализованы в ряде научно-исследовательских моделей По проекту МНТЦ №1993Р,1 задача 4' создана модель голосового управлениям самолетом* на. основе разработанных алгоритмов естественно-языкового анализа. Внедрение разработанных методов -в рамках данного проекта позволило устранить избыточность базовой; модели представления и обработки естественного языка без потери качества понимания* речи. В рамках проекта; «Автомаркет» были разработаны средства голосового доступа к информационному автокаталогу. На основе предложенного метода •<и верификации онтологического подмножества был реализован механизм?
семантического анализа, позволяющий корректно обобщать термины; предметной области. Разработанные средства голосового доступа могут быть -, внедрены в антивандальные справочные системы, в предметных, областях с принятой и устоявшейся терминологией;
Таким образом, с помощью разработанных в диссертационной? работе методов и программных модулей; были созданы эффективные средства: человеко-машинного взаимодействия на; основе автоматического ввода* речи. Естественность взаимодействия^ пользователя с прикладной системой \
12
понимания речи была обеспечена за счет возможности использования широкого спектра понятий и терминов предметной области.
Положения, выносимые на защиту:
1. Модификация базовой модели представления естественного языка за счет внесения онтологии предметной области.
2. Метод верификации онтологического подмножества гипотезы входной фразы, позволяющий отсечь гипотезы входной фразы, содержащие семантически-несвязные подмножества.
3. Метод оценки лексической близости ситуативных переходов гипотезе входной фразы, позволяющий отсечь заведомо бесперспективные ситуативные переходы при ситуативном анализе.
4. Модификация базовой модели обработки естественно-языкового высказывания.
13
Глава 1. Анализ подходов и средств представления и обработки естественного языка в системах понимания речи
1111 Основные проблемы!
Понимание речи в области обычно трактуют как преобразование речевого сигнала в смысловое представление.. Его следует отличать от распознавания* речи, где целью является сопоставление речевого сигнала с соответствующими? словами в словаре. На рисунке 1.1 представлена типовая схема понимания речи, которая: содержит основные модули обработки входного высказывания:: распознавание входного сигнала и понимание естественно-языковой* последовательности.
Речевой Цепочка;
1гнал .словг
сип
Распознавание; слов
Обработка \ естественно-языковой ? последовательности ¦>
Тип?, смысла;
Рис. 1.1. Типовая схема понимания речи
В модуле «распознавания: речи» происходит преобразование речевого сигнала в естественно-языковую последовательность. Далее эта- гипотеза, поступает в- подсистему «понимания естественно-языковой последовательности», которая вырабатывает смысловое представление.
На уровне распознавания речевой сигнал проходит акустическую обработку. При этом он преобразуется из непрерывного акустического сигнала в предполагаемую естественно-языковую последовательность — гипотезу фразы. Распознавание речи опирается^ на априорную акустико-лексическую» информацию, которая?позволяет преобразовать входной сигнал в цепочку слов; представленных уже в виде текстовой информации: В\ модуле, распознавания с речи производится, сравнение входного сигнала с эталонными г лексическими г единицами, поэтому результат распознавания представлен в виде наиболее
14
вероятных цепочек слов. Задача дальнейшего анализа заключается, в преобразовании распознанной цепочки слов, т.е. естественно-языкового текста, в смысловое представление. Другими словами, необходимо реализовать процесс понимания.
Существуют различные точки зрения на термин "понимание". Наиболее распространенная из них состоит в том, что если на статистически достоверном; материале компьютер воспринимает входное сообщение пользователя! в соответствии с его ожиданиями, то он «понимает» пользователя; Согласно [27] можно выделить следующие - уровни машинного понимания: синтаксического (понимание формы), семантического (понимание содержания), прагматического (понимание целей общения).
Поскольку процесс реализуется: по аналогии с человеческим, то обратимся к прототипу. Человек воспринимает речь, рассматривая себя и происходящее речевое действие в определенном контексте. Он пользуется всей \ доступной априорной информацией о естественном языке и окружающей: действительности. Эта информация < позволяет ему устранить такие проблемы понимания как. многозначность, омонимия, синонимия; оговорки;, синтаксические и грамматические ошибки. Недопонимание возникает в тех случаях, когда знаки естественного языка имеют различный смысл в зависимости от контекста и синтаксиса. Однозначная интерпретация» знаков t достигается за счет их однозначного соотнесения с реальными событиямиt или • ситуациями.
Помимо неоднозначности при понимании речи возникает терминологическая путаница, обусловленная богатой иерархией понятиш конкретной предметной* области. Здесь причины неверного анализа естественного языка находятся; в концептуальной сфере, связанной с иерархией i понятий и объектов предметной; области, а также отношениями; между этими? объектами. Эта проблема проявляется* в ситуации общения; когда между пользователем; и системой возникает недопонимание, обусловленное разногласиями в представлении о предметной области.
Рассмотрим пример типичной терминологической путаницы. Эта неувязка может возникнуть при первом же обращении к системе, поскольку
15
человек формулирует запрос исходя из своих интересов и знаний, то термины, используемые им, могут оказаться, более специфичными, чем ожидаются системой, или наоборот. Например, в системе голосового доступа к электронному авто-каталогу на вопрос «Какую машину вы хотите?» система в первую очередь ожидает фразу: «Я-хочу купить машину марки Мерседес». Где Мерседес - это «марка» машины. Пользователь же вправе сказать: «Я хочу купить Sprinter». Имея в виду автомобиль «марки» Mercedes «модели» Sprinter. |#{ В случае прямого соотнесения запроса с ожидаемой канонической фразой
система понимания неизбежно столкнется с проблемой несоответствия, т.е.. с непониманием.
Таким образом, основной проблемой * понимания гречи является проблема отображения: естественного языка из внешнего представления; во внутреннее машинное представление. В; процессе восприятия^ речи человек пользуется? априорной информацией о языке: и окружающей среде: синтаксической, семантической и прагматической. Основной интерес представляют методы их представления, а также механизмы анализа.этих видов информации в системе автоматического понимания речи. Поэтому проанализируем основные подходы к представлению и обработке естественного языка на основе этих видов, информации.
1.2. Подходы к представлению и обработке естественного языка
'*'' В данном разделе дается краткий обзор подходов к обработке ЕЯ;.
Большинство современных исследований? в области моделирования естественно-языковых процессов опираются на три вида априорной' информации: синтаксическую, семантическую и прагматическую. За последние; десять лет сделано не мало аналитических обзоров по обработке естественного языка и способам его представления. К ним относятся работы M;F. Мальковского, А.С. Нариньяни, Сулейманова, Д.Ш. Шарова С.А., Дж. Слокум [15,21,37,44,66]. Исследователи, как правило, выделяют три подхода? к представлению и обработке естественного языка: (1) лингвистический,, ориентированные на извлечение семантико-синтаксических конструкций
16
естественного языка и построению максимально полных моделей: языка; (2) экспериментальный (семантико-прагматический), ориентированный на построение модели мышления и (3) прагматический, где язык рассматривается* как;средство достижения; определенных целей. Далее рассмотрим; каждый из подходов более детально.
11211. Лингвистические подходы
Лингвистические системы используют грамматику, описывающую
¦•¦о
возможные синтаксические структуры ЕЯ1 Как: правило, в< основе синтаксического анализа находятся, лингвистические теории, которые описывают способ представления. последовательности элементов предложения через грамматическую структуру компонентов [61,84,85^86].
Наиболее значимой' теорией построения идеальной синтаксической\ модели, которая послужила основой» создания* большинства: лингвистических систем, является теория! трансформационных грамматик, которую также называют генеративной грамматикой. Теория была разработана Н; Хомским [41] в начале 50-х гг. прошлого столетия. Центральная•> идея теории^ трансформационных грамматик состоит в том, что поверхностные формы любого языка могут быть представлены как результат взаимодействия нескольких подсистем: набор синтаксических правил (ограничений) и набор семантических правил. Основное внимание обращается на синтаксический; уровень, который описывается автономно. Синтаксические правила; ,.т% определяют правильное расположение слов в предложениях, а семантические:
правила, отвечают за то, чтобы правильно интерпретировать конкретное расположение слов в предложении. По мнению Хомского, теория ТГ описывает универсальную часть структуры языкового аппарата человека, не зависящую от конкретного языка.
Одной из первых компьютерных реализаций: ТГ, упомянутых в [102], является система MITRE transformational parser [106]. Использование большого количествам уровней в; алгоритме, методов программирования^ и компьютеров; доступных в первой половине 60-х годов, привело-к тому,.что скорость анализа была крайне низкой:.36 минут на среднее предложение длинойюколо 11 слов:
17
Обзор методов применения трансформационных грамматик к анализу ЕЯ' и реализованных алгоритмов дан в [57]. В числе поздних реализацийТГ-теории в [102] упоминается система PARSIFAL [78].
Теория ТГ послужила основой при создании модели «Смысл-Текст» [17]. Описание языка в этой модели устанавливает соответствие между смыслом и текстами данного языка, выражающими этот смысл. Язык рассматривается?как система кодов, соответствующая системе смыслов. Описание компьютерных реализаций теории «Смысл-Текст» содержится в [2,3].
Деревья разбора. Генеративная грамматика является системой жестко: фиксированных правил, описывающих корректные предложения:языка. Здесь, синтаксический анализ представляет собой построение дерева синтаксического разбора, которое можно производить как. сверху вниз - от нетерминального символа (нетерминальный символ обозначает класс синтаксически эквивалентных групп, имя символа используется при написании правил грамматики) к предложению языка, так и снизу вверх - от предложения; к начальному символу.
Нисходящий синтаксический разбор заключается в поиске замены-очередного нетерминального символа в выводимой цепочке на правую часть соответствующего правила. При этом алгоритм может руководствоваться только "незакрытой", то есть нераспознанной частью предложения. Обычно для« этого достаточно одного терминального символа.
При восходящем синтаксическом разборе в предложении (или; в промежуточной цепочке) ищется правая часть правила, которое необходимо "свернуть" к нетерминалу левойчасти. Решение принимается на основе анализа соседних терминальных символов в анализируемой цепочке.
По своей: природе алгоритмы синтаксического разбора: бывают детерминированные (сразу же строящие правильное дерево) и недетерминированные, то есть допускающие возврат на некоторое число шагов <-назад.
Bi качестве примера* можно привести типичную логическую систему, LUNAR [103] основанную на синтаксическом анализе. Здесь в результате синтаксического анализа дерево синтаксического разбора отображается? в.
Тип работы: Диссертация
Год: 2004
Страниц: 124



Подобные работы:

  • Формальные методы оценки эффективности систем автоматической обработки текста
  • Разработка языка и методов моделирования организационно-экономический систем, функционирующий в условиях чрезвычайный ситуаций
  • Исследование и разработка алгоритмов обработки речевой информации на основе представления Хургина-Яковлева в радиотехнических устройствах
  • Исследование методов и средств построения высокопроизводительный систем управления сетями цифровын автоматический телефонный станций Q ( п :z q=l U=l Шпо) 'и =2 ХА(^'ОТ) -Г +Т"" + у "Г*"9 5]д(*,«)T(Rna)] nqj *=1 (3.11) Приняв во внимание выражение (2.10), получаем: '.-?л А=1 9=1(3.12) Для N узлов выражение будет иметь вид: 'о =tt[t^T-^+^+±^)Щ^ я=1 ^=1 Ч.А-1 *-1 J Приняв во внимание выражение (2.
  • Проблемно-ориентированный механизм устойчивого развития предприятия Прибыль как цель адаптации одновременно может быть использована как мера инерции (см.п. 1.1), следовательно, ее следует использовать в результативном методе измерения. В этом случае в формуле 2.2.1 может быть применен аналог производительности труда - показатель, в котором объем производства продукции заменяется на объем прибыли от реализации продукции.
  • Исследование и разработка ассоциативных сред и методов обработки информации
  • Фонетические свойства звуковой системы сингальского языка как основа для автоматического транскриптора
  • Автоматическое решение формализованный задач теории автоматического управления На рис. 4.5 показано, что доказательство "-шаговой теоремы С -> D -" 0И теоремы С -> D -> 0Я_! 0Л Аналогичные метатеоремы можно сформулировать и по такой же схеме доказать для остальных правил вывода теории решений Т?р. 4.9.4. Исследование полноты аксиоматической теорииавтоматических решений формализованных задач ТАУ В связи с тем, что теория автоматического управления - непрерывно развивающаяся наука, нельзя построить единую законченную модель множества формализованных задач ТАУ.
  • Алгоритмы автоматического формирования базы правил для систем управления на нечеткой логике Если правило соответствующее введенным значениям входных данных не найдено, то выдается соответствующее предупреждение. Дефаззификация выходного значения производится по методу первого максимума. Файл Вид Справочники Базы | Отчеты Помощь Изображение термов Јjj Проверка работы баз прав! Проверка баз Значения входных данных: Кореляционныи анализ Наименование Угол 50 Расстояние 300 Скорость Код базы термов: О Код базы правил: |о _jJ р выводить сообщения Расчет Закрыть обрабатываются данные с кодом 3 значение принадлежит терму №2 .
  • Синтез адаптивных систем автоматического управления нелинейными объектами в условиях априорной неопределенности
  • Повышение эффективности функционирования систем электроснабжения посредством совершенствования автоматического резервирования на двухтрансформаторных подстанциях Контроль тока______ Контроль напряжения V V if Контроль наличия 1кз Фиксация отсутствия всех ид Фиксация наличия всех Цл Сигнал о исчезновении 1кз Фиксация совпадения сигналов 1ГЗапуск счетчика времени Отсчет времени, равного tAnBQ2 1 'Сигнал окончания отсчета 1 г ч гСигнал о появлении 1кз Фиксация совпадения сигналов 1 'Сигнал запрета ч г 1 ' Сброс сигнала запретаАВР Рис.
  • Разработка новык методов и алгоритмов компьютерной обработки данный при сжатии-восстановлении музыкальный файлов в информационно-телекоммуникационны к системах
  • Разработка организационно—экономический методов выбора и оценки экономической эффективности внедрения гибкой автоматической линии на машиностроительном предприятии Н cd >ч ч я о Ьн о со о о со я о Он1 я со я о о и о я 2 я н о о Ьн ю я и os я я со OJ я о cd Он| ч tr1 и н со о я 2 3 я я со 2 >, я ясо а о я о я cd н со X и я >Я н ^ cd 03 и cd я т со я о со ю о я я о У я е-1 cd я ч я X 3 я я1 Vо я Я эя cd о Он ю " о со >> ч со 2 Я ¦¦а 05 ЯУ я Н со ч со ч со 2 Dа о 2 о* >г ^ Е а ^2 н о со 03 Л cd ?" н ч я cd и ю я Он S Я Ю1-4 2 со со 2 я3 rtЯ W " о я я а" S и н " S о н аз 05 cdЬн 05 cdя я ю из 2 н н 2 hi, ч н О to О 03 я U о Он я 05 05 tdя я ч ЕГ 05 я я н cd 2 о нcd 1 У;" 05 ЯСС CJ Он J3 я CJ 05 cd X со я я § t3 о I Q s-а оо о О Я я cd Он Ю оэ :Я CD CD ct X л Я Я Я ч 3 н о ю cd Он ю о н я ее о " со Я О о, я и зЯ CD Н CD сс X 3 cj Я X 2 о2 5Я Ч яО cd Я С я 3 g 2 Он CJ я ^ cd ° 3 лн н CJ 05 зЯ Я CJ CJ 2 2 и ЯX 3 я яcd 03 О Он .
  • Особенности представления грамматического материала в учебнике русского языка для афганских учащихся Последний из рассматриваемых нами учебников - это "Учебник русского языка для говорящих по-китайски" (авторы Т.М. Балыхина, И.Ф, Евстигнеева, К.В. Маерова, О.И. Меншутина, Н.М, Румянцева; М.: Рус.яз.Курсы., 2000. -352с). Данная книга представляет собой курс русского языка для китайцев, изучающих язык с преподавателем или самостоятельно.
  • Разработка методов организации систем теплопотребления текстильного предприятия Одним из необходимых условий нормальной жизнедеятельности человека является обеспечение нормальных метеорологических условий в помещениях, оказывающих существенное влияние на его тепловое самочувствие. Метеорологические условия, или микроклимат, зависят от теплофизических особенностей технологического процесса, климата, сезона года, условий вентиляции и отопления.
    © 2006-11г. Планета диссертаций.