ВВЕДЕНИЕ
Проблемы принятия решений в сложных условиях занимают в настоящее время особое место в информационных технологиях. Математические методы широко применяются для описания и анализа сложных экономических, социальных и других систем. Теория оптимизации создала совокупность методов, помогающих при использовании ЭВМ эффективно принимать решения при известных и фиксированных параметрах или когда параметры -случайные величины с известными законами распределения. Существует, однако, ряд задач, которые не поддаются формальному описанию в силу того, что часть параметров представляют собой неточно или качественно заданные величины, для которых переход от «принадлежности к классу» к «непринадлежности» не скачкообразен, а непрерывен. Традиционные методы недостаточно пригодны для решения подобных задач именно потому, что они не в состоянии описать возникающую неопределенность.
Подход на основе теории нечетких множеств (ТНМ) является альтернативой общепринятым количественным методам анализа систем. Он имеет следующие отличительные черты: вместо или в дополнение к числовым переменным используются нечеткие величины и лингвистические переменные, отношения между переменными описываются при помощи нечетких высказываний и алгоритмов. Такой подход дает приближенные, но в то же время эффективные способы описания поведения систем настолько сложных и плохо определенных, что они не поддаются точному математическому моделированию. Теоретические же основания данного подхода вполне точны и строги в математическом смысле и не являются сами по себе источником неопределенности. В каждом конкретном случае степень точности решения может быть согласована с требованиями задачи. Подобная гибкость составляет одну из важных черт рассматриваемого метода [4, 79].
В общем случае осложненные условия эксплуатации современных технологических комплексов приводят к необходимости учета в процессе контроля и управления следующих видов неопределенности:
• низкая точность оперативной информации, получаемой с объектов управления, возникающая ввиду большой погрешности датчиков измерения технологических параметров (расхода, давления и т.д.), их невысокой надежности, отказов каналов связи, большого запаздывания при передаче информации по уровням управления, отсутствия возможности замеров параметров во всех точках технологического процесса, необходимых для моделей. Наличие такого вида неопределенности вызывает неточность в задании переменных величин в моделях, начальных и граничных условий;
• неточность моделей объектов контроля и управления, вызванная неэквивалентностью решений системных многоуровневых иерархических моделей и используемых на практике отдельных локальных задач. Неточность моделей может возникать из-за неверно проведенной декомпозиции общей задачи управления, излишней идеализации модели сложного процесса, разрыва существенных связей в технологическом комплексе, линеаризации, дискретизации, замены фактических характеристик оборудования паспортными, нарушения допущений, принятых при выводе уравнений (стационарности, изотермичности, однородности и т.д.);
• нечеткость в процессе принятия решений в многоуровневых иерархических системах, обусловленная тем, что наличие четких (точных) целей и координирующих решений на каждом уровне контроля и управления, и для каждого локального устройства регулирования затрудняет процесс координации и предопределяет длительный итеративный характер согласования решений;
• наличие диспетчера в контуре управления и ведение процесса координации в реальной производственной системе на естественном языке, приводит к необходимости учета трудностей представления знаний диспетчера в виде алгоритмов и согласованности полученного ЭВМ решения с его
5
оценкой: ненадежность исходной информации, получаемой от диспетчера в режиме принятия решения, неточность оценок, недоопределенность понятий и терминов, неуверенность диспетчеров в своих заключениях; нечеткость (неоднозначность) естественного языка (лингвистическая неопределенность) и языка представления правил в системах экспертного типа; процедура принятия решения базируется на неполной информации, т.е. нечетких посылках; неопределенность проявляется при агрегации правил и моделей, исходящих от разных источников знаний или от диспетчеров различных уровней управления (эти правила и модели могут быть противоречивыми, избыточными и т.п.).
Необходимость работы в этих условиях затрудняет использование стандартных систем автоматики и АСУ ТП. Особенно сложным является описание областей допустимых режимов работы оборудования в таких условиях, т.к. задание жестких (четких) ограничений для АСУ ТП и систем автоматики приводят в настоящее время к отключению этих систем диспетчером. Поэтому крайне важной представляется возможность использования ТНМ для описания и формализации областей допустимых режимов работы оборудования [4, 11, 22,29].
Основной областью применения алгоритмов нечеткой логики являются всевозможные экспертные системы, в том числе нелинейный контроль над процессами, распознавание образов, финансовый анализ, исследование данных. Недостатком систем на нечеткой логике, затрудняющим их применение в задачах управления, является сложность формирования ядра системы - базы знаний, для разработки которой требуется длительное взаимодействие аналитика с экспертом предметной области. При этом автоматизированное использование существующих баз данных также затруднено, так как методы извлечения правил из данных пока не получили достаточного развития. Поэтому автоматизация формирования базы правил систем управления на нечеткой логике является актуальной научно-технической задачей, решение
которой позволит значительно расширить область применения таких систем и сократить время их разработки.
Целью настоящей диссертационной работы является совершенство-вание процесса формирования базы знаний систем управления на нечеткой логике.
Для достижения цели необходимо решить следующие задачи:
1. Провести сравнительный анализ методов хранения и обработки нечеткой информации.
2. Разработать алгоритм для генерирования нечетких правил на основании экспертной информации.
3. Разработать метод оценки эффективности баз нечетких правил для сравнения их между собой и выявления наиболее эффективных.
4. Разработать алгоритмы оптимизации баз нечетких правил для повышения их эффективности.
5. Реализовать программно и проверить работоспособность построенных алгоритмов на тестовых и реальных задачах.
Методы исследования. Для решения поставленных задач использовался аппарат системного анализа, теории нечетких множеств, теории оптимизации, математического моделирования, теории информации и методы математической статистики.
Научная новизна диссертационной работы состоит в следующем:
1. Впервые разработан алгоритм для автоматической генерации базы правил систем управления на нечеткой логике, основанный на использовании экспертной информации.
2. Разработан новый метод оценки базы правил систем на нечеткой логике, отличающийся использованием тренировочного множества.
3. Разработаны новые алгоритмы оптимизации базы правил систем на нечет- кой логике, отличающиеся выявлением избыточной информации, содержащейся в базе правил.
Практическая ценность. Разработанный в рамках диссертационной работы подход к автоматическому формированию и оптимизации базы правил систем на нечеткой логике может быть использован для обработки экспертной информации, разработки нечетких систем управления в различных отраслях.
Реализация результатов работы. Созданная программная система автоматического формирования базы правил прошла экспертизу и зарегистрирована в отраслевом фонде алгоритмов и программ, № государственной регистрации 50200401213, что делает ее доступной для широкого круга специалистов.
Система используется в учебном процессе при проведении лабораторных работ, а так же при выполнении дипломных работ в Красноярском филиале Московского университета экономики, статистики и информатики (МЭСИ) и Сибирском государственном аэрокосмическом университете им. ак. М.Ф. Решетнева (СибГАУ).
Разработана информационная система для завода «КраМЗ-Кузнец», которая используется при принятии решений по улучшению качества продукции и предупреждению получения брака.
Основные защищаемые положения:
1. Разработанный алгоритм обеспечивает обработку экспертной информации для автоматической генерации базы правил систем на нечеткой логике.
2. Разработанный метод оценки эффективности баз нечетких правил позволяет сравнивать их, выявляя наиболее эффективные.
3. Разработанные алгоритмы оптимизации базы нечетких правил обеспечивают повышение эффективности работы базы правил.
4. Предложенный подход обеспечивает автоматизацию формирования базы правил систем на нечеткой логике.
Публикации. По теме диссертации опубликовано десять печатных работ.
Апробация работы. Основные положения диссертационной работы докладывались и получили одобрение на заседаниях кафедры системного анализа и исследования операций СибГАУ им. ак. М.Ф. Решетнева (2003, 2004), на Всероссийской научной конференции с международным участием «Решетневские чтения» (Красноярск 2002, 2004), на межвузовской конференции «Информатика и информационные технологии» (Красноярск 2003), на научной конференции «Наука. Техника. Инновации.» (Новосибирск 2002, 2003), на международной многопрофильной конференции «Актуальные проблемы современной науки» (Самара 2004), на международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании» (Пенза 2004), на межрегиональной конференции «Молодежь Сибири науке России» (Красноярск 2004).
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ СИСТЕМ НА НЕЧЕТКОЙ ЛОГИКЕ
§1.1. Состояние проблемы
Исследования процессов и явлений, динамика которых во многом зависит от человека, принимаемых им решений дали новое понятие — сложная система. Сложные системы, как правило, характеризуются большим числом параметров и взаимосвязей, настолько большим, что невозможно решать такие задачи аналитически. Практически всегда нельзя упростить задачу для проведения экспериментов, т.е. время эксперимента сравнимо со временем функционирования системы. Сложная система представляется в виде многоуровневой конструкции из взаимодействующих между собой и с внешней средой элементов. При изучении сложных систем огромный вес имеют суждения и действия человека или природы, чьи действия характеризуются вы-^* сокой степенью неопределенности. Поэтому предпочтительно использовать
аппарат ТНМ, позволяющий учитывать интенсивность, частичность, степень проявления исследуемых свойств сложной системы [29].
При использовании ТНМ элементы сложной системы могут быть представлены в виде нечетких множеств с функцией принадлежности
tf{x\i = l,...,n (n - число независимых элементов системы), а их взаимодействия будут учитываться в нечетких операторах агрегирования априорной информации о сложной системе.
Известные свойства сложной системы также можно представить в виде
нечетких множеств с функциями принадлежности МЛХ\ i= l,—,m (т — число априорно заданных свойств системы). В результате, нечеткое решение, соответствующее математической модели сложной системы будет представ-_ ляться в виде нечеткого множества с функцией принадлежности вида
где * — нечеткие операторы.
10
При анализе сложных систем часто встречается иерархическая структура, которая позволяет осуществить уменьшение информации, передавае-w мой с уровня на уровень. В этом случае можно создавать промежуточные не-
четкие модели (соответствующие подсистемам), на основе которых стандартными операторами агрегирования информации строится окончательная нечеткая модель сложной системы, что упрощает процесс создания математической модели.
Перечислим отличительные преимущества систем на нечеткой логике по сравнению с прочими:
• возможность оперирования входными данными, заданными нечетко: например, непрерывно изменяющиеся во времени значения (динамические задачи), значения, которые невозможно задать однозначно (результаты статистических опросов, рекламные компании и т.д.);
• возможность нечеткой формализации критериев оценки и сравнения: + оперирование критериями «большинство», «возможно»,
«предпочтительно» и т.д.;
• возможность проведения качественных оценок как входных данных, так и выводимых результатов: оперирование не только значениями данных, но их степенью достоверности и ее распределением;
• возможность проведения быстрого моделирования сложных динамических систем и их сравнительный анализ с заданной степенью точности: оперируя принципами поведения системы, описанными методами ТНМ, осуществляется экономия времени на выяснение точных значений переменных и составление уравнений, которые их описывают, возможность оценки разных вариантов выходных значений.
В последние годы за рубежом наблюдается повышенный интерес к использованию нечетких интеллектуальных технологий в промышленности, т экономике, системах военного применения. В США рост спроса на нечеткие
контроллеры в технологических средах достиг нескольких миллиардов дол-
11
ларов в год. Проекты, связанные с разработкой нечетких систем и технологий, активно финансируются во всем мире.
В частности, в Европе на эти работы затрачиваются большие средства в рамках второй фазы известной программы ESPRIT. Создаются научные институты и центры, в том числе международные, работающие по данной тематике, например, лаборатория LIFE в Японии и Европейская лаборатория ELITE в Германии, образованы сотни фирм, работающих в области создания инструментальных сред для разработки нечетких систем, проектирования нечетких микросхем и приложений для них. Растет число научных конференций и публикации по этой проблематике [21, 23,29, 31].
Нечеткие вычисления в настоящее время положены в основу вычислительной техники 6-го поколения и возникли в результате «обратной волны» в схеме «ТНМ <= нечеткие модели с= нечеткие системы <= нечеткие инструментальные программные средства <= нечеткие аппаратные средства».
Среди лидеров нового рынка выделяется американская компания Hyper Logic, основанная в 1987 году Фредом Уоткинсом (Fred Watkins). Первоначально компания специализировалась на нейронных сетях, однако вскоре целиком сконцентрировалась на нечеткой логике. Недавно вышедшая на рынок вторая версия пакета CubiCalc фирмы Hyper Logic является одной из наиболее мощных экспертных систем на основе нечеткой логики. Пакет содержит интерактивную оболочку для разработки нечетких экспертных систем и систем управления, а также модуль, позволяющий оформлять созданные пользователем системы в виде отдельных программ. От других пакетов CubiCalc отличает также наличие весьма мощной утилиты Rule Maker, позволяющей решать одну из основных проблем в работе с нечеткой логикой - автоматическое построение нечетких правил. Судя по всему, в основе Rule Maker лежат усовершенствованные алгоритмы кластеризации Кохонена, хотя авторы держат «начинку» пакета в тайне, поскольку на упаковке программы до сих пор находится этикетка «Не для экспорта из США». А запрет на ввоз в Россию самого пакета CubiCalc был преодолен лишь в середине 1995 года. Сего-
12
дня CubiCalc применяется отечественными специалистами при решении десятков различных задач — от адаптивного управления оптовыми складами до моделирования рынка фьючерсных контрактов. Большинство пользователей CubiCalc - это финансовые и политические аналитики, которым нечеткая логика помогает ориентироваться в нашей нечеткой действительности [21, 23, 29,31].
После первых промышленных приложений в Европе Япония за короткий период времени вышла на первое место в мире по количеству устройств и механизмов, в которых были реализованы нечеткие технологии. Появление микропроцессоров и микроконтроллеров инициировало резкое увеличение бытовых приборов и промышленных установок с алгоритмами управления на основе нечеткой логики. В настоящее время в Японии запатентовано более чем 3000 соответствующих устройств в этой области [21, 23,29, 31].
Имеется целый ряд обстоятельств, которые объясняют причины столь ф впечатляющей популярности нечеткой логики в Японии. Во-первых, нечет-
кая логика поддерживает разработку быстрого прототипа технического устройства с последующим усложнением его функциональности, что характерно для стиля работы японских инженеров. Во-вторых, нечеткая логическая модель более проста для понимания, чем аналогичная математическая модель на основе дифференциальных или разностных уравнений. В-третьих, нечеткие модели оказываются более простыми для своей аппаратной реализации по сравнению с классическими алгоритмами управления техническими системами.
Таким образом, можно сделать вывод, что область применения ТНМ с каждым годом продолжает расширяться. При этом процесс разработки и применения нечетких моделей тесно связан с концепцией системного моделирования как наиболее общей методологией построения и использования ^ информационных моделей сложных систем различной природы [21, 23, 29,
31].
13
§1.2. Ключевые понятия
В связи с нетрадиционностью применяемого математического аппарата далее приводятся основные понятия ТНМ. Основное внимание уделяется систематизированному изложению вопросов моделирования с нечеткими величинами.
Носитель Х- это универсальное множество, к которому относятся все результаты наблюдений в рамках оцениваемой квазистатистики. Например, если мы наблюдаем возраст людей, занятых в определенных отраслях экономики, то носитель - это отрезок вещественной оси, где единицей измерения выступают годы жизни человека.
Нечеткое множество А - это множество значений носителя, такое, что каждому значению носителя сопоставлена степень принадлежности этого значения множеству А. Например: буквы латинского алфавита X, Y, Z безусловно принадлежат множеству Alphabet = {А, В, С,..., X, Y, Z}, и с этой точки зрения множество Alphabet - четкое. Но если анализировать множество «Оптимальный возраст работника», то возраст 50 лет принадлежит этому нечеткому множеству только с некоторой долей условности ц, которую называют функцией принадлежности.
Функция принадлежности \1\(х) - это функция, областью определения которой является носитель X, х е X, а областью значений - единичный интервал [0,1]. Чем больше значение \i\(x), тем выше оценивается степень принадлежности элемента носителя и нечеткому множеству А. Например, на рисунке 1.1 представлена функция принадлежности нечеткого множества «Оптимальный возраст работающего», полученная на основании опроса ряда экспертов.
14
20
30
50
60
70
80
Рис. 1.1. Вид функции принадлежности
Видно, что возраст от 20 до 35 оценивается экспертами как бесспорно оптимальный, а от 60 и выше - как бесспорно неоптимальный. В диапазоне от 35 до 60 эксперты проявляют неуверенность в своей классификации, и структура этой неуверенности как раз и передается графиком функции принадлежности.
Нечеткое число - это нечеткое подмножество универсального множества действительных чисел, имеющее нормальную и выпуклую функцию принадлежности, то есть такую, что существует такое значение носителя, в котором функция принадлежности равна единице, а также при отступлении от своего максимума влево или вправо функция принадлежности убывает.
Опорное множество. Пусть А - нечеткое подмножество X; опорное множество множества А, обозначаемое supp(A), есть четкое подмножество множества X, все элементы которого имеют ненулевую степень принадлежности в А
supp(A) = {xeX\A(x)>0}.
Нечеткое подмножество А классического множествах называется нормальным, если существует х еХ такой, что А(х) = /.В противном случае А — субнормально [24, 44, 79].
Пусть Аи В - нечеткие подмножества классического множества X. Мы говорим, что А есть подмножество В, если А(х) < В(х)^Х ? X.
15
Рис. 1.2. А есть подмножество В
Равенство нечетких множеств. Пусть А и В — нечеткие подмножества классического множества X. Говорят, что А и В равны и обозначают А=В, ес-пиА<^ВиВ(=А. Отметим, что А =В тогда и только тогда, когда А(х)=В(х) для
Пустое нечеткое множество. Пустое нечеткое подмножество множества X определяется как нечеткое подмножество 0 множества X такое, что 0(х) = 0 для каждого х е X. '
Легко видеть, что 0с А имеет место для любого нечеткого подмно-
¦
жества А множествах
Наибольшее нечеткое множество в X называется универсальным не-
четким множеством вХ, обозначается 7фИ определяется как
Легко видеть, что для любого нечеткого подмножества А множества X имеет место Ac f«,
1
Рис. 1.3. Универсальное нечеткое множество
16
хо
Рис. 1.4. Нечеткая точка
Пересечение нечетких множеств АиВ определяется как
(АпВ)(х)=т1п{А(х),В(х)}=А(х)лВ(х),\/хеХ.
Рис. 1.5. Пересечение нечетких множеств
Объединение нечетких множеств АиВ определяется как
(A u B)(jc)=max {A(x),B(x)} = A(x) v В(х),\/х е X.
Рис. 1.6. Объединение нечетких множеств
Дополнение нечеткого множества А определяется как
Ы)(х)=1-А(х).
17
Нечеткая точка. Пусть А — нечеткое число. Если supp(A) = {хА, то А называется нечеткой точкой, используется обозначение А — Хо. |