2 СОДЕРЖАНИЕ
Стр.
Определения, обозначения и сокращения 7
Введение 12
1. Постановка задачи 12
2. Актуальность темы 18
3. Положения, выносимые на защиту 19
4. Практическая значимость работы 20 1. Разработка баз данных по материалам для электроники 22
1.1. Базы данных по веществам и материалам для
электроники, созданные в мире 22
1.2. База данных по свойствам неорганических соединений «Фазы» 32
1.2.1. Структура базы данных 3 3
1.2.2. Программное и аппаратное обеспечение БД «Фазы» 35
1.2.2.1. Архитектура БД 34
1.2.2.2. Подсистема редактирования информации БД 37
1.2.2.3. Подсистема поиска информации в БД 38
1.3. База данных по фазовым диаграммам систем с полупроводниковыми соединениями «Диаграмма» 41
1.3.1. Системы и свойства, заносимые в базу данных «Диаграмма» 43
1.3.2. Структура базы данных 47
1.3.3. Программное и аппаратное обеспечение БД «Диаграмма» 51
1.3.3.1. Архитектура БД 51
1.3.3.2. Система удаленного администрирования БД 53
1.3.3.3. Система удаленного доступа пользователей к БД «Диаграмма» из сети Интернет 53
3 1.3.3.4. Система визуализации графической информации 61
1.4. База данных по свойствам акустооптических, электрооптических и нелинеинооптических веществ «Кристалл» 67
1.4.1. Физические основы функционирования акусто-, электро- и нелинеинооптических материалов и обоснование выбора свойств веществ, заносимых в
базу данных «Кристалл» 69
1.4.2. Критерии отбора материалов, информация о которых заносится в базу данных 71
1.4.3. Структура базы данных 75
1.4.4. Программное и аппаратное обеспечение БД «Кристалл» 78
1.4.4.1. Архитектура БД 78
1.4.4.2. Система удаленного администрирования БД 79
1.4.4.3. Система удаленного доступа пользователей к БД «Кристалл» из сети Интернет 80
1.5. Интеграция баз данных по веществам и материалам
ИМЕТ РАН 86
2. Методы конструирования неорганических веществ 92
2.1. Квантовомеханические методы 93
2.2. Эмпирические методы 98
2.3. Методы поиска многомерных классифицирующих закономерностей 100
2.3.1. Автоматическая классификация 105
2.3.2. Обучение ЭВМ распознаванию образов 111
2.3.2.1. Статистические методы 114
2.3.2.2. Эвристические методы 115
2.3.2.3. Методы нейрокибернетики 118
2.3.2.4. Методы обучения ЭВМ процессу формирования
4
понятий на основе растущих пирамидальных сетей 123
2.3.3. Поиск наиболее важных для классификации
признаков 136
2.4. Обзор исследований по конструированию
неорганических веществ и материалов 140
2.4.1. Прогноз типа диаграмм состояния физико-химических систем 142
2.4.2. Прогноз возможности образования соединений определенного состава в неорганических системах 148
2.4.3. Прогноз свойств неорганических соединений 151
2.4.3.1. Прогноз типа кристаллической структуры неорганических соединений 151
2.4.3.2. Прогноз физических свойств неорганических соединений 158
2.4.4. Применение методов распознавания образов в промышленных разработках неорганических материалов 165
3. Конструирование неорганических соединений, перспективных для применения в электронике 168
3.1. Методика конструирования новых неорганических
соединений, используемая в настоящей работе 170
3.1.1. Выбор наборов признаков для описания физико-химических систем 170
3.1.2. Дискретизация признаков 171
3.1.3. Выбор примеров для обучения ЭВМ 173
3.1.4. Повышение достоверности прогнозирования за счет сравнения результатов прогноза с использованием
разных наборов признаков 175
3.1.5. Классифицирующие закономерности 176
5
3.2. Конструирование соединений, перспективных для разработки новых полупроводниковых материалов 180
3.2.1. Соединения состава АВ2Х4 (X = S, Se, Те) 181
3.2.1.1. Прогноз возможности образования соединений состава АВ2Х4 182
3.2.1.2. Прогноз типа кристаллической структуры соединений состава АВ2Х4 189
3.2.2. Соединения состава АВХ2 (X = S, Se, Те) 204
3.2.2.1. Прогноз возможности образования соединений состава АВХ2 205
3.2.2.2. Прогноз соединений состава АВХ2 с кристаллической структурой типа a-NaFeO2 211
3.2.3. Соединения состава АВХ (X = Р, As, Sb, Bi) 214
3.3. Конструирование соединений, перспективных для использования в качестве новых сегнетоэлектрических, пьезоэлектрических, акустооптических, электрооптических и нелинеинооптических материалов 222
3.3.1. Халькопириты состава АВХ2 227
3.3.1.1. Халькопириты состава АВХ2 (А = Li, Na, К, Rb, Cs, Ag, Au, Zn, Cd, Hg; В = Al, Ga, In, Tl, Fe, Co,
Ni; X = O, S, Se, Те) 228
3.3.1.2. Халькопириты состава АВХ2 (А = Mg, Ca, Sr, Ba, Zn, Cd, Hg; В = Si, Ge, Sn; X = N, P, As, Sb, Bi, S, Se, Те) и CDY2 (С = Li, Na, K, Rb, Cs; D = P, As,
Sb, Bi; Y = N, P, As, Sb, Bi) 231
3.3.2. Соединения состава АВО3 с кристаллической структурой искаженного ильменита и перовскита 233
3.3.2.1. Поиск эмпирических критериев существования перовскитной структуры 234
3.3.2.2. Прогноз возможности образования соединений
6
состава АВО3 238
3.3.2.3. Прогноз типа кристаллической структуры
соединений состава АВО3 240
3.3.3. Соединения состава ABF5 с кристаллическими структурами типа BaFeF5, BaGaF5 и CaFeF5 248
3.3.4. Соединения состава А2В2(ХО4)з (X = S, Cr, Mo, W) с
кристаллической структурой типа лангбейнита 251
3.4. Конструирование соединений, перспективных для использования в качестве новых магнитных материалов 255
3.4.1. Соединения состава АВ2О4 со структурой шпинели 255
3.4.1.1. Прогноз возможности образования соединений состава АВ2О4 256
3.4.1.2. Прогноз соединений состава АВ2О4 со
структурой шпинели 259
3.4.2. Соединения состава АВ2Х2 (X = Al, Si, Ge, P, As, Sb) с кристаллической структурой типа ThCr2Si2 263
3.4.3. Фазы Гейслера состава АВХ2 267
3.5. Кибернетико-статистический подход к конструированию новых веществ с заданными свойствами 272
4. Заключение 278
4.1. Компьютерное конструирование неорганических веществ
как способ автоматизации поиска новых материалов 278
4.2. Основные направления развития предложенного подхода 282 Выводы 289 Литература 292 |
7 Определения, обозначения и сокращения
В настоящей диссертационной работе применяют следующие термины и сокращения с соответствующими определениями:
Автоматическая классификация - поиск классифицирующих правил для разделения множества объектов, принадлежащих к неизвестным классам, на конечное число классов.
АО - акустооптический.
БД - база данных - совокупность взаимосвязанных данных, используемых несколькими приложениями под управлением системы управления базой данных.
Браузер - специальная программа для доступа к Интернет, обеспечивающая поиск и отображение на экране монитора WWW-документов.
Выборка для прогноза - многомерная матрица значений признаков. Каждая строка матрицы соответствует некоторой неизученной физико-химической системе, чей класс необходимо определить.
ГНТПР - Государственная научно-техническая программа России.
Изоструктурные соединения - ряд химических соединений, кристаллизующихся в одном структурном типе, т.е. имеющих одинаковую пространственную группу, в которой атомами заняты одни и те же правильны системы точек с одинаковыми или близкими координатами.
Изотипные соединения — соединения, которые имеют родственное строение, которое может быть описано на основе одной кристаллохимиче-ской модели, но подобие структур не сохраняется.
ИМЕТ РАН - Институт металлургии и материаловедения им.А.А.Байкова Российской академии наук.
ИПроС - информационно-прогнозирующая система - предназначена для поиска данных об изученных соединениях и прогноза еще неполученных фаз и оценки их свойств.
8
Искусственный интеллект - искусственная система, созданная на основе компьютерных технологий, которая моделирует человеческие способы решения сложных задач.
ИХПМ- Институт химических проблем микроэлектроники.
Класс - множество объектов, объединенных общим свойством (свойствами).
Классификационная схема — набор правил, определяющих некоторую классификацию.
Классификация - разделение объектов на классы согласно некоторому существенному признаку (признакам).
к.ч. - координационное число.
ИКАО - линейная комбинация атомных орбиталей.
МО - молекулярная орбиталь.
НО - нелинейнооптический.
Образ — множество (класс) любых объектов, объединенных общими свойствами.
Обучающая выборка - многомерная матрица значений признаков и вектор значений целевого свойства. Каждая строка матрицы соответствует некоторой изученной физико-химической системе, чей класс определяется соответствующим значением вектора целевого свойства.
Обучение ЭВМ- процесс модификации параметров классифицирующей системы на основе использования экспериментальных данных с целью улучшения качества классификации. Задачу обучения ЭВМ можно трактовать как задачу построения многомерного классифицирующего правила на основе анализа экспериментальных данных {обучающей выборки).
Объект - физико-химическая система, которая описана набором значений свойств (признаков) компонентов (химических элементов или простых соединений).
Пирамидальная сеть - ациклический ориентированный граф, в котором нет вершин, имеющих одну заходящую дугу.
9
ПО - программное обеспечение.
Понятие - обобщенная информация о множестве объектов, представленных наборами значений признаков, которая отображает характерные для этого множества логические отношения между отдельными значениями признаков и является достаточной для распознавания (с помощью "екоторо-го правила) объектов, принадлежащих множеству, от объектов, не принадлежащих ему.
Признаки - свойства, по значениям которых объекты объединяются в классы.
Пр. гр. - пространственная группа.
Прогнозирование (предсказание) - отнесение нового объекта к определенному классу в соответствии с заданной классификационной схемой.
ПЭ - пьезоэлектрический.
Растущая пирамидальная сеть - пирамидальная сеть, в которой определены процессы формирования понятий и связей.
Сервер — узел компьютерной сети, выполняющий определенные функции по запросам других узлов.
Соединение химическое - однородное вещество постоянного или переменного состава с качественно отличным от свойств образующих его элементов химическим или кристаллохимическим строением. Соединение образовано из атомов нескольких химических элементов, связанных химической связью. На фазовой диаграмме область гомогенности соединения отделена (при всех температурах и давлениях) от области компонентов или твердых растворов на их основе. Элементы в соединении не могут быть разделены простым механическим способом, а лишь химической обработкой, нагреванием или электрическим током.
СТ - структурный тип - кристаллохимическая модель, описывающая строение группы соединений с точностью до подобия.
10
СУБД - система управления базой данных - программная система, обеспечивающая определение физической и логической структуры базы данных, ввод информации и доступ к ней.
СЭ - сегнетоэлектрический.
ФД - фазовая диаграмма.
Физико-химическая система - система (например, соединение или твердый раствор), образованная химическими элементами и/или соединениями.
Формирование понятий - процесс поиска закономерностей, свойственных множествам объектов.
ЭО — электрооптический.
ADO - ActiveX Data Objects - объектный интерфейс.
ADTG - Advanced Data Table Gram - формат хранения наборов данных.
API - Application Programming Interface - программный интерфейс приложения.
ASCII - American Standard Code for Information Interchange - стандартная схема кодирования знаков (семиразрядный код), обеспечивающая 128 различных комбинаций.
ASP - Active Server Pages - активные серверные страницы.
BLOB - Binary Large Object - двоичный объект большого размера, который может содержать перемечное количество данных.
CGI- Common Gateway Interface - общий шлюзовой интерфейс.
CONFOR - CONcept FORmation- система программ, направленная на логический анализ больших объемов экспериментальных данных с целью поиска закономерностей. Разработана в Институте кибернетики НАН Украины.
EOARD - European Office of Aerospace Research and Developments.
FTP - File Transfer Protocol - протокол передачи данных.
GIF - Graphics Interchange Format - растровый графический формат фирмы CompuServe.
11
HTML - Hypertext Markup Language - язык гипертекстовый разметки.
IIS - Internet Information Server - информационный сервер Интернет.
ISAPI — Internet Server API - интерфейс прикладного программирования Интернет-сервера.
JPEG - Joint Photography Experts Group - растровый графический формат (более точно - алгоритм сжатия графической информации).
MS*- фирма Microsoft (США).
MS DOS— MS Disk Operating System - операционная система, разработанная фирмой Microsoft для ЭВМ на основе микропроцессоров Intel 8086.
PHP - Personal Home Page tools- язык описания сценариев, выполняемых на сервере, встроенный в HTML.
SQL - Structured Query Language - структурированный язык запросов для определения, изменения и управления в реляционных БД, разработанный корпорацией IBM в 1970 г.
SWF - Shock Wave Flash - векторный графический формат.
USAF - United State Air Force
XML - extended Markup Language - расширенный язык разметки.
12 Введение
1. Постановка задачи
Задачу компьютерного конструирования новых неорганических соедине-ний можно сформулировать следующим образом: найти совокупность химических элементов и их соотношение (т.е. качественный и количественный состав) для создания (при заданных внешних условиях) определенной молекулярной или кристаллической пространственной структуры соединения, позволяющей реализовать необходимые функциональные свойства. Исходной информацией для расчетов должны быть только свойства химических элементов и данные о других уже изученных соединениях.
Термин «компьютерное конструирование соединений» - «computer-aided compound design» - появился четверть века тому назад в связи с решением проблем поиска взаимосвязей между структурой и свойствами органических соединений [1,2]. Использование разнообразных методов компьютерного анализа экспериментальной информации о многочисленных органических соединениях позволило предсказывать молекулярную структуру, набор и положение заместителей в еще неполученных органических соединениях, которые обеспечивали бы заданные функциональные свойства. Соблюдение правил валентности для четырехвалентного углерода и одновалентного водорода в органических соединениях значительно упрощает решение задачи компьютерного дизайна органических соединений. С этой точки зрения проблема компьютерного конструирования неорганических соединений - более сложная, т.к. правило валентности строго соблюдается лишь в соединениях с ионным типом химической связи и частично - в ковалентных соединениях. Поэтому появившийся в девяностые годы термин «компьютерное конструирование неорганических соединений» [3-9] ассоциировался не только с разработкой молекулярной структуры, но и с поиском качественного и количественного состава еще неполученных соединений и с оценкой их возможных свойств на основе использования информации об образующих их элементах и других, уже полученных, соединениях. Следует
13
отметить, что термин «компьютерное конструирование соединений» оказался очень удачным, поэтому он сейчас широко используется исследователями для обозначения разнообразных теоретических методов априорного (т.е. на основе только значений свойств компонентов) расчета новых веществ: от квантовоме-ханических методов [10] до эмпирических подходов, использующих методы компьютерного анализа данных [3, 4, 6, 7, 11-26].
Примеры задач компьютерного конструирования неорганических соединений:
компьютерное конструирование химических систем с образованием и отсутствием соединений;
- компьютерное конструирование химических систем с образованием соединений определенного количественного состава при заданных внешних условиях;
- компьютерное конструирование химических соединений с заданной кристаллической структурой при определенных внешних условиях;
- компьютерное конструирование химических соединений с заданными функциональными свойствами (температурой плавления, температурой перехода в сверхпроводящее состояние и т.д.).
Разработано несколько подходов к решению указанных выше задач:
- квантовомеханический подход [10, 27-37];
- простейшие эмпирические двух- и трехмерные критерии образования соединений с заданными свойствами [38-62];
- многомерные эмпирические классифицирующие закономерности, предназначенные для прогнозирования новых неорганических веществ [3-7, 11-26,63-153].
Как известно [10, 27-37], квантовомеханический подход к расчету химических соединений основан на уравнении Шредингера. Точное решение последнего для конкретных неорганических веществ связано с серьезными математическими трудностями, которые удалось преодолеть лишь для простейших
14
систем. Для сложных атомов и систем в настоящее время возможно получение только приближенных решений.
В связи с многочисленными трудностями, возникающими при квантово-механических расчетах еще неполученных неорганических веществ, химики и материаловеды начали разрабатывать и использовать различные эмпирические критерии образования соединений с заданными свойствами [38-62]. Основная гипотеза, лежащая в основе методов поиска таких критериев и закономерностей в вышеуказанных работах: фундаментальные свойства неорганических соединений при различных условиях (температуре, давлении, соотношении компонентов и т.д.) связаны периодическими зависимостями с фундаментальными свойствами химических элементов, входящих в их состав. При этом предполагается, что многочисленные, известные к настоящему времени, неорганические вещества подчиняются этим зависимостям. В связи с этим задача сводится к поиску закономерностей на основе анализа информации об уже исследованных веществах. Технологию разработки эмпирических критериев легко пояснить с использованием представлений о пространстве свойств химических элементов, входящих в состав химических веществ. Каждое вещество представлено в этом пространстве точкой, координаты которой определяются значениями свойств элементов, входящих в состав вещества. Процесс создания эмпирических критериев основан на анализе расположения точек, соответствующих изученным веществам различных типов, в пространстве свойств элементов и поиске поверхностей, разделяющих классы (классификационных правил). Последние позволяют отделить в пространстве свойств элементов области химических веществ одного типа от областей веществ другого типа (например, разделить точки, соответствующие соединениям с кристаллической структурой перовскита от точек, относящихся к соединениям со структурами ильменита, арагонита, кальцита, ватерита и т.д.). В случае простейших эмпирических критериев анализ расположения точек, соответствующих химическим объектам, осуществляется в двух- или трехмерных пространствах свойств элементов. Как правило, подобная классификация является грубой, т.к. свойства химических соедине-
15
ний, особенно многокомпонентных, зависят от многих свойств элементов. Поэтому естественным развитием такого подхода был переход к многомерным классифицирующим закономерностям. Разработка последних возможна только с применением компьютеров и специальных программ поиска закономерностей в больших объемах данных.
В настоящей диссертации разработан подход к компьютерному конструированию сложных неорганических соединений, который использует методы искусственного интеллекта для анализа информации баз данных по свойствам неорганических веществ.
Впервые методы искусственного интеллекта использовали для прогноза новых двойных неорганических фаз Е.М.Савицкий с соавторами [12, 81]. Работы, проводимые в ИМЕТ с середины 60-х годов, стали естественным продолжением исследований по применению искусственного интеллекта в химии, начатых в конце пятидесятых годов, с самых первых шагов этого направления информатики. Уже тогда стало ясно, что новый компьютерный подход очень перспективен для решения плохо формализуемых задач химии. Первые приме-нения были связаны с органической химией и обработкой спектральной информации [2, 154, 155]. В 1965 г. в Станфордском университете Buchanan, Feigenbaum и Lederberg начали разработку одной из первых экспертных систем - DENDRAL, предназначенной для анализа спектральных данных об органических соединениях. В 1990 г. за работы по созданию принципов компьютерного дизайна органических соединений E.Corey получил Нобелевскую премию по химии [156].
Савицкий с соавторами использовали очень простые алгоритмы распознавания образов [157, 158], которые позволяли осуществлять прогноз только двойных соединений. Особенности алгоритмов [157, 158], обрабатывающих массивы целочисленных значений без пропусков в значениях, ограничили набор свойств элементов, используемых для описания двойных систем, только количеством электронов на электронных оболочках изолированных атомов. При переходе к более сложным соединениям: тройным, четверным и т.д. резко
16
возрастало время анализа данных и требовался большой объем оперативной памяти ЭВМ. Вычислительная машина «Минск-22», используемая группой Савицкого, не обеспечивала такие возможности, поэтому все пионерские работы по конструированию неорганических фаз с применением алгоритма [157, 158] ограничились прогнозом двойных соединений, причем классифицирующие правила включали только информацию об электронном строении изолированных атомов. К сожалению, работы ИМЕТ по конструированию двойных соединений не получили дальнейшего развития в плане совершенствования программно-аппаратных средств, поэтому уже в начале восьмидесятые годов, после смерти Е.М.Савицкого, они были прекращены.
Исследования по компьютерному конструированию многокомпонентных соединений, изложенные в настоящей диссертации, были начаты нами в начале 70-х годов в Московском университете и были основаны на другом подходе к анализу химических данных [67, 89, 159]. Было протестировано множество алгоритмов распознавания образов и проанализированы недостатки применяемого в ИМЕТ подхода. На основе этого было предложено использовать при анализе данных ассоциативные сетевые структуры, ускоряющие поиск классифицирующих закономерностей в больших информационных массивах и уменьшающие объем оперативной памяти ЭВМ для их обработки. Поиск существующих к тому времени программ обучения ЭВМ, которые использовали ассоциативные структуры для хранения данных, привел в Институт кибернетики АН Украины, где уже была разработана первая версия программной системы «Анализатор» для ЭВМ БЭСМ-6 [160]. В этой системе для хранения информации применялся особый тип ассоциативных структур - растущие пирамидальные сети, предложенные В.П.Гладуном [160]. Уже первые эксперименты по использованию системы «Анализатор» для прогноза возможности образования тройных соединений [159] показали, что она является эффективным инструментом для решения задач конструирования сложных соединений. При ее использовании снимались ограничения на компонентность соединений и стал возможным поиск многомерных классифицирующих закономерностей, вклю-
17
чающих любые свойства химических элементов и/или простых соединений, имеющие качественные (нечисловые), целые, действительные и т.д. значения, а также пропуски в значениях. Как показал тридцатилетний опыт работы с программными комплексами, основанными на растущих пирамидальных сетях, эти системы являются эффективными для применения в химии твердого тела. Предложенный подход, использующий сетевые ассоциативные структуры данных, получил большое распространение при конструировании неорганических веществ и стал уже обязательным атрибутом любой современной работы по применению искусственного интеллекта в химии и материаловедении [63-66, 161-163].
Изложенные в диссертации работы по компьютерному конструированию сложных неорганических соединений, начатые нами в МГУ [ 67, 89, 159 ]> в 1976 г. были продолжены в ИМЕТ под руководством Е.М.Савицкого [67, 80, 87, 88, 90-92, 94-98, 106, 116, 120, 122-126, 138]. Программное обеспечение этих работ осуществлялось силами большой группы высококвалифицированных исследователей Института кибернетики (ИК) АН Украины [160, 164, 165]. Исследования, проводимые в ИМЕТ, позволяли совершенствовать разрабатываемые в ИК системы, а самые последние версии систем искусственного интеллекта обеспечивали прогресс работ по компьютерному конструированию неорганических веществ.
С самого начала исследований по компьютерному дизайну неорганических фаз стало ясно, что для получения качественных результатов необходима разработка и использование баз данных (БД) по свойствам неорганических соединений. Поэтому в настоящей работе изложены результаты разработки БД по неорганическим веществам к материалам. В конце восьмидесятых годов была разработана концепция информационно-прогнозирующих систем, предназначенных для поиска информации об уже известных соединениях и прогноза еще неполученных фаз [14]. Разработка таких систем позже начата в разных странах [46, 166]. Кроме того, опыт создания БД по свойствам неорганических соединений позволил разработать в рамках Государственной научно-технической про- |