Введение.
В современном мире ежедневно вводятся с бумаги, заполняются на экранах компьютеров, обрабатываются различным образом и выводятся на бумагу миллиарды различных форм документов: почтовых карточек, платежных поручений, таможенных или налоговых деклараций, банковских чеков, бюллетеней для голосования, разного рода бумажных и электронных анкет, заказов на товары или услуги в электронных магазинах, разных отчетов и множество других. Вводя формы, сотни тысяч операторов выполняют однообразную последовательность действий: бросают взгляд на очередную страницу, находят, и читают текст заполнения, и быстро набирают его на клавиатуре. Как альтернатива ручному вводу существуют технологии автоматизированного ввода форм. Существуют и активно используются тысячи различных систем электронного документооборота, базирующихся на понятии «форма», эти системы применяются практически во всех сферах деятельности.
Все активнее просматривается тенденция к объединению систем бумажного и электронного документооборота в единые комплексные системы, в которых идет оборот как бумажных, так и электронных документов. В эти системы интегрируются системы ввода/вывода бумажных документов и системы ввода/вывода электронных документов. Примером таких систем могут быть системы проведения социологических опросов, которые проводятся одновременно как посредством электронных форм, так и с помощью обычных бумажных анкет. Например, форма анкеты опроса, размещенная в глобальной сети, разосланная по электронной почте и напечатанная на бумаге, по сути, это одинаковые формы, содержащие одни и те же вопросы; их отличие заключено в способе представления и частично в способе взаимодействия с пользователем. Без единой модели формы необходимо, в лучшем случае, создать два описания (в некоторых случаях три) - описание электронных документов для глобальной сети и для распознавания бумажных документов, при этом большая часть спецификаций (модель данных, правила проверки и заполнения) будет дублироваться. При этом необходимо будет воспользоваться несколькими различными системами описания формы и языками программирования для создания этих форм. После чего еще необходимо будет реализовать обработку различных заполнений этих форм, используя разные средства разработки. Актуальной задачей построения таких комплексных систем документооборота является построение единого подхода к форме во всех ее проявлениях и создание модели формы, позволяющей описывать форму, как минимум, в трех представлениях.
В данный момент в мире активно происходит переход от бумажных форм к электронным или экранным формам, при этом сохраняется и оборот бумажных форм. Большую роль в обеспечении такого перехода и в функционировании таких смешанных систем играют системы автоматического ввода заполненных бумажных форм, предоставляющие альтернативу ручному вводу. Такие технологии обладают рядом явных преимуществ: современные модели сканеров могут вводить до 200 страниц в минуту, программы оптического распознавания текста "читают" несколько сотен символов в секунду и могут делать это без перерыва на обед. Помимо выигрыша в стоимости и качестве ввода, технологии сканирования и распознавания документов имеют и другое существенное преимущество: корректно идентифицированный поток документов, включающий распознанную информацию и графические образы, может составлять основу электронного архива, представляющего функции быстрого поиска документа, извлечения, пересылки и печати графического образа документа (по качеству аналогичной ксерокопии документа). Развитие глобальных компьютерных сетей и возможность организации удаленного доступа к таким архивам подчеркивают это технологическое преимущество, постепенно выдвигают его на первый план.
Таким образом, разработка систем массового ввода стандартизированных форм документов представляется актуальной задачей. Эти технологии опираются на достижения в обработке изображений и в распознавании двух самостоятельных, быстро развивающихся областях искусственного интеллекта. Однако в этих технологиях две задачи связаны не столько с распознаванием, сколько с процессами его окружающими. Об одной из этих задач уже говорилось, это использование в распознавании и интерпретации его результатов той же информации, что и при заполнении экранных форм и печати их на бумагу.
Другая важная задача, определяющая, наряду с качеством распознавания, эффективность системы ввода, выявление необходимости ручного контроля результатов распознавания, иначе говоря, автоматическое определение достоверности результатов распознавания, того или иного объекта без помощи человека.
Предметом данной работы является анализ и изучение систем работы с формами, выявление общности, обеспечивающей конструктивную основу для решения задач ввода/вывода, и распознавания структурированных документов в рамках систем документооборота стандартных форм, и построение методов оценки достоверности результатов распознавания. В рамках работы проводится исследование и разработка методологических основ, а также конкретных моделей, методов и средств для решения задач:
• моделирования структурированного документа с точки зрения различных задач
ввода/вывода и распознавания,
• автоматизации разработки шаблона документа (экземпляра модели структурированного документа определенного типа),
• автоматического определения достоверности результатов распознавания полей структурированных документов в задачах ввода стандартных форм.
Целью данной работы является построение концептуальной модели формы, которая бы позволяла органично связать и описать основные процессы ввода/вывода структурированных документов и построение методов автоматического определения достоверности результатов распознавания полей структурированных документов в рамках разработанной концепции документа.
Задача состоит в построении концептуальной модели, которая позволяла бы описать форму в процессах:
• ввода/вывода электронных форм на дисплей монитора,
• автоматического распознавания форм,
• вывода форм на бумагу.
Новизна предложенного в работе подхода состоит, прежде всего, в разработке универсальной модели формы структурированного документа, используемой для различных задач и абстрагированной от конкретных методов обработки, в отличие от существующих подходов, как правило, ориентированных на представление либо экранных, либо бумажных форм; впервые модель объединяет процессы ввода/вывода вне зависимости от того, экранная или бумажная форма используется в них. Независимость модели от особенностей конкретных методов обработки обеспечивает ее открытость для разработки и подключения новых методов, расширение классов обрабатываемых документов в рамках предложенной концепции. Кроме того, предложены новые подходы к реализации критериев достоверности результатов распознавания полей структурированных документов при использовании распознающих схем с оценкой, не имеющей вероятностного характера.
По теме диссертации опубликовано пять работ, две из них в соавторстве.
6
Глава 1. Обзор существующих моделей форм и методов определения достоверности распознавания.
1.1. Обзор существующих моделей форм.
В данном разделе мы вкратце рассмотрим ряд моделей форм документов, разработанных и применяемых для решения различных задач ввода/вывода и обработки документов, а именно:
• модели визуализации структурированных документов на бумажных носителях,
• модели идентификации и распознавания структурированных документов,
• модели визуализации структурированных документов на дисплее компьютера,
• комбинированные модели,
а потом дадим обзор наиболее распространенных форматов и моделей представления структурированных документов в мире.
1.1.1. Модели вывода структурированных данных.
Теоретические основы построения модели отображаемого на бумагу электронного документа и классификация основных приемов визуализации сложноструктурированных данных представлены в работах Н.Е. Емельянова и его учеников, например: [Еме87], [Еме88], [ESS96], [ЕССОО], [БЕОЗ]. В рамках данной теории под документом понимается структурированный текст как совокупность взаимосвязанных семантических блоков (некоторых фрагментов документа, выделенных по смысловому содержанию). Особая роль отводится блокам специального типа - заголовкам. Выделяются геометрические связи над блоками — бинарные отношения «быть заголовком блока», «быть заголовком горизонтали блока», «быть заголовком вертикали блока», «быть вложенным в блок». На введенных отношениях постулируется ряд свойств структурированного документа: множество блоков и отношение «быть вложенным в блок» образуют лес (конечное множество непересекающихся деревьев); вложенность блока А в блок В влечет вложенность заголовков блока А в блок В. На основе введенных понятий классифицируются способы визуального представления структурированных данных: последовательности, иерархии, таблицы и смешанного представления. Для описания модели используется специальный язык и имеется специальный программный инструментарий.
В 2001 году организация W3C завершила разработку и приняла стандарт XSL [XSL01] или XSL-FO, описывающий модель вывода XML3 документов [XML04] на различные устройства, т.е. как и предыдущая модель позволяет представлять документ не только на бумаге, хотя в основном ориентирована на бумагу. Модель, реализуемая в данном стандарте, по структуре и подходу во многом схожа с моделью, представленной в работах Н.Е. Емельянова и фактически является ее логическим развитием. Стандарт описывает вывод документа как последовательность двух процессов — «трансформация дерева документа» и «форматирование». «Трансформация дерева документа» позволяет переработать дерево документа, добавив к нему такие понятия, как оглавление, и преобразовать данные в табличные структуры. После трансформации исходного дерева документов проводится «форматирование» — генерация дерева геометрических областей, называемого деревом областей. Геометрические области позиционированы в последовательности из одной или нескольких страниц (браузер обычно использует единую страницу). Каждая геометрическая область имеет позицию на странице, спецификацию того, что отображать в этой области, и может иметь фон, заполнение и рамку. Например, форматирование одиночного символа генерирует область достаточно широкую для того, чтобы вместить «глиф»4, используемый для визуального представления символа, и «глиф» этот отображается в данной области. Эти области могут вкладываться. Например, «глиф» может быть позиционирован в строке, в блоке, на странице. При отображении берётся дерево областей, абстрактная модель представления (в терминах страницы и коллекции её областей) и производится вывод на определённый носитель, такой, как окно браузера, на экране дисплея компьютера или лист бумаги. Для блоков в этом стандарте введены отношения «вложенности», «внутренних» и «внешних» стыков и порядка следования; все эти отношения позволяют описывать достаточно большой класс документов, но, как показала практика, полная реализация этого стандарта достаточно сложна — достаточно мало известных реализаций как дизайнеров модели вывода, так и обработчиков таких моделей. Для описания модели используется специальный язык, являющийся диалектом XML.
1.1.2. Обзор моделей идентификации и распознавания бумажных структурированных документов.
Основная часть методов описания распознавания структурированных документов может быть разделена на три группы по методам идентификации документа:
1 World Wide Web Consortium (www.w3c.org)
2 Extensible Stylesheet Language - Расширяемый Язык Таблиц Стилей
3 Extensible Markup Language - Расширяемый Язык Разметки
4 Глиф - графический образ символа.
1) методы описания формы документа и его идентификации на основе линий разграфки,
2) методы и модели описания форм документов табличного вида,
3) методы и модели описания и идентификации нежестко определенных форм документов.
Методы и модели первого класса, относятся модели, описанные в работах [Пос98], [LJS95], [CFM92]. В этих работах авторы представляют те или иные алгоритмы и модели, базирующиеся на идентификации формы документов на основе определения конфигураций горизонтальным и вертикальных линий разграфки. В качестве основных признаков авторы используют расположение линий, их длину, пересечения и взаимное расположение.
Многие работы по идентификации форм посвящены подклассу форм, имеющему вид таблиц с частично объединенными ячейками - будем говорить про них «форм табличного вида». В работе [WLS95] авторы представляют структуру формы деревом (точнее, комбинацией деревьев локальных и глобальных свойств, которые можно объединить в одно дерево), вершины которого кодируют операции повторения блоков, а также горизонтальное и вертикальное деление ячеек на подчиненные ячейки. Алгоритм идентификации пытается отобразить объединенное дерево ячеек шаблонов на ячейки, выделенные на графическом образе, в процессе построения отображения фрагментов обрабатываемого образа одновременно рассчитывает гипотезы соответствия фрагментов образа элементам того или иного шаблона. Работа [SA96] Shimotsuji и Asano также посвящена идентификации форм табличного вида. Авторы строят алгоритм отождествления на основе выделенных на образе табличной формы ячеек. Авторы свели задачу идентификации типа формы к поиску соответствия между наборами точек на двух изображениях - фундаментальной проблеме в распознавании образов.
В работе [CGM+98] демонстрируется система Informys, ориентированная на обработку форм с нежестко фиксированной геометрией. В системе выделяются линии разграфки, логотипы, заголовки полей и значения полей. Перечисленные типы объектов представлены узлами размеченных графов, дуги которых соответствуют относительным положениям (позициям), связанных между собой объектов (например заголовка поля и его значения). Расположение поля может быть идентифицировано не только, если оно находится в фиксированном местоположении, но и за счет вычисления позиции относительно фиксированного (обнаруженного на графическом образе) и связанного с искомым объекта либо по относительному расположению к двум еще не фиксированным объектам. Опорные объекты - заголовки и логотипы - распознаются нейронными сетями. На этапе идеи-
тификации текст распознается алгоритмами полнословного распознавания и соотнесения с множеством статических слов шаблона. Описание формы документа в системе производится в специальной интерактивной программе.
В работах [Пос98а], [Пос99], [Пос99а] описывается другой подход к построению модели документа и набора алгоритмов и методов распознавания. Автор предлагает рассматривать документ в виде дерева блоков и их отношений, во многом аналогично модели Н.Е. Емельянова, и далее, базируясь на таком представлении, строятся методы и алгоритмы распознавания документа аналогично [CGM+98] — в системе вьщеляются объекты — заголовки полей, поля, метки, логотипы, линии и т.д. На множестве объектов строится дерево декомпозиции документа, по которому производится выделение полей и их дальнейшее распознавание. Кроме того, автор описывает схему работы системы распознавания и отдельные методы обработки изображения. В этой работе также описывается система распознавания, построенная с использованием этих моделей и алгоритмов. Описание формы документа производится специализированной интерактивной программой.
1.1.3. Анализ средств разработки экранных форм документов.
В работе [РомОО] дан анализ самой постановки задачи разработки форм документов. Анализируются и вьщеляются основные составляющие экранной формы и проводится сравнительный анализ четырех средств разработки экранных форм. Автор оперирует следующими основными понятиями: реквизит — свойство документа или его данное; форма - наглядное изображение всех свойств; поле - изображение реквизита; описание формы - свойства элементов формы и их расположение и сценарий — программа, которой подчиняются элементы формы в процессе взаимодействия с пользователем. Далее автор производит анализ четырех наборов инструментария: MAPI5 [KT97], Outlook6 [БиОЗ], Visual Basic7 [КУ99], C++8 [Ст95], иллюстрируя основные достоинства и недостатки инструментария таблицей 1-1.
Критерии Средства разработки форм
MAPI Outlook Visual Basic C++
Удобство разработки интерфейса формы - + + +
Удобство отладки сценария формы - - + +
Наличие встроенных средств разработки графи- - + + +
5 MAPI-(Messaging API) - стандарт, который позволяет Windows-приложениям реализовывать почтовые функции. Outlook - почтовый клиент входит в состав Microsoft Office.
7 Visual Basic - среда и язык программирования разработанная компанией Microsoft.
8 C++ - распространенный язык программирования высокого уровня, наследник языка Си.
10
ческого пользовательского интерфейса формы
Наличие встроенных средств разработки сценария формы + + +
Возможность повторного использования форм + + + +
Возможность разработки специальных элементов управления для форм + +
Возможность формировать вид формы в процессе выполнения программы + +
Гибкость используемого языка программирования + -/+ +
Быстрая разработка - + + -
Таблица 1-1. Сравнение инструментария разработки форм.
На основании анализа автор делает следующий вывод для решения относительно простых задач эффективней использование Visual Basic, для решения сложных комплексных задач автор рекомендует использовать C++.
1.1.4. Обзор наиболее распространенных в мире форматов/моделей представления форм документов.
Далее мы приведем обзор наиболее распространенных и перспективных форматов/моделей представления форм документов в мире: Adobe PDF, HTML, W3C XForms. Эти форматы позволяют описывать электронные и бумажные формы структурированных документов. Далее проведем анализ этих форматов по критериям, аналогичным описанных в таблице, дополнив их несколькими дополнительными критериями.
1.1.4.1. Общий анализ Adobe PDF.
Открытый формат PDF (Portable Document Format) версии 1.4 разработан и опубликован американской компанией Adobe в 2000 [PDF00], придя на смену менее совершенному формату версии 1.3. Формат разрабатывался и является базовым форматом для семейства продуктов Adobe Acrobat. Основной целью разработки, достаточно эффективно реализованной, было создание формата документа, позволяющего пользователям создавать, просматривать, печатать, заполнять и обмениваться документами вне зависимости от способа и места создания и программно-аппаратных средств используемых пользователем. В основе PDF лежит аппаратно-независимая модель описания содержимого страниц, схожая с моделью языка PostScript, приведенная в [APS00]. Кроме того, в формате присутствует богатый язык описания аннотаций, полей формы и других объектов, который
11
используются для создания интерактивного содержания страниц, которые, хотя и не используются при печати документа, значительно расширяют возможности для интерактивного взаимодействия пользователя с содержимым документа и упрощают построение документооборота. В последней версии формата появилась спецификация, описывающая правила создания документов оптимальных для обработки на PDA9 и правила включения в состав документов XML объектов, а с версии 1.3 в нем содержится спецификация правил создания документов, оптимизированных для обработки в глобальных информационных сетях. А поддержка интерпретируемого языка JavaScript 1.2 [JS99] и собственного богатого языка формул и вычислений дает пользователю возможность создавать сложные интерактивные документы и даже простые системы документооборота. Кроме того, изначально в формате большое внимание уделялось вопросам безопасности информации, и в данный момент формат предусматривает возможность использования ЭЦП10 и шифрования любой части документа.
С точки зрения логического устройства документ в формате PDF есть набор обязательных и необязательных структур, описывающих документ, дерево страниц документа, каталог полей формы документа, потоки отображения документа и полей ввода, аннотации и т.д. Поля ввода организованы в дерево с наследованием атрибутов. Кроме того, что немаловажно, допускается использование ссылок, в том числе и на внешние объекты и структуры.
В данный момент формат получил значительное распространение и занимает второе место в мире после HTML, среди форматов представления форм. Об использовании этого формата как внутреннего формата представления документа информация отрывчатая и не подтвержденная, точно известно только про использование его семейством программ Adobe Acrobat.
С точки зрения физического устройства документ представляет собой текстовый файл с внедренными бинарными частями и возможностью произвольного доступа. Для обеспечения такой, достаточно странной, но в некоторых случаях весьма эффективной комбинации, в любом файле формата должны содержаться две специального вида структуры. Заголовок, содержащий описание документа, и таблица ссылок, содержащая точный битовый адрес всех объектов данного документа. Что немаловажно, имеется возможность оптимизации структуры документа для передачи его в сетях с низкой пропускной способностью.
9 PDA - Personal Digital Assistant - Компактный (карманный) персональный компьютер, выполняющий функции записной книжки и органайзера.
10 ЭЦП — Электронно-цифровая подпись.
12
К недостаткам формата можно отнести: отсутствие явно выделенной модели содержания формы, крайне высокую сложность, как самого формата, так и внедрения в него модели распознавания, отсутствие простой поддержки русского языка, отсутствие возможности описания динамических форм, отсутствие описания механизмов ЭЦП и шифрования и невозможность смены алгоритмов, несколько искусственную поддержку взаимодействия с пользователем. Кроме того, в описании формата отсутствует однозначный ответ на вопрос о возможности использования русского языка для активных элементов форм и подпрограмм на JavaScript. Также важным недостатком является практическая неприменимость в сфере распознавания как модели распознаваемого документа.
Ввиду вышеперечисленных достоинств и недостатков, а также на основе проведенного анализа и серии опытов наиболее эффективным использование формата PDF видится в качестве одного из финальных форматов систем документооборота. Использование формата в качестве внутреннего формата или базового формата систем документооборота и систем автоматизированного ввода не рекомендуется.
1.1.4.2. Общий анализ HTML.
HTML-формы - это средство сбора информации через Web, поддержанное стандартом HTML, начиная с версии 2.0, утвержденной в сентябре 1995 года консорциумом W3C. В данный момент развитие этого формата остановлено, и последняя официальная версия 4.01 [НТМ99].
HTML-форма внедряется в HTML документ и может содержать такие элементы управления, как кнопки, переключатели, поля для ввода текста и т.п. Все эти элементы можно использовать, для того чтобы посетитель страницы мог отправить информацию на сервер.
Изначально формы предназначались только для отправки информации, введенной пользователем на обработку сервером. Однако их часто используют совместно с JavaScript, например для организации и (или) настройки пользовательского интерфейса на динамических страницах WWW11. Описание HTML формы может быть создано с помощью любого редактора HTML документов и даже, при наличии соответствующей квалификации, с помощью простейшего текстового редактора. В качестве процессора Web форм может выступать любой Интернет-браузер.
Логически HTML-форма представляет собой набор именованных полей, представленных на экране интерактивными элементами для ввода данных. Заполненная форма отправляется на сервер в виде набора пар поле-значение. Логически поля могут был. орга-
1' WWW - World Wide Web («Всемирная Глобальная Паутина») - глобальная сеть Интерет.
13
низованы в группы, но эта информация не используется браузерами при отправке данных, но используется при отображении формы - сгруппированные поля обводятся рамкой. HTML-форма всегда является частью HTML документа.
Статическая часть HTML-формы описывается средствами HTML, т.е. может включать в себя форматированный текст, изображения и т.п. Интерактивные элементы HTML-формы описываются тэгом INPUT, в атрибуте TYPE указывается тип элемента, например поле ввода текста, выпадающий список или кнопка. Дополнительные атрибуты поля ввода также описываются атрибутами тэга INPUT. Кроме полей ввода на форме могут присутствовать кнопки, служащие для вызова некоторых функций, например из скрипта. Существуют кнопки специального назначения, например для отправки данных на сервер используется кнопка, называемая Submit, а для очистки данных в форме используется кнопка Reset. Для логической группировки полей формы используется тэг FIELDSET. Более подробно с физическим и логическим устройством HTML формы можно познакомится в работах [КорОО],[Кир99].
В связи с распространением Internet и повсеместным внедрением сетевых технологий и простотой разработки, HTML-формы являются в настоящее время самым распространенным средством сбора информации через глобальные и локальные сети.
К недостаткам HTML необходимо отнести отсутствие модели содержания, сложность полной поддержки формата (сделать систему, понимающую и правильно интерпретирующую любой HTML достаточно трудоемкая задача) и его ориентированность в первую очередь на экранное представление формы.
Ввиду вышеперечисленных достоинств и недостатков, а также на основе проведенного анализа и серии опытов, наиболее эффективным использование формата HTML видится в качестве одного из возможных форматов представления формы в WWW. Использование формата в качестве внутреннего или базового формата систем документооборота и массового ввода не рекомендуется.
1.1.4.3. Общий анализ XForms.
Формат XForms [XF03] уже несколько лет разрабатывается консорциумом W3C в качестве наследника HTML в части представления форм и для перевода его на язык XML структур. Изначально рабочая группа, разрабатывающая XForms входила в HTML Working Group12, а в определенный момент выделилась в отдельную рабочую группу, какой сейчас и является. Формат изначально разрабатывался как язык описания форм, не зависимый от программно-аппаратного обеспечения, с разделением модели содержания от
12 HTML Working Group - рабочая группа консорциума W3C
14
модели представления. Этим он значительно отличается от PDF и HTML, куда формы были привнесены уже после выхода нескольких версий форматов. Кроме того, в концепцию XForms изначально заложили разделение модели содержания, сценария взаимодействия и визуального представления, что отсутствует в других форматах.
Язык XForms описывает модель данных формы и сценарий взаимодействия пользователя с формой. Для описания модели данных используется язык XSD [XMS01] с расширениями специфическими для формы и язык XPath [XMP99] для описания путей получения/отсылки данных и описания некоторых ограничений. Для описания сценария взаимодействия используется свой диалект XML, описывающий основные типа взаимодействий - ввод, вывод, выбор и т.д., события формы, привязку данных и объектов взаимодействия. Не очень понятен выбор языка XPath, а не XQuery [XQ03] - что дало бы дополнительные преимущества. Визуализация не входит в язык, и предлагается использовать специально разработанные языки определения визуального представления формы или разработать свой, например, описанный выше XSL-FO или другие подобные языки.
XForms является синтаксически строгим языком, с возможностью встраивания его в другие разновидности XML языков, что позволяет строить на его основе сколь угодно сложные языки описания собственной разработки. При этом существует возможность задать, какие расширения являются обязательными для нормального понимания конкретной формы. Поддержка возможности задания элементов в виде ссылок на внешние объекты, URI13 [UUU01], дает возможность как строить формы на базе уже разработанных кем-либо объектов, так и создавать свои стандартные библиотеки объектов.
С точки зрения логического устройства, документ в формате XForms есть набор моделей форм и сценария взаимодействия с пользователем. К этому может прилагаться схема XSD документа. Основными структурными элементами XForms являются: model — модель формы, instance — значения по умолчанию, submission — как и куда посылать данные формы, bind - модель связи элемента данных с элементом пользовательского интерфейса. Модель формы древообразная, позволяет описывать структуры, массивы и несоставные элементы. Свойство релевантности и возможность задания его значения как некоторой функции от данных формы позволяет строить весьма сложные модели формы. В качестве элементов ввода/вывода взяты абстрактные типы взаимодействия, показанные в таблице 1-2, при этом способ отображения этих объектов точно не специфицируется.
Элемент ввода/вывода Комментарии
input абстрактный объект ввода
13 URI - Универсальный идентификатор ресурсов
15
secret абстрактный объект ввода секретных данных
textarea абстрактный объект множественного ввода (например тело письма)
output абстрактный объект вывода
upload абстрактный объект загрузки данных из локальной файловой системы на сервер
range абстрактный объект ввода из диапазона
trigger абстрактный триггер (например кнопка)
submit процедура передачи всех или части данных на сервер
select абстрактный объект выбора (множественного)
selectl абстрактный объект выбора (единственного)
choices абстрактный объект выбора аналог optgroup в HTML
item объект выбора
filename имя файла
mediatvpe выбор типа данных
value значение выбранного объекта
label метка
help помощь
hint подсказка
Таблица 1-2. Элементы ввода/вывода XForms. С точки зрения физического устройства форма может являться:
1) частью, какого либо XML диалекта, например XHTML;
2) самостоятельным файлом в формате XML;
3) набором файлов как-то расположенных в сети.
Такое разнообразие физического устройства, с одной стороны, позволяет строить гибкие системы, где форма собирается из стандартных блоков «на лету», с другой стороны, порождает сложности в реализации процессоров таких форм.
В данный момент разработка языка окончена, но поддержка его индустрией в том виде, котором он есть, незначительная. Но необходимо отметить, что большинство крупнейших компаний в отрасли (IBM, Oracle, AOL, Xerox) и множество средних и малых фирм и организаций уже сейчас активно объявили или объявляют о всемерной поддержке данного формата в своих будущих или в ближайших версиях продуктов. Кроме того, активное участие в разработке принимает Японский оператор сотовых сетей NTT DoCoMo и крупный производитель мобильных устройств SonyEricsson, что позволяет надеяться на поддержку мобильными устройствами этого языка. По прогнозам, этот язык описания
16
форм может полностью заменить язык описания форм, являющийся частью HTML. Более подробно о перспективах этого формата можно прочитать в работах [RT02],[Kh00], [HV01].
Основными недостатками XForms являются: отсутствие модели распознавания документа, отсутствие встроенного языка программирования, некоторые искусственности в модели ввода/вывода (например наличие select и select 1), жесткая типизация данных на всех этапах, что осложняет привнесение в модель структур необходимых для распознавания.
Ввиду вышеперечисленных достоинств и недостатков, а также на основе проведенного анализа, XForms видится в качестве возможного базового формата электронного документооборота или как базис для построения нового формата для гибридных систем документооборота.
1.1.4.5. Сводный анализ Adobe PDF, W3C HTML и W3C XForms.
В таблице 1-3 приведен сводный анализ выше рассмотренных форматов и видны основные достоинства и недостатки каждого формата. Кроме того видно, что ни один формат не удовлетворяет всем критериям.
Критерии Формат
Adobe PDF 1.4 W3C HTML W3C XForms
Наличие удобных общедоступных средств разработки интерфейса формы + +
Удобство отладки сценария формы + +/- -
Наличие четкого разделения модели содержания, модели взаимодействия и модели визуализации +
Аппаратная и платформенная независимость + + +
Языковая независимость - + +
Наличие встроенных средств разработки сценария формы + + -/+
Возможность повторного использования форм + + +
Возможность разработки специальных элементов управления для форм -/+ + +
Возможность формировать вид формы в про- - -/+ +
17 |