DisCollection.ru

Авторефераты и темы диссертаций

Поступления 20.06.2008

Материалы

загрузка...

Математическое и программное обеспечение структурной и семантической интероперабельности информационных систем на основе метамоделей

Михайлов Илья Сергеевич, 20.06.2008

 

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, её научная новизна и практическая значимость, сформулирована цель работы и приведено краткое содержание диссертации по главам.

В первой главе рассматриваются понятия интеграции и интероперабельности информационных ресурсов. В большинстве энциклопедических источников понятие интероперабельности определяется, как способность информационных ресурсов к совместному использованию, совместной деятельности для решения задач. Под интероперабельностью ИС понимается её способность взаимодействовать с другими ИС. Такое взаимодействие может выражаться в виде обмена данными, распределенного выполнения поисковых запросов, согласованного изменения баз данных (БД) и т.д.. Выделяется два аспекта интероперабельности: структурный и семантический. Структурный аспект интероперабельности систем означает способность к структурному согласованию сущностей систем. Семантический аспект означает возможность установления соответствия между смыслами единиц информационных систем.

Показана необходимость выполнения свойства интероперабельности для успешной интеграции информационных систем.

Формулируются проблемы, возникающие при интеграции информационных

Во-первых, необходимость обеспечения систематизации и структуризации исходной информации. Информация, хранящаяся по частям в различных системах, может частично дублироваться или иметь пробелы.

Во-вторых, максимальная унификация доступа к гетерогенным информационным

В третьих, создание нового информационно-технологического пласта, обеспечивающего интеграцию всех остальных систем, выполняющего роль диспетчера в ИТ-инфраструктуре компании.

Проведено исследование проблем связанных с интеграцией информационных систем, выявлены их причины и способы преодоления указанных трудностей.

Проведённый анализ подходов к интеграции информационных систем показал, что наиболее перспективным является подход, предполагающий применение метаданных в качестве базиса интеграции ИС. Учитывая сложность поставленной задачи, сделан вывод о том, что решение должно базироваться на использовании метаданных и базы общих знаний о предметной области.

Во второй главе исследуются языки, методы и модели представления знаний об информационных системах, предложен метод описания двухуровневой концептуальной модели информационных систем на основе схемы данных и онтологии предметной области. Рассмотрены методы описания метаданных и сделано обоснование для выбора конкретных методов в данной работе.

Вводится понятие онтологии предметной области, как точной (выраженной формальными средствами) спецификации концептуализации. Формальная модель онтологии представляет множество терминов предметной области (ПО), которую описывает онтология, множество отношений между терминами заданной ПО и функции интерпретации, заданные на терминах и/или отношениях онтологии. Обосновывается необходимость использования онтологического подхода для автоматизированного решения задачи интеграции информационных систем, как механизма создания непрерывного информационного поля.

Проводится классификация моделей и языков представления метаданных, на основе которой выделяется язык XML и модель RDF для описания метаданных информационных систем.

Показано, что для описания структуры информационных систем достаточно использование языка XML, как универсального синтаксиса, который лег в основу передачи информации между различными программами. Важным качеством указанного стандарта является его открытость и независимость от конкретных сфер применения. Таким образом, XML становится удобным средством для обеспечения синтаксической интероперабельности ИС. Однако при всех своих достоинствах XML не в состоянии адекватно справиться с задачей семантической интероперабельности. Основное ограничение XML состоит в том, что XML лишь описывает грамматику, и невозможно выделение семантических единиц в конкретной предметной области. Затем, XML является неоднозначным средством описания данных и позволяет одну и ту же информацию разметить различными способами. Также XML не подходит для задания метаданных по причине значимого порядка элементов.

Показано, что указанные проблемы могут быть решены, если для определения метаданных и правил преобразования данных при переходе от одной интегрируемой ИС к другой ИС использовать XML вместе с другой моделью данных, например, моделью семантической сети. Формально семантическую сеть можно определить при помощи модели RDF. В модели RDF имена концептов выбираются из определённого словаря концептов и определённого пространства имён, поэтому их представление более унифицировано, в отличие от XML разметки. Также, в семантической сети порядок элементов не важен, поскольку она представляет собой размеченный граф. Таким образом, совместное использование с технологией XML модели RDF позволит отразить семантику концептуальных моделей информационных систем, а также избежать изложенных ограничений XML.

Показано, что модель метаданных для ИС должна представлять собой двухуровневую систему: базовый - структурный уровень (технология XML), и опирающийся на него семантический уровень (модель RDF). Предложен метод описания метаданных для интегрируемых информационных систем. Он заключается в построении RDF-утверждений на основе информации, извлечённой из базы данных информационной системы, и онтологии предметной области. Данные утверждения описывают связи сущностей внутри ИС. В разработанном формате каждый концепт характеризуется своим уникальным идентификатором id (именем концепта) и типом type. Далее внутри описания концепта описываются ссылки на его концепты-потомки (rdf:subConceptOf), и на концепты-предки (rdf:hasSubConcept). Затем описываются концепты-атрибуты данного концепта. Также вводится поле “семантическая метка” (sv). В данном поле хранится описание концепта, указывающее соответствующее место концепта в онтологии предметной

Приводятся примеры использования разработанного формата для описания метаданных информационной системы Клуба Выпускников МЭИ.

В третьей главе, учитывая достоинства и недостатки проанализированных моделей, рассматривается разработка модели описания метаданных информационных систем и алгоритмов интеграции информационных систем.

Формальное описание разработанных концептуальных моделей информационных систем будет иметь следующий вид: S = (X, R),где: X = { Ci | i=1, 2, …, n } – непустое множество концептов (объектов предметной области), R = { Rj | j=1, 2, …, k } – семейство отношений на множестве X.

, где: N – имя концепта C (уникальное имя концепта в конкретной информационной системе), T – тип концепта C, SV – семантическая метка концепта C, P – множество предков концепта C, P = { Cl | l=1, 2, …, nl }, Ch – множество потомков концепта C, Ch = { Cm | l=1, 2, …, nm }, <A> – кортеж атрибутов концепта C.

, где: N – имя атрибута A, T – тип атрибута A, SV – семантическая метка атрибута A, K – ключ атрибута, V – значение атрибута.

X*At, At – множество атрибутов в рассматриваемой предметной области, At = { Aq | q=1, 2, …, nq}, С R2 Ai : Ai входит в <A>, где <A> – кортеж атрибутов концепта C.

[1,n], n – количество соответствующих элементов в концептуальной модели. Данная функция в качестве результата своей работы возвращает значение конкретного элемента модели, к которому она была применена.

Концептуальная модель каждой информационной системы строится из наборов утверждений, сформулированных в терминах разработанной модели. Построение единой метамодели осуществляется по аналогичным принципам. Для рассматриваемого в работе примера интеграции ИС ВУЗов описание концепта «Институт» будет выглядеть следующим образом:

<rdf:RDF rdf:parseType="Metadata" rdf:name="Institute Metadata">

<rdf:Description>

<rdf:concept id=”Institute” type="Entity" sv="Инcтитут">

<rdf:concept id="id_I" type="int" sv="Идентификатор" key="PK">

<rdf:concept id="Name_I" type="string" sv="Название института" key="">

</rdf:concept>

</rdf:Description>

Рассматривается процесс интеграции информационных систем. Пусть существуют две информационных системы ИС-А и ИС-В, функционирующие в рамках одной предметной области и необходимо провести интеграцию ИС-А и ИС-В. На рисунке 1 приводится схема разработанного процесса интеграции ИС. Задачей интеграции является обеспечение взаимодействия между ИС. Для этого необходимо определить соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования. С этой целью вначале из информационных систем извлекаются их схемы данных. Схема данных представляет структурную схему базы данных, систему типизированных связанных сущностей и их атрибутов. При помощи анализа схем данных в отдельности, возможно установление лишь структурной интероперабельности, то есть правил преобразования типов полей и сущностей ИС друг в друга.

Для обеспечения семантической интероперабельности, требуется понимание назначения элементов ИС. Поэтому необходимо использовать вторую составляющую часть метаданных – концептуальную модель предметной области. Концептуальная модель является надстройкой над схемой данных и задаёт систему связей между концептами предметной области, установленную в данной ИС.

Построение данной модели осуществляется при помощи онтологии предметной области. Онтология содержит словарь концептов ПО и хранит общую сеть связей между этими концептами. То есть каждая концептуальная модель является подмножеством онтологии ПО. Использование онтологии позволяет определять концептуальные модели в одних терминах и анализировать связи между их концептами. Для упрощения работы с онтологией предметной области были разработаны следующие простые функции, определённые на концептах онтологии: функция склеивания, функция разделения, функция преобразования. Данные функции определяют правила перехода от концептов нижнего уровня к концепту верхнего уровня и наоборот.

Далее на базе концептуальных моделей ИС-А и ИС-В осуществляется построение метамодели предметной области интегрируемых ИС. Данная метамодель объединяет и согласует в себе обе концептуальные модели. На этапе её построения также используется онтология. Метамодель определяет соответствия сущностей ИС-А сущностям ИС-В и правила их преобразования, что позволяет установить взаимодействие между указанными информационными системами.

Формально метамодель интегрируемых ИС определяется следующим образом: M = (S1 , S2 , Rs), где S1 – концептуальная модель ИС-А, S2 – концептуальная модель ИС-В, Rs – правила преобразования совокупностей концептов при их трансляции из ИС-А в ИС-В, построенные согласно рассматриваемому далее разработанному алгоритму интеграции ИС.

В результате, обеспечивается интероперабельность, а, следовательно, необходимый уровень интеграции информационных систем.

Таким образом, разработанный процесс интеграции информационных систем состоит из выполнения следующих алгоритмов:

1. Анализ сущностей баз данных, их атрибутов и отношений между ними. На данном этапе приложением осуществляется построение схем данных.

2. Анализ семантических меток сущностей и атрибутов. На данном этапе строятся концептуальные модели информационных систем. Для получения и анализа семантических меток используется онтология предметной области.