DisCollection.ru

Авторефераты и темы диссертаций


Представление предметной области «анализ изображений» в виде специализированного тезауруса

Трусова Юлия Олеговна, 09.02.2009

 

Трусова Юлия Олеговна

Представление предметной области

«Анализ изображений»

в виде специализированного тезауруса

Специальность 05.13.17 – «Теоретические основы информатики»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Москва 2009

Работа выполнена в Учреждении Российской академии наук Вычислительный центр им. А.А. Дородницына РАН

Научный руководитель: кандидат физико-математических наук, с.н.с. И.Б.

Официальные оппоненты: доктор технических наук,

профессор Ю.Г. Васин

кандидат физико-математических наук, с.н.с. К.В. Воронцов

Ведущая организация: Институт математики им. С.Л. Соболева Сибирского отделения HYPERLINK "http://isir.ras.ru/win/htm/index.html" Российской академии наук

Защита состоится 14 мая 2009 г. в 15 часов на заседании диссертационного совета Д002.017.02 Учреждения Российской академии наук Вычислительный центр им. А.А. Дородницына РАН по адресу: 119333, Москва, ул. Вавилова,

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Вычислительный центр им. А.А. Дородницына РАН.

Автореферат разослан 13 апреля 2009г.

Ученый секретарь

диссертационного совета

доктор физико-математических наук

профессор В.В. Рязанов

Общая характеристика работы

Актуальность темы

Одной из фундаментальных проблем информатики является проблема обработки, анализа, оценивания и понимания информации, представленной в виде изображений. Изображения являются одним из основных средств представления информации в научных исследованиях, медицине, экологии и

Важным направлением ориентированных фундаментальных и прикладных исследований является разработка автоматизированных систем обработки, анализа, оценивания и понимания изображений. Необходимыми предпосылками создания таких систем являются автоматизация: а) выбора метода решения предъявленной задачи; б) выдачи рекомендаций по выбору метода решения для класса задач, к которому относится предъявленная задача; в) синтеза алгоритмических процедур решения предъявленной задачи; г) выдачи рекомендаций по синтезу алгоритмических процедур решения предъявленной

Необходимым условием достижения указанных целей является систематизация, структуризация и, в некотором смысле, формализация знаний в области обработки, анализа и распознавания изображений. Известно, что одним их эффективных способов представления знаний являются онтологии предметных областей. Онтологии служат для явного формального машинно-интерпретируемого описания семантики данных некоторой области знания и являются подходящим инструментом для представления знаний, используемых для извлечения информации из изображений. Необходимым начальным шагом на пути к созданию онтологии является разработка тезауруса предметной области как логико-понятийной основы этой онтологии. В этом смысле тезаурус должен быть специализированным, т.е. являться средством представления современного состояния рассматриваемой области знания, включать все основные понятия и фиксировать существующие связи между этими понятиями - представлять знания и понятийную структуру соответствующей предметной области.

Диссертационная работа посвящена построению формализованного представления предметной области «Анализ и оценивание информации, представленной в виде изображений». В качестве основных разделов данной предметной области обычно выделяют обработку, анализ, распознавание и понимание изображений, причем для ее определения обычно используется обобщенный термин «Анализ изображений». В качестве способа формализации выбрано построение тезаурусного представления онтологии предметной области, т.е. создание специализированного тезауруса по анализу изображений.

Анализ изображений является чрезвычайно быстро развивающимся разделом информатики, в связи с чем его понятийная структура динамично изменяется. С другой стороны, эффективность исследований в области анализа изображений и решения прикладных задач анализа изображений в существенной степени зависят от стандартизации и формализации используемых описаний как собственно изображений, так и описаний методов их обработки, анализа и распознавания. Тезаурусное представление области анализа изображений можно использовать в качестве инструмента указанных стандартизации и формализации, а также обеспечения доступа квалифицированных и неквалифицированных пользователей, решающих задачи анализа изображений, к знаниям по анализу изображений, в том числе, например, с помощью создания соответствующих интернет-ресурсов. Существенным при этом является то обстоятельство, что тезаурус по анализу изображений и построенная на его основе онтология позволят использовать удобные и эффективные процедуры доступа к стандартизированным и структурированным представлениям этих знаний.

Таким образом, актуальной задачей является построение тезауруса по анализу изображений, необходимого для логической формализации данной предметной области, стандартизации понятийного аппарата, построения общих и частных онтологий предметной области и на этой основе автоматизации обработки, анализа, оценивания и распознавания изображений; для построения баз знаний по анализу изображений; для организации эффективного поиска и навигации в базах знаний по анализу изображений и для построения баз данных изображений.

Анализ литературы и личный опыт участия в ведущих международных конференциях по данной тематике показал, что специализированный тезаурус в области обработки, анализа, понимания и распознавания изображений в настоящее время отсутствует.

Цели и задачи диссертационной работы

Целью диссертационной работы является построение формализованного представления предметной области «Анализ изображений» в виде специализированного тезауруса по анализу изображений и на его основе экспериментальной версии онтологии по анализу изображений, которые: 1) позволят систематизировать плохо структурированный и продолжающий развиваться понятийный аппарат предметной области; 2) будут служить терминологической и понятийной основой для классификации и описания задач и методов обработки, анализа и распознавания изображений в базах знаний для работы с изображениями; 3) обеспечат автоматизацию информационного поиска в базах знаний по обработке, анализу и распознаванию изображений и базах данных изображений. Кроме того, тезаурус будет являться самостоятельным словарем-справочником, который поможет ориентироваться в данной предметной области, и обеспечит возможность создания на его основе информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.

Для достижения заявленной цели поставлены и решены следующие задачи: 1) исследование системы и логики знаний в области обработки, анализа, оценивания и понимания изображений; 2) разработка и обоснование структуры тезауруса по анализу изображений на основе оригинальной классификации задач и методов обработки, анализа и распознавания изображений; 3) отбор терминологии и разработка словника тезауруса по анализу изображений; 4) построение классификации задач обработки, анализа и распознавания изображений; 5) построение классификации методов обработки, анализа и распознавания изображений; 6) разработка базовой версии специализированного тезауруса по анализу изображений; 7) разработка экспериментальной версии онтологии анализа изображений на основе тезауруса по анализу изображений; 8) разработка концепции, архитектуры, функциональной схемы и требований к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений на основе тезауруса по анализу изображений; 9) разработка метода использования тезаурусов и онтологий при решении задач анализа изображений.

Методы исследования

В диссертационной работе используются математические методы распознавания образов, методы обработки, анализа и распознавания изображений, методы дескриптивной теории анализа изображений, методы структурной лингвистики.

Результаты, выносимые на защиту

Базовая версия тезауруса по анализу изображений.

Экспериментальная версия онтологии анализа изображений на языке OWL.

Концепция, архитектура, функциональная схема и требования к информационному наполнению информационно-справочного интернет-ресурса по обработке, анализу и распознаванию изображений.