Онтология (информатика)
Материал из Википедии — свободной энциклопедии
Онтоло́гия (в информатике) — это попытка всеобьемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из иерархической структуры данных, содержащей все релевантные классы объектов, их связи и правила (теоремы, ограничения), принятые в этой области. Этот термин в информатике является производным от древнего философского понятия «онтология».
Онтологии применяются в искусственном интеллекте, семантических паутинах и технологии программирования как форма представления знаний о реальном мире или его части.
Содержание |
[править] Отличия от философского понятия онтологии
Хотя термин «онтология» изначально философский, в информатике он принял самостоятельное значение. Здесь есть два существенных отличия:
- Онтология в информатике должна иметь формат, который компьютер сможет легко обработать.
- Информационные онтологии создаются всегда с конкретными целями — решения конструкторских задач; они оцениваются больше с точки зрения применимости, чем полноты.
[править] Элементы онтологий
Современные онтологии строятся по большей части одинаково, независимо от языка написания. Обычно они состоят из экземпляров, понятий, атрибутов и отношений.
[править] Экземпляры
Экземпляры (англ. instances) — это основные, нижнеуровневые компоненты онтологии. Экземпляры могут представлять собой как физические обьекты (люди, дома, планеты), так и абстрактные (числа, слова). Строго говоря, онтология может обойтись и без конкретных объектов. Однако одной из главных целей онтологии является классификация таких объектов, поэтому они также включаются.
[править] Понятия
[править] Атрибуты
Объекты в онтологии могут иметь атрибуты. Каждый атрибут имеет по крайней мере имя и значение, и используется для хранения информации, которая специфична для объекта и привязана к нему. Например объект the Ford Explorer имеет такие атрибуты как:
- Название: Ford Explorer
- Число-дверей: 4
- Двигатель: {4.0Л, 4.6Л}
- Коробка-передач: 6-скоростная
Значение атрибута может быть сложным типом данных. В данном примере, значение атрибута, который называется Двигатель является списком значений простых типов данных.
Если вы не определяете атрибуты для концепций, вам придется определять либо таксономию (если между концепциями существует отношение включения (Гипоним, англ. Hyponym), либо Управляемый Словарь (англ. Controlled Vocabulary). Они полезны, но не считаются настоящими онтологиями.
[править] Отношения
[править] Специализированные и общие онтологии
Специализированные (предметно-ориентированные ) онтологии (онтологии предметных областей-ПрО) — это представление какой-либо области знаний или части реального мира. В такой онтологии содержатся специальные для этой области значения терминов. К примеру, слово «поле» в сельском хозяйстве означает участок земли (см. здесь), в физике — один из видов материи (см. здесь), в математике — особую структуру (см. здесь).
Общие онтологии используются для представлений понятий, общих для большого числа областей. Такие онтологии содержат базовый набор терминов, глоссарий или тезаурус, используемый для описания терминов предметных областей.
Если использующая специализированные онтологии система развивается, то может потребоваться их объединение. И для инженера по онтологиям это серьёзная задача. Подобные онтологии часто несовместимы друг с другом, хотя могут представлять близкие области. Разница может появляться из-за особенностей местной культуры, идеологии и т. п., или вследствие использования другого языка описания.
Сегодня объединение онтологий приходится выполнять вручную, это трудоёмкий, медленный и дорогостоящий процесс. Использование базисной онтологии — единого глоссария — несколько упрощает эту работу. Есть научные работы по технологиям объединения, но они по большей части теоретические.
[править] Языки описания онтологий
Язык описания онтологий - формальный язык используемый для кодирования онтологии. Существует несколько подобных языков (список неполон):
- OWL - ontology web language, стандарт W3C, язык для семантических утверждений, разработанный как расширение RDF и RDFS;
- KIF (Knowledge Interchange Format или формат обмена знаниями) - основанный на S-выражениях синтаксис для логики;
- CycL - онтологический язык использующийся в проекте Cyc, основан на исчислении предикатов с некоторыми расширениями более высокго порядка.
- DAML+OIL (FIPA)
[править] См. также
Инженерия знаний | |
---|---|
Общие понятия | Данные | Метаданные | Знания | Метазнание Представление знаний | База знаний | Онтология |
Жёсткие модели | Продукции | Семантическая сеть | Фреймы | Логическая модель |
Мягкие методы | Нейронная сеть | Генетический алгоритм | Нечёткая логика | Гибридная система |