Состояние теории и практики создания экспертных систем

В практике эксплуатации бортовых комплексов оборудования (БКО) воздушных судов различных поколений хорошо известны два подхода к решению задач оценки состояния БКО ВС и отдельных систем этого комплекса: один из них основан на знаниях и опыте специалиста, а другой на применении техники оптимизации. Первый подход более приемлем для задач, сложных по их математическому описанию и решению методами оптимизации, к которым могут несомненно быть отнесены задачи оценки состояния БКО, представляющие сложно организованные структуры, базирующие на различных физических принципах реализации отдельных систем этого комплекса. Второй подход удобен, например, для задач контроля состояния конкретных систем, которые можно сформулировать в терминах математического программирования. Так как ни один из перечисленных подходов не является универсальным, продолжается поиск других путей решения проблем. В частности, в качестве альтернативного подхода, базирующегося на человеческом опыте и знаниях в конкретной области, является разработка специализированных экспериментальных систем.

Экспертные системы (ЭС) предназначены главным образом, для решения практических задач, возникающих у специалиста, работающего в слабо структурированной и трудно формализуемой предметной области. Эти системы в настоящее время представляют наибольший интерес для компьютерной психодиагностики. Они способны аккумулировать коллективные профессиональные знания квалифицированных экспертов о ситуации психологического эксперимента, особенностях объекта и, может быть, личности самого экспериментатора и могут служить полезным инструментом, содействующим повышению точности психодиагностики и эффективности планирования психотехнических мероприятий.

Общая структура экспертной системы приведена на рис. 1.

Основы экспертной системы составляет база знаний, в которой хранятся необходимые для решения задач знания о законах предметной области и способах решения возникающих в этой области задач. Указанные знания специальным образом знаний будут структурированы (методы представления знаний будут рассмотрены несколько позже), а за наполнение базы знаний априорными знаниями отвечает инженер по знаниям, данный специалист устанавливает связи с экспертами и получает от них необходимые сведения, решает задачу формализации полученных знаний и заполнения ими базы знаний. Также в функции инженера по знаниям входит поддержание базы знаний в рабочем состоянии, если экспертная система допускает изменение содержимого базы знаний после ее априорного заполнения.

Вторая важная часть любой экспертной системы — логический блок, или решатель. С его помощью происходит манипулирование знаниями, хранящимися в базе знаний. В нем могут реализовываться, например, процедуры достоверного вывода, алгоритмы правдоподобных рассуждений и другие процедуры, предназначенные для выработки экспертных заключений.

Третий блок — блок общения, или интеллектуальный интерфейс — организует взаимодействие пользователя с экспертной системой в удобной для пользователя форме, максимально .приближенной к общению людей между собой. В блоке общения используются достижения искусственного интеллекта, касающиеся понимания текстов на естественном языке, а также представления результатов работы экспертной системы в наиболее наглядном и выразительном виде.

Наконец, четвертый блок экспертной системы — это блок объяснения. Его функция состоит в выдаче информации, объясняющей и иллюстрирующей путь получения того или иного вывода, если он интересует пользователя. Например, пользователь может сомневаться в в предпочтительности одного заключения перед другим.

Инженер по знаниям

Структура экспертной системы

Условное представление знаний

Рисунок 1. Структура экспертной системы

Тогда по запросу на этот счет пользователя экспертная система с развитым блоком объяснения должна, аргументировано обосновать тот или иной выбор в качестве наиболее правдоподобного решения.

Любой из перечисленных блоков экспертной системы строится на базе предшествовавших глубоких исследований различных сторон восприятия, представления и анализа информации: человеком и компьютером и нуждается в самостоятельном и подробном рассмотрении. В то же время, как указывалось выше, кардинальным фактором, обусловившим возможность возникновения интеллектуальных систем, явился переход к парадигме «Представление знаний — Манипулирование знаниями».

В общем случае знания некоторой группы экспертов, заносимые в базу знаний интеллектуальной системы, можно представить в следующем виде (рис. 2)

Z=Z1Uz2,

где Zr множество знаний, общепринятых в данной предметной области и содержащихся в монографиях, учебниках, справочниках по данному вопросу (так называемые «общие» знания);

Z2 — множество знаний, приобретенных специалистами (экспертами) в этой предметной области в процессе их профессиональной деятельности («личные» знания),

Множество знаний Z2 включает в себя подмножества личных знаний отдельных экспертов. Пересечение множеств Z] и Z2

Zk=Z1Uz2

представляет собой канонизированную часть личных знаний - то, что усвоено экспертами из специальной литературы и в чем нет расхождений между различными экспертами но, как видно из рис. 2, в Z2 остается еще подмножество Z0, которое не имеет пересечения с Zi и представляет собой ту часть личных знаний, которая обусловлена профессиональным опытом и интуицией соответствующих специалистов (Z0 = Z2 U Z1). Традиционно в экспертных системах особую ценность имеют слабоформализованные знания типа Z2 В отличие от Z2 множество гртбычно хорошо структурировано и сравнительно легко формализуемо (в общем случае для представления Zi и Z2 в базе знаний могут применяться разные способы).

Чаще всего множество Zi характеризуется наличием теории, в то время как в основе Z2 лежат эмпирические знания. Но, как известно, любая теория это в некотором смысле идеализация предметной области, а следовательно, и ее упрощение /Харалик р, 1983/. Эмпирический же материал конкретен, отсюда он сложнее и многообразнее, более гибко и широко описывает предметную область Можно сказать, что знания Z2 не так «системны», как Zb но зато они не так «искусственны». Кроме того, деление Z2 и Z1 не абсолютно. Во-первых, у них есть общая часть Zk, во-вторых, со временем наиболее плодотворные и подтвержденные практикой гипотезы переходят из Zi в Zk, а следовательно, в Zi.

Разбиение Z2 на Z0 и Zk отличается для разных наук. Для гуманитарных наук с их «мягкими» знаниями (преимущественно феноменологическими и качественными) характерно преобладание Z0, в отличие от естественных и точных наук с их «жесткими» знаниями (уровень «количественной» теории), для которых очевидно обладание Zk. Различная природа Zk и Z0 порождает разные способы их представления.

В общем виде знания . представляются некоторой знаковой (семиотической) системой .

С понятием «знак» непосредственно связаны понятия денотат и концепт.

Денотат — это объект, обозначаемый данным знаком, а концепт — свойство денотата. Важными понятиями в семиотических системах являются экстенсионал и интенсионал. Экстенсионал знака определяет конкретный класс всех его допустимых денотатов. Интенсионал знака определяет содержание связанного с ним понятия. Соответственно различают интенсиональные и экстенсиональные знания.

Интенсиональные знания — это знания о закономерностях ; в данной предметной области. Они оперируют абстрактными объектами, событиями и отношениями.

Экстенсиональные знания представляют собой данные, характеризующие конкретные объекты, события, эмпирические факты.

В семиотической системе выделяют три аспекта: синтаксический, семантический и прагматический. Синтаксис описывает внутреннее устройство знаковой системы, то есть правила построения и преобразования знаковых выражений. Например, для естественного языка синтаксис определяет правильное построение предложений и связного текста. Семантика определяет отношения между знаками и их концептами, то есть задает смысл или значения конкретных знаков. Прагматика определяет знак с точки зрения конкретной сферы его применения либо с точки зрения субъекта, использующего данную знаковую систему.  

В соответствии с перечисленными тремя аспектами семиотических систем выделяют три типа знания[ ]: синтаксические знания (характеризуют синтаксическую структуру описываемого объекта или явления, не зависящую от смысла и содержания, используемых при этом понятий); семантические знания (содержат информацию, непосредственно связанную со значениями и смыслом описываемых явлений и объектов); прагматические знания (описывают объекты и явления с точки зрения решаемой задачи).

Также выделяют декларативные и процедурные формы представления знаний с предметной области.

Декларативные представления не содержат в явном виде описания процедур, которые необходимо выполнять. Моделирование предметной области в такой форме требует полного описания ее состояния, которое носит синтаксический характер.

Вывод и поиск решения опираются в основном на алгоритмы поиска в пространстве состояний, которые сводятся к определению последовательности операторов, отображающих начальные состояния в целевые.

Построение таких алгоритмов связано с учетом специфики конкретной предметной области, то есть с учетом ее семантики. Следовательно, при декларативном представлении синтаксические и семантические знания в определенной мере отделены друг от друга, что придает этой форме представления достаточную универсальность.

Процедурные представления заключаются в задании некоторых процедур в явном виде. Текущее состояние объекта представляется набором программ, обрабатывающих определенный участок базы знаний. Это дает возможность не хранить в базе знаний все возможные состояния, а ограничиться хранением лишь начального состояния и процедуры, генерирующей (выводящей) все описания последующих состояний из начального. При таком представлении знаний семантика вводится в описание элементов базы знаний. Эти представления реализуются с помощью специальных языков.

Приведенные формы представления знаний в чистом виде практически не встречаются. Конкретные, используемые на практике, модели в равной мере оперируют обеими формами. Наиболее распространенными являются следующие модели представления знаний:

  • —продукционные системы;
  • —логические модели;
  • — фреймы;
  • —семантические сети.

В продукционных системах знания представляются в виде совокупности специальных информационных единиц, имеющих следующую структуру: Имя продукции: Сфера.

Предусловие. Условие. Если А, то В. Постусловие.

В общем случае продукционная система включает следующие компоненты:

  • базу данных, содержащую множество фактов;
  • базу правил, содержащую набор продукций;
  • интерпретатор (механизм логического вывода) или правила работы с продукциями.

База правил и база данных образуют базу знаний. Факты в базе данных представляют собой краткосрочную информацию и в принципе могут изменяться в ходе работы продукционной системы по мере накопления опыта.

Продукции по сравнению с другими формами представления знаний имеют следующие преимущества /Таунсенд К. и др., 1990/:

  • модульность;
  • единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемнрй ориентацией);
  • естественность (вывод заключения в продукционной системе во многом аналогичен процессу рассуждения эксперта);
  • гибкость родовидовой иерархии понятий, которая поддерживается только, как связи между правилами, (менение правила влечет за собой изменение и в иерархии).

Однако продукционные системы не свободны от недостатков:

  • процесс вывода менее эффективен, чем в других системах, поскольку большая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;
  • этот процесс трудно поддается управлению;
  • сложно представить родовидовую иерархию понятий.

Логические модели представления знаний реализуются средствами логики предикатов.

Предикатом называется функция, принимающая только два значения -истина и ложь - и, предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием. Константы служат для именования объектов предметной области. Логические предложения или высказывания образуют атомарные формулы. Интерпретация предиката -это множество всех допустимых связываний переменных с константами. Связывание представляет собой подстановку констант вместо переменных.

Наиболее простым языком логики является исчисление высказываний, в котором отсутствуют переменные. Любому высказыванию можно приписать значение истинно или ложно. Отдельные высказывания могут соединяться связками И, ИЛИ, НЕ, которые называются булевыми операторами. Основу исчисления высказывания составляют правила образования сложных высказываний из атомарных.

Исчисление предикатов с кванторами (логика предикатов) является расширением исчисления высказываний, в котором для выражения отношений между объектами предметной области могут использоваться предложения включающие не только константы, но и переменные.

В общем случае модели, описываются формальной системой, которая задается четверкой: 

M = (Т, Р, А, П),

где T - множество базовых элементов или алфавит формальной системы;

P - множество синтаксических правил, с помощью которых из T можно строить синтаксически правильные предложения;

А - множество аксиом или некоторых синтаксически правильных предложений, заданных априорно

П - правила продукций (правила вывода или семантические правила), с помощью которых можно расширять множество А, добавляя в него синтаксически правильные предложения.

Главное преимущество логических моделей представления знаний заключается в возможности непосредственно запрограммировать механизм вывода синтаксически правильных высказываний.

Фрейм чаще всего определяют как структуру данных для представления стереотипных ситуаций. Модель представления знаний на основе фреймов использует концепцию организации памяти, понимания и обучения человека, предложенную М. Минским / 1975/. Фрейм (дословно - «рамка») - это единица представления знаний, детали которой могут изменяться в соответствии с текущей ситуацией. Фрейм в любой момент может быть дополнен различной информацией, которая касается способов применения данного фрейма, последствий этого применения и т. п. Способ группирования множества конкретных ситуаций в стереотипную, как правило, не может быть определен строго.

Чаще всего стереотипные для данной предметной области ситуации выделяет исследователь, опираясь на опыт и данные наблюдений. Если понятия представляют собой неформальные знания о стереотипной ситуации, то фреймы - это формализованные знания. Таким образом, фреймы соответствуют понятиям, отражающим объекты, явления, характеристики предметной области. Так как знания могут быть представлены совокупностью взаимосвязанных понятий, то модель их представления строится в виде сети фреймов. В таких моделях выделяют собственно представление знаний в виде набора фреймов и механизм их связывания, преобразования.

Структура фрейма состоит из характеристик описываемой стереотипной ситуации и их значений, которые называются соответственно слотами и заполнителями слотов.

Имя фрейма: Имя первого слота, значение первого слота Имя второго слота, значение второго слота Имя К-го слота, значение К-го слота. Незаполненный фрейм называется протофреймом, а заполненный -экзофреймом. Роль протофрейма, как оболочки, в экзофрейме весьма важна. Эта оболочка позволяет осуществлять процедуру внутренней интерпретации, благодаря которой данные в памяти системы не безлики, а имеют вполне определенный, известный системе смысл.

Как уже отмечалось, помимо конкретного значения в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления этого значения. Среди них выделяют процедуры-демоны и процедуры-слуги.

Различают статические и динамические системы фреймов. В системах первого типа фреймы не могут быть изменены в процессе решения задачи, а в системах второго типа это допустимо.

Как недостаток фреймовых систем отмечают их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и в увеличении трудоемкости внесения изменений в родовидовую иерархию.

Семантическая сеть описывает знания в виде сетевых структур. В качестве вершин сети выступают понятия, факты, объекты, события и т. п., а в качестве дуг сети - отношения, которыми вершины связаны между собой.

Семантические сети часто рассматривают как наиболее общий формализм для представления знаний. Частным случаем таких сетей являются сценарии, в которых, в качестве отцошений выступают каузальные отношения или отношения типа цель - средство.

Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Самыми распространенными являются следующие типы отношений:

  • БЫТЬ ЭЛЕМЕНТОМ КЛАССА (ЯВЛЯТЬСЯ) - означает, что объект входит в состав данного класса, например, Иван Бездомный является человеком;
  • ИМЕТЬ - позволяет задавать свойства объектов, например, жираф имеет длинную шею;
  • ЯВЛЯТЬСЯ СЛЕДСТВИЕМ - отражает причинно-следственные связи, например, астеническое состояние, является следствием перенесенного простудного заболевания;
  • ИМЕТЬ ЗНАЧЕНИЕ — задает значение свойств объектов, например, пациент, может иметь двух братьев.

Как и в системе, основанной на фреймах, в семантической сети могут быть представлены родовидовые отношения, которые позволяют реализовывать наследование свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают все недостатки и достоинства представления знаний в виде фреймов. Преимущества заключаются в простоте и наглядности описания предметной области.

Из других методов представления знаний популярностью пользуется метод представления знаний по примерам. Работая с системой такого типа, пользователь задает ей несколько примеров решения задач из актуальной предметной области. На основе этих примеров система самостоятельно строит базу знаний, которая затем будет применяться для решения других задач. При создании базы знаний пользователь имеет возможность в любой момент вызвать на экран дисплея матрицу, состоящую из примеров задач и их решений, с тем, чтобы установить в ней наличие пустых мест, которые необходимо заполнить недостающими примерами «задача решение».

Основным достоинством представления знаний по примерам является простота применения данного способа, поскольку пользователь может не иметь ни малейшего представления о продукционных правилах, исчислении предикатов, фреймах и семантических сетях. В то же время, в качестве недостатков метода представления знаний по примерам отмечают отсутствие гибкости процесса построения интеллектуальной системы. Пользователь оказывается отстраненным от собственно создания базы знаний и поэтому не может контролировать связи между содержащимися в ней понятиями.

Выбор способа представления знаний осуществляется инженером по знаниям после того, как им достигнуто понимание природы данных моделируемой области. При решении сложных задач возможны ситуации, когда источники знаний различаются по типам и, соответственно, представление таких знаний требует использования разных способов (смешанное представление). Тогда для продуктивного функционирования интеллектуальной системы нередко применяют принцип доски объявлений, с помощью которого реализуется взаимодействие различных независимых источников знаний.

Проблема представления знаний и манипулирования ими является одной из центральных проблем для специалистов различного профиля, работающих в области искусственного интеллекта - теоретиков, занятых исследованием моделей и методов, программистов, создающих новые средства программирования, и прикладников, производящих конкретные интеллектуальные системы. В то же время заслуживает внимания вопрос о распределении приоритетов среди указанных специалистов других проблем искусственного интеллекта. 

Фамилия автора: Д. С. EPГАЛИЕВ
Год: 2009
Город: Актюбинск
Яндекс.Метрика