Технология построения диагностирующих экспертных систем

Рассматривается технология построения диагностирующих экспертных систем для использования в высшем образовании. Сформулированы основные проблемы проектирования и реализации диагностирующих экспертных систем. Также представлена программа реализации курса интенсивного обучения основам искусственного интеллекта и экспертным системам.

Существующие технологии построения экспертных систем (ЭС) различаются по методам приобретения, представления, обработки и сопровождения знаний в базе знаний (БЗ). Поскольку выбор методов представления и обработки знаний при построении ЭС существенно зависит от целей экспертизы, особенностей предметной области, категории пользователей, материальных и некоторых других факторов, актуальной является задача по выработке критериев оценивания достоинств и недостатков выбираемых методов.

В статье приводится описание технологии (методика + программное обеспечение) построения диагностирующих экспертных систем, базирующихся на вероятностной, а именно, байесовской модели представления и обработки знаний.

Предлагаемая технология оценивается с точки зрения приемлемости для самостоятельного использования экспертами - предметниками не обладающими глубокими знаниями в области программирования, теории вероятностей и инженерии знаний, и поддерживается инструментальной оболочкой экспертной системой BELS.

Основные требования к методам представления и обработки знаний

Во многих предметных областях, относящихся к разряду плохо формализуемых, таких как медицина, химия, биология и другие, сложилась ситуация, характеризующаяся с одной стороны большим объемом накопленной фактографической информации (результаты наблюдений, опытов, экспериментов и т.д.), и с другой стороны не достаточно эффективным ее использованием. Результаты большинства исследований, как правило, оседают в виде статей и монографий на полки местных библиотек, не оказывая ощутимого влияния на темпы интеллектуального, социального и экономического развития общества. В числе причин подобной ситуации можно назвать большой разрыв между уровнем знаний когорты ведущих ученых и остальной частью исследователей, отставанием программы обучения и уровня материальнотехнического оснащения учебных заведений от требований науки и техники, отсутствием в достаточном количестве высокопрофессиональных преподавателей, сохраняющих связь с наукой, отсутствием тесных контактов между специалистами в смежных областях науки и другие.

В этой связи исследования в области искусственного интеллекта (ИИ) и ЭС приобретают особую значимость. Разработка и широкое внедрение советующих систем, систем автоматизированного обучения, решателей задач и других систем ИИ, позволило бы смягчить отмеченное выше противоречие. Однако здесь мы сталкиваемся с другой трудностью, а именно, отсутствием в необходимом количестве профессиональных, высококвалифицированных инженеров по знаниям (инженеров-когнитологов). Одним из подходов к преодолению этой трудности является разработка технологии представления и обработки (формализации) эвристических знаний, ориентированная на экспертов-предметников. Такая ориентация продиктована еще и тем, что практически невозможно подготовить инженера по знаниям, который мог бы одинаково хорошо формализовывать знания, скажем, как в медицине, так и в нефтяной промышленности. Как показывает опыт, инженеру по знаниям приходится вникать в детали предметной области и, по существу, приобретать вторую специальность. Учитывая длительность этого процесса, было бы правильнее говорить об инженерах по знаниям в конкретных предметных областях, а не вообще. Таким образом, существуют, по крайней мере, два подхода к преодолению указанных трудностей:

а) Подготовить инженеров по знаниям способных решать задачи из некоторой предметной области, используя известные технологии построения ЭС;

б) Разработать и передать экспертам-предметникам для самостоятельной работы, специализированные технологии построения ЭС, организовать курсы интенсивного обучения методам инженерии знаний, используемым в этих технологиях.

В статье анализируются возможные способы реализации второго подхода.

Для достижения поставленных целей методы представления и обработки знаний, по мнению автора, должны быть:

а) Простыми - продолжительность обучения и усвоения основных положений, используемых методов и соответствующего программного обеспечения (ПО) не должна превышать одного месяца.

б) Естественными - учитывающими специфику решаемой задачи и структуру используемых знаний.

в) Эффективными и надежными - решение, если оно имеется, должно быть найдено за приемлемое время, например, 5-15 минут.

г) Наглядными - процесс принятия решений должен иметь простую и наглядную интерпретацию.

Программные средства, поддерживающие эти методы должны предоставлять:

а) Дружественный интерфейс.

б) Эффективные средства отладки и сопровождения БЗ.

г) Средства автоматизированного обучения эксперта работе с системой.

Инструментальная система BELS

Автором ведутся работы и накоплен определенный опыт создания диагностирующих и прогнозирующих экспертных систем в различных предметных областях [4]. В частности, разработана и широко используется инструментальная система построения экспертных систем BELS (Bayes Expert Learning System).

BELS поддерживает байесовский метод принятия оптимального статистического решения. Класс решаемых системой задач - диагностика / прогнозирование. Форма представления эвристических знаний - декларативная. Далее в статье приводится описание системы BELS версии 2.0

База знаний. Структура БЗ системы BELS приведена на рисунке 1.

Как видно из рисунка, процесс приобретения и представления знаний в системе сводится к выявлению и заданию множества гипотез относительно возможных аномалий (заболеваний, неисправностей и т.д.) или прогнозов, а также множества симптомов (внешних признаков), позволяющих определить наиболее вероятную в некоторой ситуации гипотезу. Кроме того следует установить априорные вероятности гипотез и количественные (вероятностные) связи между гипотезами и симптомами путем задания вероятностей P(S/H) и P(S∕~H). Здесь вероятность подтверждения P(S∕H) интерпретируется как вероятность появления симптома при наличии, например, аномалии Н, а вероятность P(S∕~H) интерпретируется как вероятность появления симп-

15

тома при отсутствии аномалии, связанной с гипотезой Н, (т.е. симптом вызван какой-то другой аномалией). Аналогичную интерпретацию имеют вероятности P(S_Val/B) и P(S_Val/~B). Следует отметить, что вероятности подтверждения и опровержения не зависят друг от друга и могут принимать произвольные значения из отрезка [0, 1].

Ответ пользователя на поставленный по некоторому симптому вопрос может быть четырех типов:

  1. Альтернативный - применяется в том случае, если удается однозначно установить наличие или отсутствие некоторого признака (симптома). Например, на вопрос "Переносил ли больной инфаркт миокарда?" можно однозначно ответить "Да", "Нет" или "Не знаю".
  2. Целочисленный - используется в том случае, если не всегда удается однозначно установить наличие признака и требуется указать степень уверенности или степень присутствия признака на отрезке /-N, N], где отрицательные оценки указывают на степень отсутствия, а положительные на степень присутствия признака.
  3. Лингвистический зависимый - по сути, аналогичен целочисленному типу и используется в том случае, если словесное (вербальное) выражение степени уверенности или степени присутствия, более естественно или предпочтительно для пользователя. Например, информация о наличии температуры может быть уточнена на следующем отрезке,

[ низкая (-3), пониженная (-2), нормальная (-1), не знаю (0), субфебрильная (1),повышенная (2), высокая [3) ]

  1. Лингвистический независимый - используется в том случае, если каждое значение симптома, наряду с самим симптомом и независимо от остальных значений, также находится в определенных отношениях с гипотезами, в определениях которых встречается рассматриваемый симптом. По существу, каждое такое значение симптома является самостоятельным подсимптомом, а "лингвистический независимый" тип ответа задает некоторую иерархию симптомов.

Отметим некоторые достоинства и недостатки приведенного выше подхода к представлению знаний.

Достоинства:

а) Эксперту, как следует из нашего опыта, проще вспомнить и продекларировать известные ему аномалии и сопровождающие их внешние проявления (симптомы), нежели сформулировать правила, по которым он принимает решения.

б) Вероятности Р(Н)P(S∕H)P(S_Val/H) легко устанавливаются из имеющейся статистики, а вероятности P(S/~H)P(S_Val/-B) уточняются в процессе отладки БЗ.

в) Использование байесовского метода предполагает независимость событий (симптомов и гипотез), что облегчает ведение БЗ.

г) Поскольку отношение "Гипотеза ↔ Симптом" носит индивидуальный характер (т.е. рассматривается вне связи с другими гипотезами и симп-

томами), уточнение определений гипотез (ввод, удаление, редактирование отношений) не приводит к противоречиям.

Недостатки:

а) Предполагается наличие достоверной статистики, отсутствие которой усложняет процесс отладки БЗ.

б) Предполагается независимость событий (гипотез и симптомов), что не всегда имеет место на практике.

в) Отсутствие процедурных знаний может иногда затянуть процесс принятия решения.

г) Алгоритм поиска решения (диагноза) системы может отличаться от алгоритма экспертов.

Механизм вывода. В основу механизма вывода системы BELS положен алгоритм К.Нейлора [2], в котором, помимо прочих, встречаются два основных шага:

  1. Отранжировать симптомы, установив количественно вклад каждого симптома в процесс принятия решения.
  2. Вычислить апостериорные вероятности релевантных гипотез.

Вклад или цена симптома может быть вычислена (как это делается в BELS) по формуле (1), т.е. в качестве цены симптома можно взять сумму максимальных изменений вероятностей, которые могут произойти во всех гипотезах Н¡, зависящих от этого симптома.

Pr(S) = P(Hj∕S) - P(Hj∕~S) (1)

Таким образом, и на этапе установления "направления" поиска решения (шаг 1), и на этапе принятия решения (шаг 2), нам приходится вычислять апостериорные вероятности P(H∕S) и P(H∕~S). Система BELS предоставляет эксперту, возможность самому выбрать способ вычисления вероятностей P(Hj∕S), в зависимости от особенностей предметной области. Так, если эксперту известны все гипотезы относительно возможных аномалий, т.е. имеет место равенство (2), то Р(Н¡⁄Ś) может быть вычислена по классической формуле Байеса (3).

Как видим в формуле (3) отпадает необходимость в вероятности P(S∕~Hi), что существенно упрощает процесс формирования БЗ.

Кроме того, система BELS предоставляет эксперту возможность установить точность принимаемых решений за счет задания коэффициентов верхнего и нижнего порогов гипотез.

17

По требованию эксперта система может выдать наиболее вероятное решение (оптимальное решение) или выдать все принятые гипотезы, отсортированные по убыванию их апостериорных вероятностей.

Эксперименты, поставленные с целью выявления количественных характеристик механизма вывода показали, что решение в БЗ объемом в 400 правил вида (5) находится за 3-5 минут [4].

Это говорит о достаточно высокой производительности механизма вывода.

Отладка и сопровождение знаний. Отладка знаний в системе BELS, следуя приведенной методике интерпретации процесса экспертизы, сводится к определению "скорости и направления" перемещения вероятностей гипотезы в зависимости от возможных значений симптомов; выявлению и удалению избыточных гипотез, симптомов; уточнению определений гипотез и симптомов и т.д. [3]. Для облегчения этой задачи в системе предусмотрена возможность выделения подмножества гипотез и симптомов в блок, что позволяет разбивать большие БЗ на более мелкие и отлаживать каждую из них в отдельности.

Поскольку вывод в системе BELS, по существу, является выводом от данных к цели (симптомов к гипотезе) система BELS предоставляет эксперту, как показано на рисунке 2, довольно полную информацию по каждому симптому.

Интерфейс системы. Взаимодействие с пользователем в системе ВЕĹŚ осуществляется посредством форм, меню, шаблонов стандартного пользовательского интерфейса операционной системы Windows. Ввод и редактирование знаний осуществляется в специализированных экранных редакторах, которые снабжены подробными подсказками, комментариями и текстами помощи.

18

Данный курс был paзработан с целью обучения экспертов различных специальностей, желающих заняться систематизацией и формализацией своих знаний, основам ИИ и ЭС.

Процесс обучения условно разбит на 4 этапа:

  1. Введение в проблематику ИИ и ЭС - определение и классификация плохо формализуемых задач; знакомство с методами представления и обработки эвристических знаний на примерах классических систем ИИ и ЭС.
  2. Знакомство с формальными основами построения систем ИИ и ЭС - знакомство с элементами математической логики, теории вероятностей, информатики и вычислительной техники.
  3. Обучение технологии построения диагностирующих ЭС ^определение парадигмы "диагностика" и связанных с ней понятий; изучение назначения и принципов функционирования системы BELS; обретение навыков и умений по решению учебных задач в среде системы BELS.

Постановка и решение практически значимой задачи - исследование выбранной экспертом (обучаемым) предметной области; выявление плохо формализуемой задачи и эвристических знаний; ограниченное решение поставленной задачи в среде системы BELS.

Курс обучения включает 5 лекционных, 5 практических и 5 лабораторных занятий и рассчитан на 30 часов обучения. Продолжительность обучения - 2 недели.

Данный курс был апробирован в ПГУ им. С.Торайгырова (г. Павлодар), Казахстанско-Российском университете (г.Астана), Институте управления (г.Астана), Казахском агротехническом университете им. С.Сейфуллина (г.Астана).

Возраст обучаемых 20-25 лет. Все обучаемые являлись студентами. По завершении курса обучения в среднем до 80% обучаемые могли самостоятельно ставить и решать задачи в рамках системы BELS. Остальные 20% испытывали некоторые трудности в понимании метода Байеса и элементов теории вероятностей, и для них требовалось провести несколько дополнительных занятий.

 

ЛИТЕРАТУРА

  1. Ибрагимов О. В., Петрушин В. А. Экспертно-обучающие системы, Препр. / АН УССР. Ин-т кибернетики им.В.М.Глушкова; № 89-49 - Киев, 1989. - С.29.
  2. Нейлор К. Как построить машину вывода // Экспертные системы: принципы работы и примеры. - M. Радио и связь, 1987. - С. 62-83.
  3. Ибрагимов О. В. Методы и средства конструирования систем обучения пользователей инструментальных экспертных систем / Автореферат диссертации на соискание ученой степени кандидата физико-математических наук - Киев, 1989.
  4. Еслямов С.Г. Компьютерные технологии обучения: современное состояние и перспективы. Монография. Издательство Павлодарского государственного университета им. С.Торайгырова, 2000. - С.214.
Год: 2015
Город: Костанай