Технология построения диагностирующих экспертных систем

Рассматривается технология построения диагностирующих экспертных систем для использования в высшем образовании. Сформулированы основные проблемы проектирования и реализации диагностирующих экспертных систем. Осуществлен переход из курса интенсивного обучения к основам искусственного интеллекта и экспертных систем в средней школе.

Существующие технологии построения экспертных систем (ЭС) различаются по методам приобретения, представления, обработки и сопровождения знаний в базе знаний (БЗ). Поскольку выбор методов представления и обработки знаний при построении ЭС существенно зависит от целей экспертизы, особенностей предметной области, категории пользователей, материальных и некоторых других факторов актуальной является задача по выработке критериев оценивания достоинств и недостатков выбираемых методов.

В статье приводится описание технологии (методика + программное обеспечение) построения диагностирующих экспертных систем,базирующихся на вероятностной, а именно, байесовской модели представления и обработки знаний.

Предлагаемая технология оценивается с точки зрения приемлемости для самостоятельного использования экспертами - предметниками не обладающими глубокими знаниями в области программирования, теории вероятностей и инженерии знаний, и поддерживается инструментальной оболочкой экспертной системой BELS.

Основные требования к методам представления и обработки знаний

Во многих предметных областях, относящихся к разряду плохоформализуемых, таких как медицина, химия, биология и другие, сложилась ситуация, характеризующаяся с одной стороны большим объемом накопленной фактографической информации (результаты наблюдений, опытов, экспериментов и т.д.), и с другой стороны не достаточно эффективным ее использованием. Результаты большинства исследований, как правило, оседают в виде статей и монографий на полки местных библиотек, не оказывая ощутимого влияния на темпы интеллектуального, социального и экономического развития общества. В числе причин подобной ситуации можно назвать большой разрыв между уровнем знаний когорты ведущих ученых и остальной частью исследователей, отставанием программы обучения и уровня материальнотехнического оснащения учебных заведений от требований науки и техники, отсутствием в достаточном количестве высокопрофессиональных преподавателей, сохраняющих связь с наукой, отсутствием тесных контактов между специалистами в смежных областях науки и другие.

В этой связи исследования в области искусственного интеллекта (ИИ) и ЭС приобретают особую значимость. Разработка и широкое внедрение советующих систем, систем автоматизированного обучения, решателей задач и других систем ИИ, позволило бы смягчить отмеченное выше противоречие. Однако здесь мы сталкиваемся с другой трудностью, а именно, отсутствием в необходимом количестве профессиональных, высококвалифицированных инженеров по знаниям (инженеров - когнитологов). Одним из подходов к преодолению этой трудности является разработка технологии представления и обработки (формализации) эвристических знаний, ориентированная на экспертов - предметников. Такая ориентация продиктована еще и тем, что практически невозможно подготовить инженера по знаниям, который мог бы одинаково хорошо формализовывать знания, скажем, как в медицине, так и в нефтяной промышленности. Как показывает опыт, инженеру по знаниям приходится вникать в детали предметной области и, по существу, приобретать вторую специальность. Учитывая длительность этого процесса, было бы правильнее говорить об инженерах по знаниям в конкретных предметных областях, а не вообще. Таким образом, существуют, по крайней мере, два подхода к преодолению указанных трудностей:

а) Подготовить инженеров по знаниям способных решать задачи из некоторой предметной области, используя известные технологии построения ЭС;

б) Разработать и передать экспертам-предметникам для самостоятельной работы, специализированные технологии построения ЭС, организовать курсы интенсивного обучения методам инженерии знаний, используемым в этих технологиях.

В статье анализируются возможные способы реализации второго подхода.

Для достижения поставленных целей методы представления и обработки знаний, по мнению автора, должны быть:

а) Простыми - продолжительность обучения и усвоения основных положений, используемых методов и соответствующего программного обеспечения (ПО) не должна превышать одного месяца.

б) Естественными - учитывающими специфику решаемой задачи и структуру используемых знаний.

в) Эффективными и надежными - решение, если оно имеется, должно быть найдено за приемлемое время, например, 5-15 минут.

г) Наглядными - процесс принятия решений должен иметь простую и наглядную интерпретацию.

Программные средства, поддерживающие эти методы должны предоставлять

а) Дружественный интерфейс.

б) Эффективные средства отладки и сопровождения БЗ.

г) Средства автоматизированного обучения эксперта работе с системой.

Инструментальная система BELS

Автором ведутся работы и накоплен определенный опыт создания диагностирующих и прогнозирующих экспертных систем в различных предметных областях [4]. В частности, разработана и широко используется инструментальная система построения экспертных систем BELS (Bayes Expert Learning System).

BELS поддерживает байесовский метод принятия оптимального статистического решения. Класс решаемых системой задач - диагностика / прогнозирование. Форма представления эвристических знаний - декларативная. Далее в статье приводится описание системы BELS версии 2.0

База знаний. Структура БЗ системы BELS приведена на рисунке 1.

Как видно из рисунка процесс приобретения и представления знаний в системе сводится к выявлению и заданию множества гипотез относительно возможных аномалий (заболеваний, неисправностей и т.д.) или прогнозов, а также множества симптомов (внешних признаков), позволяющих определить наиболее вероятную в некоторой ситуации гипотезу. Кроме того следует установить априорные вероятности гипотез и количественные (вероятностные) связи между гипотезами и симптомами

путем задания вероятностей P(S∕H) и P(S∕~H). Здесь вероятность подтверждения P(S/H) интерпретируется как вероятность появления симптома при наличии, например, аномалии Н, а вероятность P(S/~H) интерпретируется как вероятность появления симптома при отсутствии аномалии, связанной с гипотезой Н, (т.е. симптом вызван какой-то другой аномалией). Аналогичную интерпретацию имеют вероятности P(S_Val/H) и P(S_Val/~H). Следует отметить, что вероятности подтверждения и опровержения не зависят друг от друга и могут принимать произвольные значения из отрезка [0, 1].

В системе BELS помимо описанного выше "прямого" способа связывания гипотез с симптомами имеется возможность и "обратного" связывания, когда задав значения вероятностей P(H√Sjи P(H√~Sjможно автоматически вычислить значения вероятностей P(Sj∕Hiи P(Sj∕~Hi), что также расширяет выразительные возможности системы.

Для организации диалога системы с пользователем в системе BELS каждой гипотезе ставят в соответствие текст предписания/рекомендации (выдается в конце процесса экспертизы), а каждому симптому - текст вопроса, информационно-справочную информацию по симптому и тип ожидаемого ответа.

  1. Альтернативный - применяется в том случае, если удается однозначно установить наличие или отсутствие некоторого признака (симптома). Например, на вопрос "Переносил ли больной инфаркт миокарда?" можно однозначно ответить "Да", "Нет" или "Не знаю".
  2. Целочисленный - используется в том случае, если не всегда удается однозначно установить наличие признака и требуется указать степень уверенности или степень присутствия признака на отрезке [-N, N]где отрицательные оценки указывают на степень отсутствия, а положительные на степень присутствия признака.
  3. Лингвистический зависимый - по сути, аналогичен целочисленному типу и используется в том случае, если словесное (вербальное) выражение степени уверенности или степени присутствия, более естественно или предпочтительно для пользователя. Например, информация о наличии температуры может быть уточнена на следующем отрезке,

[ низкая (-3), пониженная (-2), нормальная (-1), не знаю (0), субфебрильная (1), повышенная (2), высокая [3) ]

  1. Лингвистический независимый - используется в том случае, если каждое значение симптома, наряду с самим симптомом и независимо от остальных значений, также находится в определенных отношениях с гипотезами, в определениях которых встречается рассматриваемый симптом. По существу, каждое такое значение симптома является самостоятельным подсимптомом, а "лингвистический независимый" тип ответа задает некоторую иерархию симптомов.

Отметим некоторые достоинства и недостатки приведенного выше подхода к представлению знаний.

Достоинства:

а) Эксперту, как следует из нашего опыта, проще вспомнить и продекларировать известные ему аномалии и сопровождающие их внешние проявления (симптомы), нежели сформулировать правила, по которым он принимает решения.

б) Вероятности Р(Н)P(S∕H)P(S_Val/H) легко устанавливаются из имеющейся статистики, а вероятности P(S∕~H)P(S_Val/~H) уточняются в процессе отладки БЗ.

в) Использование байесовского метода предполагает независимость событий (симптомов и гипотез), что облегчает ведение БЗ.

г) Поскольку отношение "Гипотеза ↔ Симптом" носит индивидуальный характер (т.е. рассматривается вне связи с другими гипотезами и симптомами), уточнение определений гипотез (ввод, удаление, редактирование отношений) не приводит к противоречиям.

Недостатки:

а) Предполагается наличие достоверной статистики, отсутствие которой усложняет процесс отладки БЗ.

б) Предполагается независимость событий (гипотез и симптомов), что не всегда имеет место на практике.

в) Отсутствие процедурных знаний может иногда затянуть процесс принятия решения.

г) Алгоритм поиска решения (диагноза) системы может отличаться от алгоритма экспертов.

Механизм вывода. В основу механизма вывода системы BELS положен алгоритм К.Нейлора [2], в котором, помимо прочих, встречаются два основных шага:

  1. Отранжировать симптомы, установив количественно вклад каждого симптома в процесс принятия решения.
  2. Вычислить апостериорные вероятности релевантных гипотез.

Вклад или цена симптома может быть вычислена (как это делается в BELS) по формуле (1), т.е. в качестве цены симптома можно взять сумму максимальных изменений вероятностей, которые могут произойти во всех гипотезах Н¡, зависящих от этого симптома.

Pr(S) = P(Hj/S) - P(Hj/~S) (1)

Таким образом, и на этапе установления "направления" поиска решения (шаг 1), и на этапе принятия решения (шаг 2), нам приходится вычислять апостериорные вероятности P(H∕S) и P(H∕~S). Система BELS предоставляет эксперту, возможность самому выбрать способ вычисления вероятностей Р(Н¡⁄Ś), в зависимости от особенностей предметной области. Так, если эксперту известны все гипотезы относительно возможных аномалий, т.е. имеет место равенство (2), то Р(Н¡⁄Ś) может быть вычислена по классической формуле Байеса (3).

P(H1)= 1 (2)

Отладка и сопровождение знаний. Отладка знаний в системе BELS, следуя приведенной методике интерпретации процесса экспертизы, сводится к определению "скорости и направления" перемещения вероятностей гипотезы в зависимости от возможных значений симптомов; выявлению и удалению избыточных гипотез, симптомов; уточнению определений гипотез и симптомов и т.д. [3]. Для облегчения этой задачи в системе предусмотрена возможность выделения подмножества гипотез и

61 симптомов в блок, что позволяет разбивать большие БЗ на более мелкие и отлаживать каждую из них в отдельности.

Поскольку вывод в системе BELS, по существу, является выводом от данных к цели (симптомов к гипотезе) система BELS предоставляет эксперту, как показано на рисунке 4, довольно полную информации по каждому симптому.

Интерфейс системы. Взаимодействие с пользователем в системе BELS осуществляется посредством форм, меню, шаблонов стандартного пользовательского интерфейса операционной системы Windows. Ввод и редактирование знаний осуществляется в специализированных экранных редакторах, которые снабжены подробными подсказками, комментариями и текстами помощи.

Курс интенсивного обучения основам искусственного интеллекта и экспертным системам

Данный курс был paзработан с целью обучения экспертов различных специальностей, желающих заняться систематизацией и формализацией своих знаний, основам ИИ и ЭС.

Процесс обучения условно разбит на 4 этапа:

  1. Введение в проблематику ИИ и ЭС - определение и классификация плохоформализуемых задач; знакомство с методами представления и обработки эвристических знаний на примерах классических систем ИИ и ЭС.
  2. Знакомство с формальными основами построения систем ИИ и ЭС - знакомство с элементами математической логики, теории вероятностей, информатики и вычислительной техники.

5) Обучение технологии построения диагностирующих ЭС - определение парадигмы "диагностика" и связанных с ней понятий; изучение назначения и принципов функционирования системы BELS; обретение навыков и умений по решению учебных задач в среде системы BELS.

4) Постановка и решение практически значимой задачи - исследование выбранной экспертом (обучаемым) предметной области; выявление плохоформализуемой задачи и эвристических знаний; ограниченное решение поставленной задачи в среде системы BELS.

Курс обучения включает 5 лекционных, 5 практических и 5 лабораторных занятий и рассчитан на 30 часов обучения. Продолжительность обучения - 2 недели.

Данный курс был апробирован в ПГУ им. С.Торайгырова (г. Павлодар), Казахстанско-Российском университете (г.Астана), Институте управления (г.Астана), Казахском агротехническом университете им. С.Сейфуллина (г.Астана).

Возраст обучаемых 20-25 лет. Все обучаемые являлись студентами. По завершению курса обучения в среднем до 80% обучаемые могли самостоятельно ставить и решать задачи в рамках системы BELS. Остальные 20% испытывали некоторые трудности в понимании метода Байеса и элементов теории вероятностей, и для них требовалось провести несколько дополнительных занятий.

 

ЛИТЕРАТУРА

  1. Ибрагимов О. В., Петрушин В. А. Экспертно-обучающие системы, Препр. / АН УССР. Ин-т кибернетики им.В.М.Глушкова; № 89-49 - Киев, 1989. - С.29.
  2. Нейлор К. Как построить машину вывода // Экспертные системы: принципы работы и примеры. - M. Радио и связь, 1987. - С. 62-83.
  3. Ибрагимов О. В. Методы и средства конструирования систем обучения пользователей инструментальных экспертных систем / Автореферат диссертации на соискание ученой степени кандидата физикоматематических наук - Киев, 1989. - С. 56.
  4. Еслямов С.Г. Компьютерные технологии обучения: современное состояние и перспективы. Монография. Издательство Павлодарского государственного университета им. С.Торайгырова, 2000. - С.214.
Год: 2013
Город: Костанай