Рассматривается технология построения диагностирующих экспертных систем для использования в высшем образовании. Сформулированы основные проблемы проектирования и реализации диагностирующих экспертных систем. Осуществлен переход из курса интенсивного обучения к основам искусственного интеллекта и экспертных систем в средней школе.
Существующие технологии построения экспертных систем (ЭС) различаются по методам приобретения, представления, обработки и сопровождения знаний в базе знаний (БЗ). Поскольку выбор методов представления и обработки знаний при построении ЭС существенно зависит от целей экспертизы, особенностей предметной области, категории пользователей, материальных и некоторых других факторов актуальной является задача по выработке критериев оценивания достоинств и недостатков выбираемых методов.
В статье приводится описание технологии (методика + программное обеспечение) построения диагностирующих экспертных систем,базирующихся на вероятностной, а именно, байесовской модели представления и обработки знаний.
Предлагаемая технология оценивается с точки зрения приемлемости для самостоятельного использования экспертами - предметниками не обладающими глубокими знаниями в области программирования, теории вероятностей и инженерии знаний, и поддерживается инструментальной оболочкой экспертной системой BELS.
Основные требования к методам представления и обработки знаний
Во многих предметных областях, относящихся к разряду плохоформализуемых, таких как медицина, химия, биология и другие, сложилась ситуация, характеризующаяся с одной стороны большим объемом накопленной фактографической информации (результаты наблюдений, опытов, экспериментов и т.д.), и с другой стороны не достаточно эффективным ее использованием. Результаты большинства исследований, как правило, оседают в виде статей и монографий на полки местных библиотек, не оказывая ощутимого влияния на темпы интеллектуального, социального и экономического развития общества. В числе причин подобной ситуации можно назвать большой разрыв между уровнем знаний когорты ведущих ученых и остальной частью исследователей, отставанием программы обучения и уровня материальнотехнического оснащения учебных заведений от требований науки и техники, отсутствием в достаточном количестве высокопрофессиональных преподавателей, сохраняющих связь с наукой, отсутствием тесных контактов между специалистами в смежных областях науки и другие.
В этой связи исследования в области искусственного интеллекта (ИИ) и ЭС приобретают особую значимость. Разработка и широкое внедрение советующих систем, систем автоматизированного обучения, решателей задач и других систем ИИ, позволило бы смягчить отмеченное выше противоречие. Однако здесь мы сталкиваемся с другой трудностью, а именно, отсутствием в необходимом количестве профессиональных, высококвалифицированных инженеров по знаниям (инженеров - когнитологов). Одним из подходов к преодолению этой трудности является разработка технологии представления и обработки (формализации) эвристических знаний, ориентированная на экспертов - предметников. Такая ориентация продиктована еще и тем, что практически невозможно подготовить инженера по знаниям, который мог бы одинаково хорошо формализовывать знания, скажем, как в медицине, так и в нефтяной промышленности. Как показывает опыт, инженеру по знаниям приходится вникать в детали предметной области и, по существу, приобретать вторую специальность. Учитывая длительность этого процесса, было бы правильнее говорить об инженерах по знаниям в конкретных предметных областях, а не вообще. Таким образом, существуют, по крайней мере, два подхода к преодолению указанных трудностей:
а) Подготовить инженеров по знаниям способных решать задачи из некоторой предметной области, используя известные технологии построения ЭС;
б) Разработать и передать экспертам-предметникам для самостоятельной работы, специализированные технологии построения ЭС, организовать курсы интенсивного обучения методам инженерии знаний, используемым в этих технологиях.
В статье анализируются возможные способы реализации второго подхода.
Для достижения поставленных целей методы представления и обработки знаний, по мнению автора, должны быть:
а) Простыми - продолжительность обучения и усвоения основных положений, используемых методов и соответствующего программного обеспечения (ПО) не должна превышать одного месяца.
б) Естественными - учитывающими специфику решаемой задачи и структуру используемых знаний.
в) Эффективными и надежными - решение, если оно имеется, должно быть найдено за приемлемое время, например, 5-15 минут.
г) Наглядными - процесс принятия решений должен иметь простую и наглядную интерпретацию.
Программные средства, поддерживающие эти методы должны предоставлять
а) Дружественный интерфейс.
б) Эффективные средства отладки и сопровождения БЗ.
г) Средства автоматизированного обучения эксперта работе с системой.
Инструментальная система BELS
Автором ведутся работы и накоплен определенный опыт создания диагностирующих и прогнозирующих экспертных систем в различных предметных областях [4]. В частности, разработана и широко используется инструментальная система построения экспертных систем BELS (Bayes Expert Learning System).
BELS поддерживает байесовский метод принятия оптимального статистического решения. Класс решаемых системой задач - диагностика / прогнозирование. Форма представления эвристических знаний - декларативная. Далее в статье приводится описание системы BELS версии 2.0
База знаний. Структура БЗ системы BELS приведена на рисунке 1.
Как видно из рисунка процесс приобретения и представления знаний в системе сводится к выявлению и заданию множества гипотез относительно возможных аномалий (заболеваний, неисправностей и т.д.) или прогнозов, а также множества симптомов (внешних признаков), позволяющих определить наиболее вероятную в некоторой ситуации гипотезу. Кроме того следует установить априорные вероятности гипотез и количественные (вероятностные) связи между гипотезами и симптомами
путем задания вероятностей P(S∕H) и P(S∕~H). Здесь вероятность подтверждения P(S/H) интерпретируется как вероятность появления симптома S при наличии, например, аномалии Н, а вероятность P(S/~H) интерпретируется как вероятность появления симптома S при отсутствии аномалии, связанной с гипотезой Н, (т.е. симптом S вызван какой-то другой аномалией). Аналогичную интерпретацию имеют вероятности P(S_Val/H) и P(S_Val/~H). Следует отметить, что вероятности подтверждения и опровержения не зависят друг от друга и могут принимать произвольные значения из отрезка [0, 1].
В системе BELS помимо описанного выше "прямого" способа связывания гипотез с симптомами имеется возможность и "обратного" связывания, когда задав значения вероятностей P(H√Sj) и P(H√~Sj) можно автоматически вычислить значения вероятностей P(Sj∕Hi) и P(Sj∕~Hi), что также расширяет выразительные возможности системы.
Для организации диалога системы с пользователем в системе BELS каждой гипотезе ставят в соответствие текст предписания/рекомендации (выдается в конце процесса экспертизы), а каждому симптому - текст вопроса, информационно-справочную информацию по симптому и тип ожидаемого ответа.
- Альтернативный - применяется в том случае, если удается однозначно установить наличие или отсутствие некоторого признака (симптома). Например, на вопрос "Переносил ли больной инфаркт миокарда?" можно однозначно ответить "Да", "Нет" или "Не знаю".
- Целочисленный - используется в том случае, если не всегда удается однозначно установить наличие признака и требуется указать степень уверенности или степень присутствия признака на отрезке [-N, N], где отрицательные оценки указывают на степень отсутствия, а положительные на степень присутствия признака.
- Лингвистический зависимый - по сути, аналогичен целочисленному типу и используется в том случае, если словесное (вербальное) выражение степени уверенности или степени присутствия, более естественно или предпочтительно для пользователя. Например, информация о наличии температуры может быть уточнена на следующем отрезке,
[ низкая (-3), пониженная (-2), нормальная (-1), не знаю (0), субфебрильная (1), повышенная (2), высокая [3) ]
- Лингвистический независимый - используется в том случае, если каждое значение симптома, наряду с самим симптомом и независимо от остальных значений, также находится в определенных отношениях с гипотезами, в определениях которых встречается рассматриваемый симптом. По существу, каждое такое значение симптома является самостоятельным подсимптомом, а "лингвистический независимый" тип ответа задает некоторую иерархию симптомов.
Отметим некоторые достоинства и недостатки приведенного выше подхода к представлению знаний.
Достоинства:
а) Эксперту, как следует из нашего опыта, проще вспомнить и продекларировать известные ему аномалии и сопровождающие их внешние проявления (симптомы), нежели сформулировать правила, по которым он принимает решения.
б) Вероятности Р(Н), P(S∕H), P(S_Val/H) легко устанавливаются из имеющейся статистики, а вероятности P(S∕~H), P(S_Val/~H) уточняются в процессе отладки БЗ.
в) Использование байесовского метода предполагает независимость событий (симптомов и гипотез), что облегчает ведение БЗ.
г) Поскольку отношение "Гипотеза ↔ Симптом" носит индивидуальный характер (т.е. рассматривается вне связи с другими гипотезами и симптомами), уточнение определений гипотез (ввод, удаление, редактирование отношений) не приводит к противоречиям.
Недостатки:
а) Предполагается наличие достоверной статистики, отсутствие которой усложняет процесс отладки БЗ.
б) Предполагается независимость событий (гипотез и симптомов), что не всегда имеет место на практике.
в) Отсутствие процедурных знаний может иногда затянуть процесс принятия решения.
г) Алгоритм поиска решения (диагноза) системы может отличаться от алгоритма экспертов.
Механизм вывода. В основу механизма вывода системы BELS положен алгоритм К.Нейлора [2], в котором, помимо прочих, встречаются два основных шага:
- Отранжировать симптомы, установив количественно вклад каждого симптома в процесс принятия решения.
- Вычислить апостериорные вероятности релевантных гипотез.
Вклад или цена симптома может быть вычислена (как это делается в BELS) по формуле (1), т.е. в качестве цены симптома S можно взять сумму максимальных изменений вероятностей, которые могут произойти во всех гипотезах Н¡, зависящих от этого симптома.
Pr(S) = | P(Hj/S) - P(Hj/~S) | (1)
Таким образом, и на этапе установления "направления" поиска решения (шаг 1), и на этапе принятия решения (шаг 2), нам приходится вычислять апостериорные вероятности P(H∕S) и P(H∕~S). Система BELS предоставляет эксперту, возможность самому выбрать способ вычисления вероятностей Р(Н¡⁄Ś), в зависимости от особенностей предметной области. Так, если эксперту известны все гипотезы относительно возможных аномалий, т.е. имеет место равенство (2), то Р(Н¡⁄Ś) может быть вычислена по классической формуле Байеса (3).
P(H1)= 1 (2)
Отладка и сопровождение знаний. Отладка знаний в системе BELS, следуя приведенной методике интерпретации процесса экспертизы, сводится к определению "скорости и направления" перемещения вероятностей гипотезы в зависимости от возможных значений симптомов; выявлению и удалению избыточных гипотез, симптомов; уточнению определений гипотез и симптомов и т.д. [3]. Для облегчения этой задачи в системе предусмотрена возможность выделения подмножества гипотез и
61 симптомов в блок, что позволяет разбивать большие БЗ на более мелкие и отлаживать каждую из них в отдельности.
Поскольку вывод в системе BELS, по существу, является выводом от данных к цели (симптомов к гипотезе) система BELS предоставляет эксперту, как показано на рисунке 4, довольно полную информации по каждому симптому.
Интерфейс системы. Взаимодействие с пользователем в системе BELS осуществляется посредством форм, меню, шаблонов стандартного пользовательского интерфейса операционной системы Windows. Ввод и редактирование знаний осуществляется в специализированных экранных редакторах, которые снабжены подробными подсказками, комментариями и текстами помощи.
Курс интенсивного обучения основам искусственного интеллекта и экспертным системам
Данный курс был paзработан с целью обучения экспертов различных специальностей, желающих заняться систематизацией и формализацией своих знаний, основам ИИ и ЭС.
Процесс обучения условно разбит на 4 этапа:
- Введение в проблематику ИИ и ЭС - определение и классификация плохоформализуемых задач; знакомство с методами представления и обработки эвристических знаний на примерах классических систем ИИ и ЭС.
- Знакомство с формальными основами построения систем ИИ и ЭС - знакомство с элементами математической логики, теории вероятностей, информатики и вычислительной техники.
5) Обучение технологии построения диагностирующих ЭС - определение парадигмы "диагностика" и связанных с ней понятий; изучение назначения и принципов функционирования системы BELS; обретение навыков и умений по решению учебных задач в среде системы BELS.
4) Постановка и решение практически значимой задачи - исследование выбранной экспертом (обучаемым) предметной области; выявление плохоформализуемой задачи и эвристических знаний; ограниченное решение поставленной задачи в среде системы BELS.
Курс обучения включает 5 лекционных, 5 практических и 5 лабораторных занятий и рассчитан на 30 часов обучения. Продолжительность обучения - 2 недели.
Данный курс был апробирован в ПГУ им. С.Торайгырова (г. Павлодар), Казахстанско-Российском университете (г.Астана), Институте управления (г.Астана), Казахском агротехническом университете им. С.Сейфуллина (г.Астана).
Возраст обучаемых 20-25 лет. Все обучаемые являлись студентами. По завершению курса обучения в среднем до 80% обучаемые могли самостоятельно ставить и решать задачи в рамках системы BELS. Остальные 20% испытывали некоторые трудности в понимании метода Байеса и элементов теории вероятностей, и для них требовалось провести несколько дополнительных занятий.
ЛИТЕРАТУРА
- Ибрагимов О. В., Петрушин В. А. Экспертно-обучающие системы, Препр. / АН УССР. Ин-т кибернетики им.В.М.Глушкова; № 89-49 - Киев, 1989. - С.29.
- Нейлор К. Как построить машину вывода // Экспертные системы: принципы работы и примеры. - M. Радио и связь, 1987. - С. 62-83.
- Ибрагимов О. В. Методы и средства конструирования систем обучения пользователей инструментальных экспертных систем / Автореферат диссертации на соискание ученой степени кандидата физикоматематических наук - Киев, 1989. - С. 56.
- Еслямов С.Г. Компьютерные технологии обучения: современное состояние и перспективы. Монография. Издательство Павлодарского государственного университета им. С.Торайгырова, 2000. - С.214.