Рассмотрим способ построения кластеризованной ранжировки, определенной со всеми предложенными кластеризованными ранжировками. При этом предполагают, что противоречия между
отдельными исходными ранжировками оказываются определенными внутри кластеров согласованной ранжировки. В итоге упорядоченность кластеров выражает общее мнение экспертов, точнее, то общее, что содержится в исходных ранжировках.
В кластеры заключены объекты, по поводу которых некоторые из исходных ранжировок противоречат друг другу. Для их изучения необходимо провести анализ и новые исследования. Анализ может быть как формально-математическими (например, упорядочения по средним рангам или по медианам, вычисление медианы Кемени и т.п.), так и привлечения новой информации из соответствующих прикладных области, возможно, организации дополнительных научных или прикладных исследований.
Пусть имеется конечное число объектов, которые будем изображать натуральными числами 1,2,3,...,k и называть ―носителем‖. Под кластеризованной ранжировкой, определенной на заданном множестве, определяется следующей математической конструкцией.
Объекты разбиты на группы, которые называются кластерами. В кластере может быть и один элемент. Входящие в один кластер объекты будем заключать в фигурные скобки. Например, объекты 1,2,3,...,10 могут быть разбиты на 7 кластеров: {1}, {2,3}, {4}, {5,6,7}, {8}, {9}, {10}. В этом разбиении один кластер {5,6,7} содержит три элемента, другой - {2,3} - два, остальные пять - по одному элементу. Кластеры не имеют общих элементов, а объединение их (как множеств) есть все рассматриваемое множество объектов.
Вторая составляющая кластеризованной ранжировки - это строгий линейный порядок между кластерами. Определено, какой из них первый, какой второй, и т.д. Будем отображать упорядоченность с помощью знака
- . Определим кластеры, состоящие из одного элемента, которые будут изображаться без фигурных скобок. Тогда кластеризованную ранжировку на основе введенных выше кластеров можно изобразить так: А = [ 1 < {2,3}
- 4 < {5,6,7} < 8 < 9 < 10 ]. Конкретные кластеризованные ранжировки будем заключать в квадратные скобки. Если для простоты речи термин "кластер" применять только к кластеру не менее чем из 2-х элементов, то можно сказать, что в кластеризованную ранжировку А входят два кластера {2,3} и {5,6,7} и 5 отдельных элементов.
Введенная описанным образом кластеризованная ранжировка является бинарным отношением на множестве {1,2,3,...,10}. Его структура такова. Задано отношение эквивалентности с 7-ю классами эквивалентности, а именно, {2,3}, {5,6,7}, а остальные состоят из оставшихся 5 отдельных элементов. Затем введем строгий линейный порядок между классами эквивалентности. Введенный математический объект известен в литературе как "ранжировка со связями" (М. Холлендер, Д.Вулф), "упорядочение" (Дж. Кемени, Дж. Снелл), "квазисерия" (Б.Г.Миркин), "совершенный квазипорядок" (Ю.А. Шрейдер . Учитывая разнобой в терминологии введем термин "кластеризованная ранжировка",поскольку в нем явным образом названы основные элементы изучаемого математического объекта - кластеры, рассматриваемые на этапе согласования ранжировок как классы эквивалентности, и ранжировка - строгий совершенный порядок между ними. Следующее важное понятие - противоречивость. Оно определяется для четверки - две кластеризованные ранжировки на одном и том же носителе и два различных объекта - элементы того же носителя. При этом два элемента из одного кластера будем связывать символом равенства = как эквивалентные .
Пусть А и В - две кластеризованные ранжировки. Пару объектов (a,b) назовем ―противоречивой‖ относительно А и В, если эти два элемента по- разному упорядочены в А и В, т.е. a < b в А и a > b в В (первый вариант противоречивости) либо a > b в А и a < b в В (второй вариант противоречивости). Отметим, что в соответствии с этим определением пара объектов (a,b), эквивалентная хотя бы в одной кластеризованной ранжировке, не может быть противоречивой: a = b не образует "противоречия" ни с a < b, ни с a > b.
В качестве примера рассмотрим две кластеризованные ранжировки В = [{1,2} < { 3,4, 5} < 6 < 7 < 9 < {8, 10}], C = [3 < {1, 4} < 2 < 6 < {5, 7, 8} < {9, 10}]. Совокупность противоречивых пар объектов для двух кластеризованных ранжировок А и В назовем ―ядром противоречий‖ и обозначим S(A,B). Для рассмотренных выше в качестве примеров трех кластеризованных ранжировок А, В и С, определенных на одном и том же
носителе {1, 2, 3,..., 10}, имеем S(A,B) = [ (8, 9)], S(A,C) = [ (1, 3), (2,4) ] ,
программном нахождении ядра можно в поисках противоречивых пар
потом (3,4), ..., (3, k), и т.д., вплоть до (k-1, k).
Пользуясь понятиями дискретной математики, ―ядро противоречий‖ можно изобразить графом с вершинами в точках носителя. При этом противоречивые пары задают ребра этого графа. Граф для S(A,B) имеет только одно ребро (одна связная компонента более чем из одной точки), для S(A,C) - 2 ребра (две связные компоненты более чем из одной точки), для S(B,C) - 5 ребер (три связные компоненты более чем из одной точки {1, 2 , 3, 4}, {5, 6} и {8, 9}).
Каждую кластеризованную ранжировку, как и любое бинарное отношение, можно задать матрицей || x(a, b) || из 0 и 1 порядка k x k. При этом x(a, b) = 1 тогда и только тогда, когда a < b либо a = b. В первом случае x(b, a) = 0, а во втором x(b, a) = 1. При этом хотя бы одно из чисел
вытекает, что для нахождения всех таких пар достаточно поэлементно перемножить две матрицы ||x(a,b)|| и ||y(a, b)||, соответствующие двум кластеризованным ранжировкам, и отобрать те и только те пары, для которых x(a,b)y(a,b)=x(b,a)y(b,a)=0.
Предлагаемый алгоритм согласования определенного числа кластеризованных ранжировок состоят из трех этапов. На первом этапе выделяются противоречивые пары объектов во всех парах кластеризованных ранжировок. На втором этапе формируются кластеры итоговой кластеризованной ранжировки (т.е. классы эквивалентности - связные компоненты графов, соответствующих объединению попарных ядер противоречий). На третьем этапе эти кластеры (классы эквивалентности) упорядочиваются. Для установления порядка между кластерами произвольно выбирается один объект из первого кластера и второй - из второго, порядок между кластерами устанавливается такой же, какой имеет быть между выбранными объектами в любой из рассматриваемых кластеризованных ранжировок. Корректность подобного упорядочивания, т.е. его независимость от выбора той или иной пары объектов, вытекает из соответствующих теорем, доказанных в статье [2]. Два объекта из разных кластеров согласующей кластеризованной ранжировки могут оказаться эквивалентными в одной из исходных кластеризованных ранжировок (т.е. находиться в одном кластере). В таком случае надо рассмотреть упорядоченность этих объектов в какой-либо другой из исходных кластеризованных ранжировок. Если же во всех исходных кластеризованных ранжировках два рассматриваемых объекта находились в одном кластере, то естественно считать (и это является уточнением к этапу 3 алгоритма), что они находятся в одном кластере и в согласующей кластеризованной ранжировке.
Результат согласования кластеризованных ранжировок А, В, С,... обозначим f(A, В, С,...). Тогда ſ(А, в) = [1<2<3<4<5<6<7<{8, 9}<10], ſ(А, С) = [{1,3}<{2, 4}<5<6<7<8<9<10], ſ(В, С) = [{1,2,3,4}<{5,6}<7<{8,9}<10], ſ(А, В, С) = ſ(В, С) = [{1,2,3,4} <{5,6}<7<{8, 9}<10]. В случае ſ(А, В) дополнительного изучения с целью упорядочения требуют только объекты 8 и 9. В случае ſ(В, С) объекты 1,2,3,4 объединились в один кластер, т.е. кластеризованные ранжировки оказались настолько противоречивыми, что процедура согласования не позволила провести достаточно полную декомпозицию задачи нахождения итогового мнения экспертов.
Определим некоторые свойства алгоритмов согласования. Пусть D = ſ(А, В, C,...). Если a<b в согласующей кластеризованной ранжировке D, то a<b или a=b в каждой из исходных ранжировок А, В, C, ... Построение согласующих кластеризованных ранжировок может осуществляться поэтапно. В частности, f(A, B, C) = f(f(A, B), f(A, C), f(B, C)) .Видно, что ядро противоречий для набора кластеризованных ранжировок является объединением таких ядер для всех пар рассматриваемых ранжировок. Построение согласующих кластеризованных ранжировок нацелено на выделение общего упорядочения в исходных кластеризованных ранжировках. Однако при этом некоторые общие свойства исходных кластеризованных ранжировок могут теряться. Так, при согласовании ранжировок В и С, рассмотренных выше, противоречия в упорядочении элементов 1 и 2 не было - в ранжировке В эти объекты входили в одинкластер, т.е. 1 = 2, в то время как 1<2 в кластеризованной ранжировке С. Значит, при их отдельном рассмотрении можно принять упорядочение 1 < 2. Однако в f(B,C) они попали в один кластер, т.е. возможность их упорядочения исчезла. Это связано с поведением объекта 3, который "перескочил" в С на первое место и "увлек с собой в противоречие" пару (1, 2), образовав противоречивые пары и с 1, и с 2.То есть, связная компонента графа, соответствующего ядру противоречий, сама по себе не всегда является полным графом. Недостающие ребра при этом соответствуют парам типа (1, 2), которые сами по себе не являются противоречивыми, но "увлекаются в противоречие" другими парами.
Рассматриваемый метод согласования кластеризованных ранжировок построен в соответствии с методологией теории устойчивости [3], согласно которой результат обработки данных, инвариантный относительно метода обработки, соответствует реальности, а результат расчетов, зависящий от метода обработки, отражает субъективизм исследователя, а не объективные соотношения.
Литература
- Менеджмент. Учебное пособие. / Под ред. Ж.В. Прокофьевой. - М.: Знание, 2000. – С.288.
- Орлов А.И. Современная прикладная статистика // Заводская лаборатория. 1998. Т. 64. № 3. С.52-60.
- Кемени Дж., Снелл Дж. Кибернетическое моделирование: Некоторые приложения. - М.: Советское радио, 1972. – С.192.
- Орлов А.И. Эконометрика. Учебное пособие. - М.: Изд-во "Экзамен", 2002. – 530 с.