Работа с плохо формализованной и слабо структурированной информацией

В статье рассматриваются проблемы создания специальных инструментов и соответствующих информационных сред для работы с плохо формализованной и слабо структурированной информацией. 

Привычные информационные технологии раньше имели дело с массивами структурированных данных и информации. Теперь информации становится много, она беспорядочна и разнопланова. Старые технологии     уже     не     работают.     Люди     стали     больше     взаимодействовать     между       собой и с информационными системами: обмен идеями становится более интенсивным, все больше возникает решений при совместной работе в сетях телекоммуникаций и больше пересылается актуальной информации при попытках создавать новые решения. Это уже совсем иная постановка задачи, чем организация документооборота. Кратко ситуацию можно охарактеризовать так: «От порядка в бизнесе к интеллектуальному управлению!». Проблема приобрела совершенно новое качество.

Реальная информация, которая может быть систематизирована в корпоративных хранилищах данных, имеет два основных источника: структурированный, например информация из базы данных, и неструктурированный - электронная почта, факсы, голосовая почта, презентации и различные файловые документы. Это говорит о том, что собраны горы информации, к которой невозможно подобраться [1].

Современные информационные и компьютерные технологии позволяют представить в цифровой форме и распространять практически любые виды информации, с которой люди привыкли работать на производстве, получать из СМИ, использовать в процессе управления в компаниях и на самых различных уровнях общественных организаций. Однако есть такие виды знаний, которыми овладеть не так-то просто. Например, как представить в цифровой форме и каталогизировать таланты или творческие способности современных специалистов с тем, чтобы их знания использовать в  коллективе? Стандартные базы данных не вмещают «сокровенных» знаний. В процессе понимания новых сущностей или порождения новых идей в голове у человека возникает поток интуитивных мыслей и образов. Интуитивные  образы  ассоциативны  и многосвязны,  при этом  они  очень  быстро  изменяются,  так что «уложить» их в традиционную структуру данных практически невозможно.

Для работы с плохо формализованной и слабо структурированной информацией необходимы специальные  инструменты   и  соответствующие  информационные  среды.  Инструменты  для    работы с плохо формализованной и слабо структурированной информацией должны быть рассчитаны на возможность быстрых изменений структур данных, редактирования форм и связей.

Что из себя представляет такая информационная среда? Это:

  1. возможность создавать произвольные  совокупности различных элементов - имен,  знаков, образов и т.п.;
  2. группировка элементов различными способами, изменение их состава;
  3. изменение количества системных уровней группировок элементов;
  4. установление произвольных ассоциативных связей между элементами и группами элементов;
  5. установление произвольных ассоциативных связей элементов с различными программными модулями и утилитами;
  6. установление произвольных ассоциативных связей элементов с процессами операционной системы;
  7. возможность работы с различными пространственными формами, цветовыми решениями, звуковыми эффектами, визуально-графическими изображениями и иными образами. 

Такие инструменты должны занимать промежуточное положение между разумом человека и базами данных. Иными словами, в процессе работы с интуитивными образами нет никакой пользы от любой сколь угодно точной информации, если отсутствует информационная среда и  инструменты, позволяющие такую информацию систематизировать. Проблема упорядочивания данных,   информации и знаний возникает в результате потребности создавать эффективные человеко-машинные комплексы для   решения   сложных   управленческих   задач   [2].   С   одной   стороны, компьютеры усиливают «интеллектуальный» потенциал  не  только  отдельно  каждого  человека,  но  и  группы  людей  в целом. С другой стороны, использование информационных технологий выводит людей на совершенно новые, более высокие уровни сложности решения задач, порождает новые сферы деятельности, которые раньше были недоступны даже пониманию.

Для того, чтобы конструктивно понять проблему структурирования данных, информации и знаний, необходимо   посмотреть   на   нее   в   комплексе.   Во-первых,   с   позиции   взаимодействия    человека с компьютером.  Во-вторых,  нужно  разобраться  с  терминологией  -  что  такое  данные,    информация и знания. В-третьих, нужно понять основные особенности человеческой памяти, мышления, разумного поведения и чем они отличаются от устройства и функционирования компьютерных систем.

Основной недостаток человеческой памяти - забывание мелких и не очень мелких фактов. Такое «качество» нам часто мешает на практике. С другой стороны, с психологической точки зрения, - это одно из достоинств нашей памяти, которое позволяет человеку адаптироваться к различным ситуациям, избегая  лишних  стрессовых  перегрузок.  Компьютерные  системы  такими  «недугами»  не    страдают. С памятью на мелкие детали и на долгосрочное запоминание у компьютеров все в порядке. В этом качестве компьютерные системы очень хорошо дополняют возможности человека. Однако такая неконтролируемая компьютерная способность неограниченного запоминания оборачивается серьезными проблемами поиска необходимой информации в больших массивах и ее упорядочивания.

Ввиду  радикального  различия  в  структурах,  принципах  и  формах  информационных  процессов у человека и компьютерных систем возникают очень сложные проблемы в реализации совместной работы  людей  и  компьютеров.  Использование  компьютерных  систем,  информационных  технологий и телекоммуникаций  порождает   целый   спектр   проблем,   свойственных   взаимодействию   человека с компьютером.

Проблема структурирования данных, информации и знаний является комплексной, и поэтому ее нужно решать как прикладную проблему на стыке многих отраслей знаний и технологий [3]. Данные – это основа информации, они относятся к способу представления, хранения и элементарным операциям обработки информации.

Придерживаясь концепции, что данные - это текст в некотором алфавите, то понятие структуры данных относится к синтаксическим правилам представления текстовых структур.

На уровне структуры данных можно выделить три аспекта работы с данными:

  1. Определение данных, используя правила структурирования, например порождающие грамматики.
  2. Манипулирование данными и их обработка: сбор, вычисление, преобразование, классификация данных.
  3. Управление данными (администрирование данных): сортировка, поиск, редактирование.

Например, файл - это последовательность из элементов одинаковой структуры – записей. В свою очередь запись представляет собой структуру, состоящую из полей. Поле – это минимальная именованная  структура  данных.  Пример  –  файл  «Библиотека»;  запись  –  «Книга»;  поля  –  «Автор» и «Название».

Анализируя понятие структуры данных, можно сделать простой вывод: данные – это структурированная и формализованная символьная структура, которую можно легко представить, например, в виде текста. Если данные - это текст в некотором алфавите, то информация – это рассказ, сообщение, сведения, имеющие определенный смысл.

Информация используется во всех областях человеческой деятельности. Установление любой коммуникации между людьми или координации их действий в группе возможны только благодаря обмену информацией. Для любой информации существует содержательная интерпретация. Человек не только по-своему структурирует информацию, когда формирует (посылает) сообщение, но и по-своему интерпретирует информационное сообщение, когда его получает. Качество передаваемой информации зависит от многих факторов: квалификации автора сообщения, его мотивации, целей, культурного уровня, степени погружения в проблемную область и т.д. Почти аналогичная ситуация возникает при получении информационного сообщения и его интерпретации. Качество интерпретации информационного сообщения также зависит от множества факторов и условий. Когда мы говорим об информации, то всегда должны иметь в виду отправителя и получателя, поэтому процессы подготовки информационного сообщения и его интерпретации очень неоднозначны.

Если рассматривать данные, то здесь самое важное - это их формальная структура, диктуемая жесткими синтаксическими правилами. Для хранения и передачи информации необходимы данные как основа информации. При таком понимании данные носят подчиненный характер относительно смыслового уровня информации. Но самое важное для информации - это ее смысл, который возникает в головах у людей в процессе и на всех этапах работы с информацией.

Структурирование информации - сложный и неоднозначный процесс, протекающий на более высоком системном уровне, чем работа со структурами данных. Структурирование информации многозначно из-за определяющего значения человеческого фактора как на стороне источника информации, так и на стороне получателя информации. Качество и форма  структурирования информации очень сильно зависят от личной заинтересованности (мотивации) участников коммуникации, от темпа и ограничений по времени и ресурсам, выделяемым на осуществление коммуникации.

Если информация - это рассказ, сообщение, сведения, имеющие определенный смысл, то знания - это нечто большее.

Знание это проверенная общественной практикой полезная информация, которая может многократно  использоваться  людьми  для  решения  тех  или  иных  задач.  Знания  -  это    информация в действии целеустремленной личности.

Структурирование знаний - это, прежде всего, структурирование информации, плюс структурирование действий целеустремленной личности. Поэтому структурирование знаний подразумевает две функции: первая - позволяет более эффективно думать и принимать решения, вторая функция - более качественно действовать. Думать и действовать это две различные формы активности личности. Обычно необходим переход от одной формы активности к другой. Говоря на языке активности целеустремленной личности, информация больше относится к обмену сообщениями в процессе принятия решений, а знание - это инструмент для решения проблемы.

Выводы:

  • Данные образуют структурную основу информации.
  • Информация как сообщение и объект анализа в процессе принятия решений образует основу знаний для целеустремленного человека.
  • Знание - это инструмент для решения проблемы целеустремленным человеком.

Таким образом, формализация и структуризация данных в человеко-машинных  системах – проблема  решаемая.   Формализация   и   структуризация   знаний   в   определенном   смысле   сводится к формализации и структуризации информации.

 

Литература

  1. Титоренко Г.А. Информационные технологии управления. - М.: ЮНИТИ-ДАНА, 2003. - 439 с.
  2. Гаврилова Т.А. Базы знаний интеллектуальных систем. - СПб.: Питер, 2001. - 382 с.
  3. Минский М. Структура для представления знаний /  В  кн.:  Психология  машинного  зрения. Ред. П. Уинстон. - М.: Мир, 1978. - С. 249-338.
Фамилия автора: А.Е. Семенова
Год: 2011
Город: Павлодар
Яндекс.Метрика