Таратылған деректер қорын басқару мəселелері
Бұл мақалада таратылған деректер қорын басқарудың басты мəселелері қарастырылады. Басты мəселе желі арқылы берілетін деректерді тиімді жолмен жіберу. Жалпы таратылған деректер қорын құрудың басты тапсырмасы желіні пайдалануды минимизациялау, желі арқылы берілетін хабарлама көлемі мен санын азайту. Аталған тапсырманы шешу бірнеше қосымша мəселелерді туындатады. Негізгі мəселелер төмендегі аймақтарда болуы мүмкін:
- сұранымдарды өңдеуде;
- каталогтарды басқаруда;
- жаңартуларды таратуда;
- қайта қалпына келтіруді басқару;
- параллельді басқару.
Таратылған деректер қорын жалпылама таратылған ақпараттық жүйе тақырыбынан бөлек қарастыру мүмкін емес. Ақпараттық интеграция жəне ақпараттарды бірнеше орталықтарға бөліп сақтау үрдістері ақпараттық жүйелер бойынша жүргізіліп жатыр. Қазақстанның географиялық орналасуы мен көлеміне қарай таратылған ақпараттық жүйелердің қажеттігі бірден көрінеді. Қазіргі жоғары деңгейлі дамыған технологиялар көмегімен нақты таратылған жүйелер құрылуда. Бұл жердегі ақпараттық жүйеде таратылған деректерді талдау, белгілі бір қалыпты формаларда беру басты тапсырма болып табылады. Таратылған ақпараттық жүйелер таратылған деректер қорына негізделіп жасалады. Көптеген коммерциялық ұйымдар ақпараттық жүйесін таратылған деректер қорында құрған. Таратылған деректер қорында мəліметтер желі арқылы біріктірілген əр түрлі есептеу жүйелерінде сақталады. Компанияның əрбір бөлімшесінде жеке деректер қоры болады жəне барлық деректер қоры мəліметтер таратуға арналған негізгі деректер қорымен жұмыс жасайды. Əр бөлімше жеке аймақтық желілеріне қосылған жеке деректер қорымен жұмыс жасайды. Сонымен қатар, бірнеше дерек қормен жұмыс жасайтын пайдаланушылар да ұйымдастырылады. Осындай жалпылама таратылған деректер қорында ақпараттарды беру, қабылдау, бірлесіп өңдеу кездерінде толық шешілмеген мəселелер бар. Алдыңғы қатарлы деректер қорын басқару жүйелерін шығарушылар таратылған деректер қорын тиімді басқаруға арналған көптеген өнімдерді ұсынуда. Сондай-ақ таратылған деректер қорын басқару жүйесі сұрақтарымен университеттер жəне үлкен көлемді ұйымдар айналысып, көптеген теориялық сипаттамалар жасалып жатыр. Жалпы таратылған деректер қоры басқару жүйесінің басты мəселелері ретінде төмендегілерді атап көрсетуге болады:
- таратылған транзакция;
- қауіпсіздік;
- əмбебап қатынау;
- өнімділіктің төменділігі.
Гетерогенді жүйелер. Деректерді басқару жүйесі əр түрлі архитектурамен жəне əр түрлі өнімділікті жұмыс станциялары, жергілікті есептеу жүйелеріндегі деректер қоры серверлерімен жұмыс жасауы керек.
Желіге қатысты айқындылық. Деректер қорын басқару жүйесі əртүрлі желілерде біркелкі жұмыс жасауы керек. Жүйенің өнімділігі деректердің желі арқылы берілуіне байланысты болмауы керек.
Таратылған сұранымдар. Пайдаланушы таратылған деректер қорындағы кез келген кестелердегі деректерді біріктіретін мүмкіндікті иемдену қажет. Деректер физикалық əр түрлі жүйелерде сақталған жағдайдың өзінде алынатын болуы керек.
Өзгерістерді үлестіру. Пайдаланушы өзіне берілген құқықтар бойынша əр түрлі деректер қоры кестесі мəліметтерін өзгерте алуы керек.
Деректердің тұтастығын сақтау мəселесі. Əр түрлі есептеу жүйелерінде жұмыс істейтін таратылған транзакцияның орындалуы «барлығы немесе ешқайсысы» ұстанымының сақталуы, екі немесе одан да көп деректер қорын басқару жүйелері бір-бірімен белсенді өзара əректеттесуі керек. Бұл үшін арнайы транзакцияның аяқтаудың екі фазалы хаттамалары пайдаланылуы қажет. Екі фазалы программалауда таратылған транзакцияға қатысатын деректер қоры бөлігінің желілік трафигін жоғарылатуға жəне ұзақ бұғаттауды орындайды.
Статикалық SQL сұранымдардың орындалу жоспарымен байланысты мəселелері. SQL-дің статистикалық құрылымы деректер қорында орындалу жоспары түрінде сақталады. Екі немесе одан да көп деректер қорындағы мəліметтерді біріктіргенде олардың қайсысы орындалу жоспарын сақтайды? Екі немесе одан да көп орындалу жоспары қажет пе? Егер бір деректер қоры құрылымы өзгеретін болса, онда басқа деректер қоры орындалу жоспарын өзгерту қажеттігі туындайды. Мұндай мəселелерде динамикалық SQL қолдану практика жүзінде желілік трафикте өнімділікті төмендетеді жəне көптеген қолайсыздықтарға алып келеді.
Оптимизациялау мəселесі. Деректерге желі арқылы қатынау кезінде SQL инструкциясын əдеттегі оптимизациялау ережесінде пайдалануға болмайды. Мысалы: жергілікті кестені толық сканирлеу қашықтағы кестеден индекс бойынша іздеуден тиімді (оптимальды). Оптимизациялау программасы желі параметрлерін білу қажет жəне де көп жағдайда жылдамдығын білу қажет. Жалпылама айтқанда таратылған деректер қорында оптимизациялау маңызды рөл атқарады, ал оның іске асуы күрделі мəселе.
Деректердің сəйкестік мəселесі. Əр түрлі есептеу жүйелерінде деректердің əр түрлі типтері қолданылады. Екі жүйедегі деректердің типтері бірдей болуы мүмкін, бірақ олардың форматтарында айырмашылық болу мəселесі. Мысалы: VAX пен Macintosh – та 16-разрядты сандар. Сандар əртүрлі беріледі. IBM компаниясының мейнфреймдарында символдар EBCDIC кодта берілсе, ал дербес компьютерлерде ASCII код қолданылады. Таратылған деректер қорын басқаруда бұл айырмашылықтар байқалмауы қажет.
Жүйелік каталогтарды сақтау мəселесі. Деректер қорын басқару жүйесі жұмысы кезінде өзінің жүйелік каталогтарына жиі қатынайды. Таратылған деректер қоры каталогын қайда сақтауға болады? Егер каталог бір жүйеде сақталса, онда каталогқа қатынау баяу жүреді. Егер каталогтарды əр бір жүйеге орналастырса, онда өзгерістерді каталогтарға таратуға жəне синхронизация жасауға тура келеді.
Əр түрлі өндірушілер өндірген жабдықтар. Өнеркəсіптің барлық деректерін басқару бір ғана типті деректер қорын басқару жүйесімен жұмыс жасауы мүмкін емес, таратылған деректер қорында бірнеше деректер қорын басқару жүйесі пайдаланылатындықтан олардың бірлесіп жұмыс істеуі үшін барлық жағынан сəйкес болуы талап етіледі.
Таратылған жүйенің тұйықталу жағдайы. Бұғатталған бір жүйедегі деректерге қатынаған кезде екі жүйеде бір уақытта транзакция орындалады. Таратылған жүйеде тұйықталу болуы мүмкін, бірақ əрбір екі жүйенің бірінде тұйықталу болмайды. Таратылған деректер қорында деректер қорын басқару жүйесі глобальды тұйықталуды табу қажет. Бұл желілік қосымшалардың координациясын күшейтуді талап етеді жəне өнімділіктің бірден төмендеуіне алып келеді.
Қалпына келтіру мəселесі. Егер таратылған деректер қорына кіретін жүйелердің бірінде бұзылу болса, онда жүйе администраторы желідегі басқа есептеу жүйесінен тəуелсіз қалпына келтіру процедурасын жүктеу мүмкіндігіне ие болу жəне қалпына келтірілген жүйе басқа жүйелермен синхронизациялануы керек.
ƏДЕБИЕТТЕР
- Распределенная обработка данных: курс лекций / Сост. Найханова Л.В. – Улан-Удэ, Издательство ВСГТУ, 2001. – 122 с.
- Карпов Л.Е. «Архитектура распределенных систем программного обеспечения», М., МАКС Пресс, 2007. Шифр библиотека МГУ: 5ВГ66, К – 265.
- Andrew S. Tanenbaum, Maarten van Steen. “Distributed Systems. Principles”. Prentice Hall, Inc., 2002 (Э. Таненбаум, М. Ван Стеен. «Распределенные системы. Принципы и парадигмы». СПб.: Питер, 2003)
- Системы управления базами данных и знаний: Справ.изд./ А.Н. Наумов, А.М.Вендров, В.К. Иванов и др.; Под ред. А.Н. Наумова.- М.:Финансы и статистика, 1991.- 352с.