Бази от данни Съдържание Необходимост от бази от данни



страница1/11
Дата18.11.2017
Размер1.05 Mb.
Размер1.05 Mb.
  1   2   3   4   5   6   7   8   9   10   11

1.
 Бази от данни


Съдържание


  1. Необходимост от бази от данни

  2. Определение и характеристика

  3. Организация на данните в базата от данни

  4. Логическа структура

  5. Физическа структура

  6. Администриране на базата от данни

  7. Архитектура на базата от данни


 

1. Необходимост от бази от данни


До появата на ЕИМ от трето поколение (първите се появяват в 1965 г.), технологията на автоматизираната обработка на информацията се характеризира със създаването на отделни файлове за всяко приложение, като наред с това се използват отделни програми за създаване, актуализация и извличане на информация. С нарастване изискванията на потребителите за подобряване на информационното обслужване, проявявано като условие към информационните системи по отношение на количеството и съдържанието на желаната информация, се налага обхващане на нови данни и осигуряване на нови изходни форми, изискващи и нови видове обработки на данните. Същевременно броят на потребителите, желаещи да изпълняват своите служебни задължения като се базират на по-голям обем информация, непрекъснато нараства. В зависимост от потребностите им изходната информация е различна, но се основава на обработката на едни и същи данни. Това налага да се създават, съхраняват и поддържат за всяко едно приложение един или няколко файла, обслужвани от отделни програми. При това не е съществувала независимост между данните и програмите, и всяка промяна в данните или запомнящите устройства е налагало да се модифицират и използваните програми, или пък да се създават нови програми. Значителна част от данните се съхранявали и поддържали многократно, като се получавало значителното им дублиране, а това закономерно е водело до неоправдано нарастване на разходите за съхраняване и обработка. На рис. 1.1. е илюстрирано използването на отделни файлове за всяко приложение. При положение, че един потребител се нуждае от информация, включваща данните B, M и К, разположени в три различни файла, то задоволяването на неговите информационни нужди налага създаването на нов файл и нови програми, като това неминуемо довежда след себе си до увеличаване на степента на дублиране на данните В, М и К.

рис. 1.1.

Разгледаните проблеми са съпътствали технологията на автоматизираната обработка на информацията и непрекъснатия процес в развитието на ЕИТ – появата на външни запомнящи устройства с пряк достъп и усъвършенстването им, непрекъснатото развитие на програмното осигуряване и др., насочват към прилагането на нов подход за организацията и използването на данните. Този подход позволява да стане реалност еднократното овхващане, съхраняване и поддържане на данните и осигуряването на възможност за тяхното използване от различни потребители при минимални разходи на средства и време. Това може да бъде реализирано, ако данните се организират като база от данни, което позволява да се постигне следното: да се намали рязко дублирането на данните, съхранявани върху технически носители; да се постигне независимост на данните от програмите, които ги използват, така че данните да могат да се изменят без да се изменят програмите; независимост между отделните програми, които използуват едни и същи данни; да се осигури възможност за търсене и извличане на данните, без да е необходимо създаването на програма на алгоритмичен език; да се намалят разходите по съхраняване и поддържане на данните; лесно и удобно да се реализират процесите, свързани с разширяването и изменението на данните.

На рис. 1.2. е посочено използване на данните при база от данни.



рис. 1.2.




 

2. Определение и характеристика


Могат да бъдат приведени множество различаващи се едно от друго определения за базите от данни, които в различна степен разкриват съдържанието на понятието. Като работно определение ще приемем дефиницията, според която под база от данни се разбира: “Съвкупност от взаимосвързани данни, съхранявани заедно с управляема повторяемост, която допуска тяхното оптимално използване за едно или няколко приложения; данните се запомнят така, че да бъдат независими от програмите, които ги използват; за добавяне на нови или модифициране на съществуващите данни, а така също за търсене на данните в базата от данни, се използва общ управляващ способ”.

Определението може да бъде разширено, като се посочат и основните характеристики на базата от данни: независимост между логическата и физическата структура на данните; минимална управляема повторяемост на данните; пълна независимост на програмите на потребителите от структурите на данните; многократно използване на данните за задоволяване на информационните нужди на потребителите; лесна и гъвкава актуализация и употреба на общи методи за достъп до данните; възможност за бърза обработка на постъпили заявки за информационно обслужване; прилагане на единни методи за защита на данните от унищожаване, промяна и неправомерен достъп до тях; възможност за осъществяване на произволни връзки между съхраняваните данни.

Въплътяването на посочените характеристики се извършва при проектирането на логическата и физическата структура на базата от данни и чрез използваната СУБД.

Основните термини (елементи), използвани при описването на данните от гледна точка на приложния програмист, подредени във възходящ ред, са (вж. рис. 1.3.):



рис. 1.3.

-        елемент данни (поле) – най-малката единица именувани данни и може да се състои от произволно количество битове или байтове;

-        сегмент (група полета) – именувана съвкупност от полета от записа, разглеждани като едно цяло (логически свързани помежду си);

-        запис – именувана съвкупност от сегменти или елементи;

-        файл – набор от данни – именувана съвкупност от всички записи от даден тип.

Например, елемент данни (поле) може да бъде една величина от фактура. Сегмент (агрегат от данни) може да бъде един ред от фактурата. Цялата фактура може да бъде разглеждана като логически запис. Файлът (набор от данни) може да бъде съвкупност от всички фактури.

Базите от данни могат да бъдат класифицирани по различни признаци. Според характера на съдържащите се в тях данни те биват: форматирана база от данни (при която се знае точно структурата на съставящите я файлове); неформатирана база от данни.



Според функционалното си предназначение са: информационни бази от данни, които се изграждат при създаване на информационно-търсещи и информационно-справочни системи; оперативни бази от данни, създадени при информационно-управляващи системи; архивни бази от данни.

Според логическата организация на данните базите от данни са с: йерархична (дървовидна), мрежова и релационна структура на данните.

Според физическото разположение на данните: централизирани, децентрализирани и разпределени бази от данни.


 

3. Организация на данните в базата от данни


Базата от данни позволява да съществува известно различие между формата и начина, по който данните са действително запаметени върху техническите носители на информация, от формата, в която те се предоставят за използване от приложните програми. Данните с които работи приложната програма се наричат логически, а същите данни, разположени върху физическия носител на информация, се наричат физически. Тези понятия се въвеждат, за да бъдат разграничени различните аспекти на използуването на данните: логически за програмиста и физически за ЕИМ. Различават се още: логическа и физическа организация на базата от данни; логическо и физическо проектиране; логически и физически файлове; логически и физически връзки между данните; логическо и физическо описание на данните. Пример за физическа и логическа организация на данните е показан на рис. 1.4.

рис. 1.4.

Логическата структура на базата от данни, в общия случай, е твърде сложна и динамична, затова следва да се осигури възможност за изменение на общата логическа структура без изменение на използваните програми. В тази връзка е необходимо да съществуват две нива на назависимост на данните: логическа и физическа независимост на данните.

Логическата независимост на данните означава, че общата им логическа структура може да бъде изменена, без да се променят използваните програми (изменението, разбира се, не трябва да се състои в отстраняване от базата от данни на такива елементи, които се използват от програмите).

Физическата независимост на данните означава, че физическото разположение и организация на данните могат да се изменят, без това да налага изменение на общата логическа структура на данните или програмите.

Добавянето на нови данни в един запис, без изменение на програмите, е възможно, когато те работят на ниво поле, а не на ниво запис. Логическото описание на данните за един програмист може да съдържа елементи, различни от тези на друг програмист. Физическият запис обаче съдържа и двете групи елементи. Така от едни и същи данни могат да бъдат формирани различни логически файлове за различни приложения.

Организацията на данните е следствие на изложеното за видовете данни и съображението за независимост на данните по отношение на тяхното използване. Съществуват три типа организация на данните, силно разграничаващи се един от друг (рис. 1.5.): файлова организация на данните; обща логическа организация на данните; физическа организация на данните.

Файловата организация на данните е свързана с представянето на данните, така както ги вижда приложният програмист и той описва своята представа (своята гледна точка) за файла и приложната програма.

Общата логическа организация на данните е свързана със структурата на цялата база от данни, от която могат да се получат различни файлови организации. Логическото им представяне е напълно независимо от тяхната физическа организация и се описва чрез езика за описание на данните, който е част от програмните средства за управление на базата от данни.

Физическата организация представя разположението на данните върху външните запомнящи устройства. Тя зависи от използваните средства за търсене на записи и от вида на външните запомнящи устройства.



 

4. Логическа структура


Логическата структура на базата от данни по своята същност е представяне на логическите връзки, съществуващи между съставните елементи на базата от данни. Според характера на тези връзки съществуват следните видове структури:

рис. 1.5.



Иерархична (дървовидна) – характеризира се с това, че елемент от горно ниво е свързан с един или повече елементи от долно ниво. Същевременно всеки елемент от долно ниво е свързан само с един елемент от горно ниво. В литературата често се употребяват понятията “пораждащ” и “породен”, като пораждащият елемент е винаги от по-горно ниво. Елементите, които не са пораждащи, се наричат “листа”.

Мрежова структура – при нея всеки елемент от структурата може да бъде свързан с всеки друг елемент. Мрежовата структура също може да се представи с помощта на пораждащи и породени елементи, като породените се поставят по-ниско от пораждащите. [1]

Релационна структура – основно преимущество на релационната структура е нейната еднородност. Всички данни се разглеждат като съхранявани в таблици, в които всеки ред има един и същи формат. Всеки ред от таблицата представя обект от реалността или отношение между обекти.

Да разгледаме следния пример:

Влакове (разписание на влаковете)


Номер

Нач. гара

Крайна гара

Час на тръгв.

Час на прист.

83

Свищов

Левски

11.30

12.30

84

Левски

София

12.35

15.40

109

Русе

София

15.00

20.00

213

София

Пловдив

11.00

13.00

214

Варна

София

14.05

20.55
 

 

 



 

 

 



 

Кое е интересното в това разписание? Всеки ред от таблицата представя съвкупност от значения, взети от всеки стълб на таблицата. Има ограничение над данните, които могат да се появят в отделен стълб. Стълба с име “Нач. гара” може да съдържа само името на гарата, намираща се на съответната линия, стълба “Час на пристигане” съдържа час от денонощието. Информационното съдържание на отделният ред не зависи от подреждането на стълбовете. Стълбовете “Час на тръгване” и “Час на пристигане” могат да си сменят местата в таблицата, без това да повлияе на информационното й съдържание.

Представеното в таблицата “Влакове” е пример за отношение (таблица). Формата на отношението се определя от множеството на имената на стълбовете {Номер, Начална гара, Крайна гара, Час на тръгване, Час на пристигане}. Тези имена се наричат атрибути. На всеки атрибут се съпоставя множество от допустими значения за съответният стълб. Това множество се нарича домен на даденият атрибут. Домен на атрибута “Номер” може да е кое да е едноразрядно, двуразрядно или триразрядно число. Всеки ред на отношението представя множество от значения, взети по едно от домена на всеки атрибут. Всеки ред на отношението се нарича кортеж, като в примерното отношение “Влакове” има 5 кортежа. Кортежите на отношението образуват множество, тъй като редовете не се дублират. В множеството от имена на атрибутите на отношението съществува такова подмножество, чрез което кортежите на отношението могат да бъдат определени еднозначно от определено значение на съответните атрибути на подмножеството. Такова подмножество се нарича ключ на отношението. За нашето примерно отношение, {Номер} се явява ключ.[2]



[1]  За подробности относно йерархичната и дървовидна структури, вж. Трайков, Б. Системи за управление на бази от данни, Свищов, 1992,  254 с.

[2]  За тези които се интересуват от формализацията на отношенията, настолна книга би могла да бъде: Майер, Д. Теория реляционных баз данных: Пер. с англ. –М.: Мир, 1987. –607 с. с ил.

Монография американского специалиста, содержащая систематическое изложение теоретических результатов по математическому моделированию баз данных. В ней отражены современные направления исследований по реляционным базам данных: базы данных с частичной информацией, их семантика, зависимость данных.




 

5. Физическа структура


Физическата структура на данните представлява разположението на данните и съществуващите между тях връзки на техническите носители на информация, както и използваните методи за адресация (търсене) на данните.

Основните изисквания към физическата организация на данните са необходимостта от икономия на външна памет и осигуряване на възможност за бързо намиране и прочитане на записите. Тези две изисквания определят съществуващото разнообразие на физически структури, които се използват от програмистите за представянето на схемите и подсхемите на базата от данни. Тъй като към физическата организация има отношение програмното осигуряване, то простотата, към която е стремежът при логическата организация, тук не е от съществено значение. Техническите характеристики на съществуващите външни запомнящи устройства дават възможност да бъдат използвани и много сложни физически структури на данните, използващи множество указатели и индекси.

Дървовидните логически структури се представят във физическа структура чрез следните методи за организация:

1. Списъчни структури (свързани списъци).

Тези структури са използвани през първите години на експлоатация на ЕИТ. Дървовидните структури обикновено се представяли посредством последователно разполагане на данните върху техническия носител на информация. Последователността на елементите е от “горе-на-долу” и “отляво-надясно”. Този метод е залегнал в йерархично-последователния метод на достъп HSAM на фирмата IBM. Като разновидност на този начин на физическа организация на данните са списъчните структури с препълване и с разпределение на свободната памет.

2. Указатели (верижна организация).

При разполагане на данните върху техническия носител се налага, понякога, физическата последователност на записите да се определя от тяхната логическа последователност. В такива случаи последователните файлове, чрез които се реализира дървовидната логическа структура, използват указатели за връзки между записите, които могат да бъдат: указатели към производни, изходни и подобни записи.

3. Кръгови структури.

При този метод също се използват указатели, които се включват в кръгова структура, която се образува от указатели към подобни или изходни записи. Един запис може да има няколко указателя. Свеждане броят на указателите до един води, не само до икономия на памет, но и до увеличаване на времето за търсене на необходимите данни.

4. Справочници (индексни таблици).

Досега разгледаните методи предполагаха включването на указателя в записа. Възможно е, за някои приложения, те да бъдат отделени.

Справочникът е файл, в който се съхранява информацията за връзките между записите за други файлове.

Поради факта, че тази част от справочника, която има отношение към даден конкретен въпрос, може да бъде разположена в оперативната памет (поради малкия си обем), то търсенето на необходимите данни може да се осъществи за много кратко време.

Мрежовите структури се реализират физически чрез използване на следните методи:

1. Верижна списъчна организация. Всеки запис (без запис от първо ниво) съдържа указатели за връзка към горното и долното ниво.

2. Списъчна организация с променливи указатели. Характеризира с това, че указателите се съдържат в записите, с които започва структурата (записи от първо ниво).

3. Кръгови структури. При тях се използват указатели към изходни и породени записи. Като недостатък се посочват трудностите, които възникват при възстановяването на базата от данни (ако е унищожен или повреден един указател, то вече е невъзможно да се проследи последователността на записите).

4. Справочници (индексни таблици). По същество методът е аналогичен на този при дървовидните структури.

Най-често използвани методи за адресация (търсене) на данните са:

1. Последователно търсене. Необходимият запис се търси по ключ, като се чете последователно всеки запис.

2. Блоково търсене. Търсенето става в определен диапазон (блок) от предварително зададени стойности на ключове на записите.

3. Двоично търсене. Използва се, когато записите са сортирани по ключ. Търсенето започва от средата на областта, в която се издирва определен запис.

4. Индексно-последователно търсене. При него се използва таблица, наречена индекс. Когато се осъществи обръщане към таблицата, като вход се задава ключът на търсения запис и в резултат се получава относителният или действителният адрес на необходимия запис във външната памет. Търсенето на необходим запис в неподреден (несортиран) масив може също да се осъществи чрез използване на индекси. В този случай е необходим голям по размер индекс, тъй като е нужно да се помни по един елемент за всеки запис от файла, а не за блок от записи.

5. Търсене чрез ключ, еквивалентен на адрес. В теорията на автоматизираната обработка на информацията са известни редица методи за преобразуване ключа в адрес на записа. Най-простото решение е във входното съобщение да се посочи направо физическият адрес, по който да се извърши търсенето.

6. Търсене чрез преобразуване на ключа в адрес. При този метод се използват различни алгоритми за преобразуване на ключа в адрес, по който да се намери необходимият запис.

7. Рандомизация. За метода е характерно, че ключът се преобразува в квазислучайно число, което се използва за определяне местоположението на записа.



 

6. Администриране на базата от данни


Администрирането на базата от данни представлява съвкупност от дейности (функции), изпълнявани от едно или група лица, наречени "администратор на базата от данни", при изграждането и експлоатацията на базата от данни с оглед задоволяване информационните нужди на потребителите.

Задълженията на администратора на базата от данни се свеждат до:

1. Определяне на информационното съдържание на базата от данни. В задълженията на администратора на базата от данни влиза вземането на решение за това, каква информация трябва да се съхранява в базата от данни т.е., той да идентифицира обектите, представляващи интерес за потребителите, и да определи каква информация трябва да се съхранява за тях. След това администраторът на базата от данни трябва да определи съдържанието й, като опише концептуалната схема, използвайки специален език. Обектната (компилирана) форма на схемата ще бъде използвана от СУБД при отговори на постъпили от потребителите въпроси. Изходната (некомпилирана) форма се използва като справочен документ от потребителите на информация.

2. Определяне структурите за съхранение на данните и стратегиите на достъп. Администраторът на базата от данни решава по какъв начин данните трябва да бъдат представени в базата от данни и трябва да зададе представянето, като напише определение на структурата за съхранение на данните. Допълнително трябва да се посочи съответствието между определението на структурата за съхранение на данните и концептуалната схема. За тази цел се използва специален език, наречен език за описание на данните.

3. Взаимодействие с потребителите. В задълженията на Администратора на базата от данни влизат: установяване на връзка с потребителите на информация, осигуряването им с необходимите данни и написването на външните схеми. Тъй като предназначението на външните схеми е потребителите да получат представа за необходимите им данни, съществуват различни езици за написването им. Например езикът за написването на схемите, който ще се използва при прилагането на алгоритмичния език PL/I, трябва да съответствува на структурата на PL/I.

4. Определяне достъпа до базата от данни. Контролирането му може да се разглежда като логическо продължение на концептуалната схема. Езикът за описание на данните съдържа средства за осъществяването на необходимия контрол при достъпа до базата от данни.

5. Определяне на стратегията при дублиране и възстановяване. Поради факта, че в своята работа потребителите разчитат на задоволяване информационните си нужди от базата от данни, успешната им дейност непосредствено зависи от успешното й функциониране.

При повреждане на част или на цялата база от данни, предизвикано от: грешки на обслужващия персонал, неправилна работа на оборудването или на операционната система, необходимо е администраторът на базата от данни да може да възстанови данните, а ако това е възможно - с минимум влияние върху останалата част на базата от данни (например, достъпа до данните, които не са били повредени трябва да бъде съхранен). Администраторът на базата от данни трябва да определи и реализира съответна стратегия за възстановяване, включваща например, периодично записване на базата от данни върху резервни магнитни ленти и съответни процедури по зареждане на разрушената част на базата от данни от последната, съдържаща актуална информация, магнитна лента.

6. Ефективно управление на базата от данни и бърза реакция при настъпване на изменения в изискванията. Администраторът на базата от данни отговаря за поддържане на оптимална организация на базата от данни, при която е възможно да се постигне желаната производителност, и за съответното поддържане на базата от данни, отговарящо на измененията в изискванията на потребителите. Всички изменения в съхраняваните данни или достъпа до тях трябва да се съпровождат от съответни изменения в определеното представяне в паметта, по такъв начин, че концептуалната схема да не бъде изменяна.

За да бъде възможно администраторът на базата от данни да изпълни това свое задължение, на него му е необходим комплекс от помощни програми. Те са съществена част на всяка съвременна СУБД. Комплексът може да включва следните примерни програми: програми за зареждане (за начално създаване на базата от данни); програми за реорганизации (например, за реорганизация на базата от данни с цел да се освободи мястото, заето от ненужни данни); програми за водене на журнал (за водене на статистика за използването на базата от данни, програмите и изчислителните мощности и на потребителите, реализирали това използване); програми за възстановяване (на базата от данни в нейното първоначално състояние след повреда в оборудването или неправилна работа на програма).

Един от най-важните инструменти в ръцете на администратора на базата от данни е речникът на данните. В действителност той е също база от данни, която съдържа "данни за данните" (описанието на другите обекти в базата от данни). Например в речника на данните се съхраняват физически всички схеми (външна, концептуална, вътрешна) както в изходна, така и в обектна форма, а и определения на съответствията, процедурите по проверка на достоверността, контрола за правото на достъп (ако не е включен в концептуалната схема).

Речникът на данните е жизнено важна съставна част на базата от данни, при положение, че той се поддържа през цялото време в съответствие с текущото състояние на базата от данни. За работата на администратора на базата от данни, речникът играе важна роля. Например влиянието на всички предполагаеми изменения в базата от данни може да бъде бързо определено с помощта на речника на данните.



 

7. Архитектура на базата от данни


Изхождайки от основната идея на базите от данни, а именно осигуряване независимост на данните (логическа и физическа), можем да опишем общата й архитектура (която води до определени изисквания към структурата на въвежданите и съхраняваните данни и определя стратегията за достъп до тях). Не всяка база от данни може точно да съответствува на тази архитектура, но тя е достатъчно обща и отговаря на голямо количество бази от данни. Показаната на рис. 1.6. архитектура се съгласува и с архитектурата на базите от данни, предложена от Специализираната група по СУБД към Американския национален институт по стандарти (ANSI/SPARC Study Group on Data Base Management Systems).

рис. 1.6. Архитектура на бази от данни (по ANSI/SPARC)

 

Архитектурата е разделена на три основни нива:

- вътрешно

- концептуално

- външно

Вътрешното ниво е най-близко до физическата памет. Външното ниво е най-близко до потребителите, т.е. свързано е с това, как отделните потребители си представят съхраняваните данни. Концептуалното ниво е "междинно ниво" между другите две. Ако външното ниво е свързано с отделните представи (виждания) на потребителите, то концептуалното ниво може да се представи като обобщени представи на потребителите. В общия случай може да съществуват много "външни представяния", всяко от които се състои (представя) части на базата от данни, и може да съществува едно "концептуално представяне", валидно за цялата база от данни.

Потребителите на базата от данни са или приложни програмисти, или потребители, работещи с терминали или микрокомпютри, притежаващи различно ниво на подготовка в областта на автоматизираната обработка на информацията. На всеки потребител е предоставен интерфейсен език (при големи и мини-ЕИМ). За приложния програмист той може да бъде алгоритмичен език (COBOL, PL/I), докато на потребителя, работещ на терминал, може да бъде предоставен език, разработен, като се отчитат неговите потребности. Важното в случая е, че езикът на потребителя включва подезик на данните, който е подмножество на интерфейсния език и служи за извличане на информация от базата от данни. В действителност, подезикът на данните се съдържа в базовия език, докато за потребителя двата езика са неразличими.



За нуждите на всеки потребител се осигурява работна област, която се използва за приемане или предаване на данните между потребителя и базата от данни. За приложния програмист като работна област се явява областта за вход/изход. За потребителя, работещ с терминал, тази област се състои от работна памет, отделена от терминала.

Отделният потребител като правило се интересува само от една конкретна, малка част от цялата база от данни. Освен това, представите на потребителя за тази част на базата от данни ще бъдат абстрактни по отношение на това, как физически се съхраняват данните, т.е. потребителят си представя базата от данни посредством външния модел на данните. Външният модел по този начин се явява информационното съдържание на базата от данни във вида, в който си го представя конкретният потребител. Например служителите от отдел "Материално-техническо снабдяване" работят с тази част от информацията, свързана с техните задължения като: наличността на материали, разпределението им по складове, очакваните постъпления от материали през определен период от време и т.н., но не се интересуват от кадрите, които изпълняват тези дейности.

Всеки външен модел се определя посредством външна схема, която обикновено се състои от описание на всички типови външни записи за този външен модел. Например типът на външния запис за един служител може да бъде определен като поле за 4-разрядния номер на служителя, плюс 30-буквено поле за неговото име и т.н. Тези модели са известни и като подсхеми.

Концептуалният модел (моделът на съхраняваните данни) е представяне на пълно информационно съдържание на базата от данни в абстрактна форма в сравнение със способите за физическо съхранение на данните. То може напълно да се различава от показването на данните на отделните потребители. В действителност, това представяне на данните по-скоро е близко до данните такива каквито са, отколкото разбирането, което имат потребителите за тях, под влияние например на конкретния език или техническите средства, които потребителите използват. Концептуалният модел се състои от множество различни типове концептуални записи. Например концептуалният модел може да се състои от съвкупност от следните записи: за отделите, за служителите, за доставчиците на материали, за материалите и т.н. Моделът се определя посредством концептуална схема, която включва определения за всеки тип концептуални записи. За да се постигне необходимата независимост на данните, тези записи не трябва да бъдат обвързани със структурата на съхранение на данните или стратегията за достъп, а те трябва да определят само информационно съдържание. В тези определения не бива да има препращания към физическата последователност на съхраняване, индексиране и др. Ако концептуалната схема действително осигурява независимост на данните, то външните схеми ще бъдат също независими от данните.

Концептуалният модел представя общото съдържание на базата от данни, а концептуалната схема определя това представяне. Освен това в концептуалната схема се включват много други допълнителни характеристики например за контрол на достъпа до данните и други.

Третото ниво на архитектурата е вътрешното ниво. Вътрешният модел представлява най-ниското ниво на цялата база от данни и се състои от различни екземпляри на типовете вътрешни записи. Вътрешният модел се описва посредством вътрешна схема, която не само определя различните типове съхранявани записи, но и това, какви индекси съществуват, как са представени съхраняваните полета, каква е физическата последователност на съхраняваните записи и т.н.

Изображението "концептуално-вътрешно" определя съответствието между модела на данните и съхраняваната база от данни. То показва как концептуалните записи и полета се отразяват в съхраняваните копия. Ако структурата на базата от данни се измени (структурата на данните), изображението "концептуално-вътрешно" трябва съответно да бъде изменено така, че концептуалната схема да остане непроменена.

Изображението "външно-концептуално" определя съответствието между един конкретен външен модел и модела на данните. В общия случай между тези две нива могат да съществуват същите различия, както между модела на данните и базата от данни. Например полетата могат да притежават различни типове данни, записите могат да бъдат подредени по различен начин и т.н. Няколко външни модела могат да съществуват едновременно; няколко потребители могат заедно да използват даден външен модел, различните външни модели могат да се пресичат.

Между нивата в архитектурата на базата от данни съществува единство в зависимост от етапите, целите и състоянието на информацията в базата от данни.

Архитектурата на базата от данни може да се представи чрез схема и подсхема, съгласно CODASYL.

Схемата представлява пълно описание на всички съдържащи се в базата от данни елементи, съществуващите между тях връзки, наименованията на логическите масиви, сегменти и полета. Чрез подсхемата се прави описание само на част от елементите на базата от данни, които са необходими за отделно конкретно приложение, използващо една или няколко програми. На ниво "подсхема" се осигурява необходимата защита на данните и се постига независимост на програмите от физическата структура на данните.

На базата на една схема да бъдат построени множество подсхеми.

2.
Системи за управление

на бази от данни (СУБД)




Сподели с приятели:
  1   2   3   4   5   6   7   8   9   10   11


©zdrasti.info 2017
отнасят до администрацията

    Начална страница