一、數(shù)據(jù)關(guān)系
關(guān)系數(shù)據(jù)庫可能存在的問題
1.數(shù)據(jù)冗余(必然存在,但應(yīng)該盡量少)
2.更新冗余
3.插入冗余
4.刪除冗余
數(shù)據(jù)依賴(屬性之間以值是否相等體現(xiàn)出來的一種約束關(guān)系)
1)函數(shù)依賴(給定元組中的一些屬性,可確定另外的屬性必然的取值--一個(gè))
--非平凡的函數(shù)依賴:Y依賴于X,Y不包含于X
--平凡函數(shù)依賴:Y依賴于X,且Y包含于X
--互相函數(shù)依賴:X依賴于Y,Y依賴于X
--完全函數(shù)依賴:Y依賴于X,但Y不依賴與X的任意真子集
--部分函數(shù)依賴:Y依賴于X,且Y不完全依賴于X
--傳遞函數(shù)依賴:Y非平凡依賴于X,且Y與X不是互相函數(shù)依賴,Z非平方依賴于Y,則Z對X傳遞依賴
2)多值依賴(給定元組中的一些屬性,可確定另外的屬性可能的取值--一組)
--含義:X, Y, Z三個(gè)屬性集之和是屬性集U,多值依賴X->->Y成立當(dāng)且僅當(dāng)對R(U)的任一個(gè)關(guān)系r,r在(X,Z)上的每個(gè)值對應(yīng)一組Y的值,這組值僅決定于X值而與Z值無關(guān)。
--平凡的多值依賴(集合屬性中分為兩個(gè)真子集):Z=空集
--非平凡的多值依賴:Z≠空集
--對稱性:若Y多值依賴于X,則Z也多值依賴于X
--傳遞性:若Y多值依賴于X,Z多值依賴于Y,則X多值依賴于Z-Y
--若Y依賴于X,則Y也多值依賴于X
碼(一碼定一組)
--候選碼:屬性集合完全函數(shù)依賴于候選碼(候選碼是不可分割的主屬性集合,分了就不是候選碼了),主碼是候選碼,候選碼不一定是主碼
--超碼:屬性集合部分函數(shù)依賴于超碼
--主屬性:包含在候選碼中的屬性
--非主屬性:不包含在任何候選碼中的屬性
--全碼:整個(gè)屬性組都是主碼或者候選碼
--外碼:本關(guān)系模式中某個(gè)屬性或?qū)傩越M是非碼,但這個(gè)屬性或者屬性組是另一個(gè)關(guān)系模式的碼
二、范式(低一級(jí)范式關(guān)系模式可以通過模式分解轉(zhuǎn)換成多個(gè)高一級(jí)的關(guān)系模式的集合)
第一范式(1NF):每個(gè)分量都是不可分的基本數(shù)據(jù)項(xiàng)
--意義:關(guān)系數(shù)據(jù)庫的基本要求,防止出現(xiàn)表中表的情況,當(dāng)然某些時(shí)候這也是可以做出讓步的,比如個(gè)人表的家庭住址╮(╯▽╰)╭
--設(shè)計(jì):每列都是基本數(shù)據(jù)項(xiàng),原子數(shù)據(jù)
第二范式(2NF):若R∈1NF,且每個(gè)非主屬性完全函數(shù)依賴于任何一個(gè)候選碼
--意義:在第一范式的基礎(chǔ)上消除了非主屬性對碼的部分函數(shù)依賴,從而減少了數(shù)據(jù)冗余、更新異常、插入異常和刪除異常
--設(shè)計(jì):碼的真子集不是碼
第三范式(3NF):若R∈2NF,且R中不存在非主屬性對碼的傳遞依賴(一般走到這)
--意義:在第二范式的基礎(chǔ)上消除了非主屬性對碼的傳遞依賴,從而減少了數(shù)據(jù)冗余、更新異常、插入異常和刪除異常
--設(shè)計(jì):表中主鍵是唯一碼(或者本表僅僅有兩個(gè)碼,且兩碼互為補(bǔ)集)、若外碼存在,則外碼應(yīng)是其原表的主鍵
BCNF(擴(kuò)充的第三范式):若R∈1NF,當(dāng)Y非平凡函數(shù)依賴于X時(shí),X必有碼
--意義:第三范式的基礎(chǔ)上消除主屬性對于碼的部分依賴與傳遞函數(shù)依賴,減少了刪除異常、插入異常和更新異常
--設(shè)計(jì):不同主屬性相互無依賴關(guān)系
第四范式(4NF):若R∈1NF,當(dāng)Y非平凡多值依賴于X時(shí),X必有碼
--意義:屬性之間不允許有非平凡且非函數(shù)依賴的多值依賴,減少維護(hù)數(shù)據(jù)一致性的工作
--設(shè)計(jì):兩個(gè)互補(bǔ)的屬性集合,且都是碼,即全碼,才允許有多對多的關(guān)系出現(xiàn),否則本表只允許一對一的函數(shù)依賴關(guān)系
第五范式(5NF):將表切割成盡量小的塊,排除所有的冗余(一般不會(huì)走到這步)
三、數(shù)據(jù)依賴的公理系統(tǒng)(Armstrong公理系統(tǒng))
設(shè)U為屬性集總體,F(xiàn)是U上的一組函數(shù)依賴,于是有關(guān)系模式R<U,F>,對R<U,F>有以下推理規(guī)則:
自反律
若Y?X?U,則X→Y為F所蘊(yùn)含
增廣律
若X→Y為F所蘊(yùn)含,且Z?U,則X∪Z→Y∪Z為F所蘊(yùn)含
傳遞律
若X→Y為F所蘊(yùn)含,且Y→Z為F所蘊(yùn)含,則X→Z為F所蘊(yùn)含
合并規(guī)則
若X→Y,X→Z,則 X→Y∪Z
分解規(guī)則
若X→Y, 且Z?Y,則X→Z
偽傳遞規(guī)則
若X→Y,WY→Z,則WX→Z
函數(shù)依賴集等價(jià)
--若F的函數(shù)依賴集閉包=G的函數(shù)依賴集閉包,則說F覆蓋G,反之亦可,也可以說F與G等價(jià)
閉包(函數(shù)依賴集,屬性集)
--函數(shù)依賴集的閉包:在關(guān)系模式<R,F>中為F所邏輯蘊(yùn)含的函數(shù)依賴的全體稱為F的閉包
--屬性集的閉包:在關(guān)系模式<R,F>中,能由F根據(jù)Armstrong公理導(dǎo)出的對X函數(shù)依賴的所有屬性集的并集稱為X關(guān)于函數(shù)依賴集F的閉包
Armstrong公理是有效的,完備的:
--有效性:由F出發(fā),根據(jù)Armstrong公理推導(dǎo)出來的每一個(gè)函數(shù)依賴一定在F的閉包中
--完備性:F的函數(shù)依賴集的閉包的每個(gè)函數(shù)依賴,必定可以由F出發(fā)根據(jù)Armstrong公理推導(dǎo)出來
極小依賴集
--F中任一函數(shù)依賴表達(dá)式的箭頭右邊只有一個(gè)屬性,即是說F中的每個(gè)函數(shù)依賴都只能決定一個(gè)屬性,沒有冗余的被決定屬性
--F中不存在函數(shù)依賴X→A使F等價(jià)F-{X→A},即是說F中的函數(shù)依賴都是不可缺少的,換句話說F中沒有冗余的函數(shù)依賴
--F中不存在函數(shù)依賴X→A,Z?X,使F-{X→A}∪{Z→A}與F等價(jià),即是說函數(shù)依賴表達(dá)式的決定因素應(yīng)該盡可能簡,沒有真子集與其等價(jià),決定因素中無冗余屬性
--總結(jié):對F而言,沒有冗余的函數(shù)依賴項(xiàng),對函數(shù)依賴表達(dá)式而言,決定因素盡量精簡(有時(shí)候決定因素必須為多個(gè)屬性,所以只能盡量精簡),被決定因素只有一個(gè)屬性。
最小覆蓋(最小函數(shù)依賴集)
每個(gè)函數(shù)依賴集均等價(jià)于一個(gè)極小函數(shù)依賴集F',稱F'為F的最小依賴集
模式分解(屬性是分配的基本單位)
分解后函數(shù)關(guān)系講不明白,就跳過了,只講判定方法和分解方法
模式分解的意義:
--因?yàn)楝F(xiàn)有的模式可能會(huì)存在一些數(shù)據(jù)增刪改的弊端,需要尋找一種等價(jià)的關(guān)系模式,使得以上弊端得以解決
無損分解:
--對關(guān)系模式分解時(shí),原關(guān)系模型下任一合法的關(guān)系值在分解之后應(yīng)能通過自然聯(lián)接運(yùn)算恢復(fù)起來,即未丟失信息的分解即無損分解。反之,則稱為有損分解
判定公式:對于R<U,F>的一個(gè)分解ρ={R[1]<U[1],F[1]>,R[2]<U[2],F[2]>},如果U[1]∩U[2]→U[1]-U[2]∈F的閉包
建議:對著實(shí)例調(diào)試一次就都知道了,官方說法太玄了
分解的限制:
1.要求保留函數(shù)依賴(數(shù)據(jù)間關(guān)系),一定可以達(dá)到3NF,但是不一定能達(dá)到BCNF,此時(shí)可以還做到無損連接
2.只要求分解具有無損連接性,則一定可以達(dá)到4NF
分解算法
(1)得到保留函數(shù)依賴的3NF(合成法):
--將R<U,F>中的F極小化處理,得到F"
--找出所有不在F"中出現(xiàn)的屬性,記為U",把這些屬性構(gòu)成一個(gè)關(guān)系模式R"<U"',F"'>,把這些屬性從U中去掉,得到U"
①--若有X→A∈F",且XA=U",則ρ={R},結(jié)束
②--或者,對F按具有相同左部(決定因素)的原則分k組,每組函數(shù)依賴集涉及的全部屬性形成一個(gè)屬性集U[i]分別組成對應(yīng)的R[i]關(guān)系模式,算法結(jié)束。此時(shí)的ρ={R[1]<U[1],F[1]>,...R[k]<U[k],F[k]>∪R"<U"',F"'>}是R<U,F>的保留函數(shù)依賴的一個(gè)分解,且對于每個(gè)R[i]都屬于3NF
(2)保留函數(shù)依賴和無損連接的3NF
--設(shè)X是R<U,F>的碼,R已由合成法分解為ρ,令t=ρ∪{R*<X,F[x]>(R*中只有碼)}
--若有某個(gè)U[i],X?U[i],將R*<X,F[x]>從t中去掉,或者U[i]?X,將R<X,F[x]>從t中去掉。這步得到t'
--t'就是所求的分解
--即是說:合成法的計(jì)算結(jié)果ρ與由原表的主屬性組成新表r取并,且用r與ρ中的子表U[i]進(jìn)行對比,去除冗余的表(包含r時(shí)r冗余,被r包含時(shí)U[i]冗余)
(3)轉(zhuǎn)化為BCNF的無損連接分解(僅①適用)
--將分解ρ的子表中可以起決定因素作用的主屬性集(無法構(gòu)成碼)與其被決定因素單獨(dú)提取成一個(gè)新表,原R[i]中刪除掉對應(yīng)的被決定屬性
(4)U=X+Y+Z如果R<U,D>中X→→Y成立,則R的分解ρ={R[1]<X,Y>,R[2]<X,Z>}具有無損連接性
--即是說:將多值依賴的不符合4NF的表分解為多個(gè)函數(shù)依賴的表