一: 算法
算法:是一組有窮指令集,是解題方案的準確而完整的描述。通俗地說,算法就是計算機解題的過程。算法不等于程序,也不等于計算方法,程序的編制不可能優于算法的設計。
算法是一組嚴謹地定義運算順序的規則,每一個規則都是有效的,且是明確的,此順序將在有限的次數下終止。所以其四個基本特征包括:
(1)確定性,算法中每一步驟都必須有明確定義,不允許有模棱兩可的解釋,不允許有多義性;
(2)有窮性,算法必須能在有限的時間內做完,即能在執行有限個步驟后終止;
(3)可行性,算法原則上能夠精確地執行;
(4)擁有足夠的情報。
算法的基本要素:一是對數據對象的運算和操作;二是算法的控制結構。
指令系統:一個計算機系統能執行的所有指令的集合。
基本運算和操作包括:算術運算、邏輯運算、關系運算、數據傳輸。
算法的三種基本控制結構:順序結構、選擇結構、循環結構。
算法基本設計方法:列舉法、歸納法、遞推、遞歸、減半遞推技術、回溯法。
算法效率的度量—算法復雜度:算法時間復雜度和算法空間復雜度。
算法時間復雜度:指執行算法所需要的計算工作量。即算法執行過程中所需要的基本運算次數。通常,一個算法所用的時間包括編譯時間和運行時間。
算法空間復雜度:指執行這個算法所需要的內存空間。包括算法程序所占的空間,輸入的初始數據所占的空間,算法執行過程中所需的額外空間。
二: 數據結構的基本概念
數據結構:指相互有關聯的數據元素的集合。
數據結構研究的三個方面:
(1)數據集合中各數據元素之間所固有的邏輯關系,即數據的邏輯結構;
(2)在對數據進行處理時,各數據元素在計算機中的存儲關系,即數據的存儲結構;
(3)對各種數據結構進行的運算。
數據的邏輯結構應包含:
(1)表示數據元素的信息;
(2)表示各數據元素之間的前后件關系(指邏輯關系,與存儲位置無關)。
數據的邏輯結構在計算機存儲空間中的存放形式稱為數據的存儲結構,也稱數據物理結構。
數據的存儲結構有順序、鏈接、索引等。
線性結構的條件,(一個非空數據結構):
(1)有且只有一個根結點; (2)每一個結點最多有一個前件,也最多有一個后件。
非線性結構:不滿足線性結構條件的數據結構。
三:線性表及其順序存儲結構
線性表是由一組數據元素構成,數據元素的位置只取決于自己的序號,元素之間的相對位置是線性的。
在復雜線性表中,由若干項數據元素組成的數據元素稱為記錄;
由多個記錄構成的線性表稱為文件。
非空線性表的結構特征:
(1)且只有一個根結點a1,它無前件;
(2)有且只有一個終端結點an,它無后件;
(3)除根結點與終端結點外,其他所有結點有且只有一個前件,也有且只有一個后件。
結點個數n稱為線性表的長度,當n=0時,稱為空表。
線性表的順序存儲結構具有以下兩個基本特點:
(1)線性表中所有元素所占的存儲空間是連續的;
(2)線性表中各數據元素在存儲空間中是按邏輯順序依次存放的。
元素ai的存儲地址為:ADR(ai)=ADR(a1)+(i-1)k,ADR(a1)為第一個元素的地址,k代表每個元素占的字節數。
順序表的運算:查找、插入、刪除。
四:線性鏈表
數據結構中的每一個結點對應于一個存儲單元,這種存儲單元稱為存儲結點,簡稱結點。
結點由兩部分組成:
(1) 用于存儲數據元素值,稱為數據域;
(2) 用于存放指針,稱為指針域,用于指向前一個或后一個結點。
在鏈式存儲結構中,存儲數據結構的存儲空間可以不連續,各數據結點的存儲順序與數據元素之間的邏輯關系可以不一致,而數據元素之間的邏輯關系是由指針域來確定的。
鏈式存儲方式即可用于表示線性結構,也可用于表示非線性結構。
線性單鏈表中,HEAD稱為頭指針,HEAD=NULL(或0)稱為空表。
如果是雙項鏈表的兩指針:左指針(Llink)指向前件結點,右指針(Rlink)指向后件結點。
線性鏈表的基本運算:查找、插入、刪除。
五:棧和隊列
棧:限定在一端進行插入與刪除的線性表。
其允許插入與刪除的一端稱為棧頂,用指針top表示棧頂位置。
不允許插入與刪除的另一端稱為棧底,用指針bottom表示棧底。
棧按照“先進后出”(FILO)或“后進先出”(LIFO)組織數據,棧具有記憶作用。
棧的存儲方式有順序存儲和鏈式存儲。
棧的基本運算:
(1) 入棧運算,在棧頂位置插入元素;
(2) 退棧運算,刪除元素(取出棧頂元素并賦給一個指定的變量);
(3) 讀棧頂元素,將棧頂元素賦給一個指定的變量,此時指針無變化。
隊列:指允許在一端(隊尾)進入插入,而在另一端(隊頭)進行刪除的線性表。
用rear指針指向隊尾,用front指針指向隊頭元素的前一個位置。
隊列是“先進先出”(FIFO)或“后進后出”(LILO)的線性表。
隊列運算包括:
(1) 入隊運算:從隊尾插入一個元素;
(2) 退隊運算:從隊頭刪除一個元素。
隊列的順序存儲結構一般采用隊列循環的形式。
循環隊列s=0表示隊列空;s=1且front=rear表示隊列滿。
計算循環隊列的元素個數:“尾指針減頭指針”,若為負數,再加其容量即可。
六: 樹與二叉樹
樹是一種簡單的非線性結構,其所有元素之間具有明顯的層次特性。
在樹結構中,每一個結點只有一個前件,稱為父結點。
沒有前件的結點只有一個,稱為樹的根結點,簡稱樹的根。
每一個結點可以有多個后件,稱為該結點的子結點。沒有后件的結點稱為葉子結點。
在樹結構中,一個結點所擁有的后件的個數稱為該結點的度,所有結點中最大的度稱為樹的度。樹的最大層次稱為樹的深度。
二叉樹的特點:
(1) 非空二叉樹只有一個根結點;
(2) 每一個結點最多有兩棵子樹,且分別稱為該結點的左子樹與右子樹。
滿二叉樹是指除最后一層外,每一層上的所有結點有兩個子結點,則k層上有2k-1個結點深度為m的滿二叉樹有2m-1個結點。
完全二叉樹是指除最后一層外,每一層上的結點數均達到最大值,在最后一層上只缺少右邊的若干結點。
二叉樹基本性質:
(1)在二叉樹的第k層上,最多有2k-1(k≥1)個結點;
(2)深度為m的二叉樹最多有2m-1個結點;
(3)度為0的結點(即葉子結點)總是比度為2的結點多一個;
(4)具有n個結點的二叉樹,其深度至少為[log2n]+1,其中[log2n]表示取log2n的整數部分
(5) 具有n個結點的完全二叉樹的深度為[log2n]+1;
(6) 設完全二叉樹共有n個結點。如果從根結點開始,按層序(每一層從左到右)用自然數1,2,…n給結點進行編號(k=1,2….n),有以下結論:
①若k=1,則該結點為根結點,它沒有父結點;若k>1,則該結點的父結點編號為INT(k/2);
②若2k≤n,則k結點的左子結點編號為2k;否則該結點無左子結點(也無右子結點);
③若2k+1≤n,則編號為k的結點的右子結點編號為2k+1;否則該結點無右子結點。
補充:增加度為1的結點不會影響二叉樹的葉子結點數,每增加一個度為2的結點便會增加一個葉子結點,沒有度為2的結點時葉子結點數為1。
已知完全二叉樹有x個結點,求其葉子結點數:
① ? 確定層數為k;
② ? ②第k層的結點數y=x-(2 k-1-1);
③ ? 第k-1層的葉子結點數n=2 (k-1)-1-y/2<若y/2有余,則要加1>;
④ ? ④最后y+n。
二叉樹存儲結構采用鏈式存儲結構,對于滿二叉樹與完全二叉樹可以按層序進行順序存儲。二叉樹的遍歷:
(1)前序遍歷(DLR),首先訪問根結點,然后遍歷左子樹,最后遍歷右子樹;(樹根在第一,下走不跳結點)
(2)中序遍歷(LDR),首先遍歷左子樹,然后訪問根結點,最后遍歷右子樹;(有左先左,再尋根,后找右。最左邊的結點最先遍歷,最右邊的結點最后遍歷)
(3)后序遍歷(LRD)首先遍歷左子樹,然后訪問遍歷右子樹,最后訪問根結點。(有左先左,再找右,后尋根,到最右一路上行,樹根在最后)
小結:
邏輯結構可分為線性表和非線性表。
線性表包括棧、隊列,其存儲方式為順序存儲、鏈式存儲均可。鏈式型有:線性鏈表,帶鏈的棧,
帶鏈的隊列,循環鏈表等。
非線性表包括樹(二叉樹),其存儲方式為鏈式存儲。
七: 查找技術
只能使用順序查找的兩種情況:
(1)線性表為無序表,不管是順序存儲還是鏈式存儲;
(2)表采用鏈式存儲結構,即使是有序線性表。
二分法查找只適用于順序存儲的有序表,對于長度為n的有序線性表,最壞情況只需比較log2n次,而順序查找需要比較n次。
八: 排序技術
排序是指將一個無序序列整理成按值非遞減順序排列的有序序列。
交換類排序法:
(1)冒泡排序法,需要比較的次數為n(n-1)/2;
(2 ) 快速排序法。
插入類排序法:
(1)簡單插入排序法,最壞情況需要n(n-1)/2次比較;
(2) 希爾排序法,最壞情況需要O(n1.5)次比較。
選擇類排序法:
(1)簡單選擇排序法, 最壞情況需要n(n-1)/2次比較;
(2) 堆排序法,最壞情況需要O(nlog2n)次比較。相比以上幾種(除希爾排序法外),堆排序法的時間復雜度最小。