概述:數據結構是計算機存儲、組織數據的方式。數據結構分為邏輯結構、(存儲)物理結構和數據的運算三個部分。常見的數據結構有:隊列,樹,堆,數組,棧,鏈表,圖,散列表等。
1. 數據結構基本術語
數據:可以被計算機讀取和處理的一些符號。
數據對象:性質相同的數據元素的集合,是數據的子集。
數據元素:數據組成的基本單位。
數據項:數據元素組成的最小單位。
他們直接的關系如下圖:
2. 數據的邏輯結構與物理結構
2.1 邏輯結構:是指數據中數據元素之間的相互關系。分為線性結構與非線性結構。
2.1.1 線性結構:結構關系是一對一的,并且是一種先后的次序。
? 表現形式為:線性表、棧、隊列、字符串等。
? 主要特征存在唯一的被叫做第一個和最后一個數據;
? 除第一個元素之外每個數據元素均有?個前驅;
? 除最后一個元素之外每個數據元素均有一個后繼。
2.1.2 非線性結構:結構關系是一對多或者多對多或者沒有對應關系只是同屬于一個集合。
? 表現形式為: 樹形結構、圖形結構、集合結構。
? 樹形結構: 元素結構關系是一對多。
? 圖形結構: 結構關系是多對多的。
? 集合結構: 元素之間沒有特殊的關系,只是屬于一個集合。
2.2 物理結構:指的是數據的邏輯結構在計算機中的存儲形式。分為順序存儲結構和鏈式存儲結構。
2.2.1 順序存儲結構:是指把數據元素存放在一組地址連續的存儲單元中。
2.2.2 鏈式存儲結構:是把數據元素存放在任意的存儲單元里,這組存儲單元可以是連續的,也可以是不連續的,數據元素的存儲關系并不能反映其邏輯關系,因此需要借助指針來表示數據元素之間的邏輯關系。
3. 算法
定義:算法就是解決特定問題求解步驟的描述,在計算機中表現為指令的有限序列, 并且每個指令表示一個或多個操作。算法的好壞直接決定計算機運行效率的高低。
3.1 算法與數據結構的關系
兩者既有聯系又有區別。聯系是程序 = 算法 + 數據結構。數據結構是算法實現的基礎,算法總是要依賴某種數據結構來實現的,算法的操作對象是數據結構。區別是數據結構關注的是數據的邏輯結構、存儲結構等一些基本操作,而算法更多的是關注如何在數據結構的基本上解決實際問題。算法是編程思想,數據結構則是這些思想的基礎。
3.2 算法的特性
? 有窮性,是指算法在執行有限的步驟之后,自動結束而不是出現無限循環,并且每一個步驟在可接受的時間內完成。
? 確定性,是指算法執行的每一步驟在一定條件下只有一條執行路徑,也就是相同輸入只能有唯一的輸出結果。
? 可行性,是指算法每一步驟都必須可行,能夠通過有限的執行次數完成。
? 輸入,是指算法具有零個或多個輸入。
? 輸出,是指算法至少有一個或多個輸出。
3.3 算法的設計要求
? 正確性,是指算法在執行結束后得到的結果是正確的。
? 可讀性,是指算法的設計便于讓人看懂。
? 健壯性,是指算法在任何輸入情況下不出現崩潰的特性。
? 時間效率?和儲存量低,是指算法運行花費的時間少和運行時所占用的內存的低。
3.4 算法的衡量標準
3.4.1 時間復雜度
算法的時間復雜度通常用大O符號表述,在進行算法分析時,語句執行次數 T(n) 是關于問題規模 n 的函數。進而分析次數 T(n) 隨規模 n 的變化情況并確定 T(n) 的數量級。算法的時間復雜度就是算法的時間度量,記作T(n) = O(f (n) )。它表示隨問題規模 n 的增大,算法的執行時間的增長率和 f(n) 的增長率相同,稱作算法的漸進時間復雜度,簡稱為時間復雜度。其中,f(n) 是問題規模 n 的某個函數。
大O表示法規則:
? 用常數1取代運行時間中所有常數。如: 3->1 O(1)
? 在修改運行次數函數中,只保留最高階項。如:n^3 + 2n^2+5 -> O(n^3)
? 如果最高階存在且不等于1的常數,則去除這個項目相乘的常數。 如:2n^3 -> n^3
常見時間復雜度術語:
? 常數階
//1+1+1+1+1+1+1 = 7 O(1)
void testSum2(int n) {
int sum = 0; //執行1次
sum = (1+n)*n/2; //執行1次
sum = (1+n)*n/2; //執行1次
sum = (1+n)*n/2; //執行1次
sum = (1+n)*n/2; //執行1次
sum = (1+n)*n/2; //執行1次
printf("testSum2:%d\n",sum); //執行1次
}
? 線性階
//x=x+1; 執行n次 O(n)
void add2(int x,int n) {
for (int i = 0; i < n; i++) {
x = x+1;
}
}
? 對數階
//2的x次方等于n x = log2n ->O(logn)
void testA(int n) {
int count = 1; //執行1次
//n = 10
while (count < n) {
count = count * 2;
}
}
? 平方階
//1+(n+1)+n(n+1)+n^2+n^2 = 2+3n^2+2n -> O(n^2)
void testSum5(int n) {
int i,j,x=0,sum = 0; //執行1次
for (i = 1; i <= n; i++) { //執行n+1次
for (j = 1; j <= n; j++) { //執行n(n+1)
x++; //執行n*n次
sum = sum + x; //執行n*n次
}
}
printf("testSum5:%d\n",sum);
}
? 立方階
//1+n+n^2+n^3+n^3 = 1+n+n^2+2n^3 -> O(n^3)
void testB(int n) {
int sum = 1; //執行1次
for (int i = 0; i < n; i++) { //執行n次
for (int j = 0 ; j < n; j++) { //執行n*n次
for (int k = 0; k < n; k++) { //執行n*n*n次
sum = sum * 2; //執行n*n*n次
}
}
}
}
? nlog階
void testN(int n) {
int k,j,count = 0;
for (k = 1; k <= n; k *= 2) {
for (j = 1; j < n; j++) {
count ++;
}
}
}
? 指數階(不考慮)
O(2^n)或者O(n!) 除非是非常小的 n,否則會造成噩夢般的時間消耗,這是一種不切實際的算法時間復雜度。一般不考慮!
3.4.2 空間復雜度
空間復雜度作為算法所需存儲空間的量度,記做S(n) = O (f(n))。其中,n 為問題的規模;f(n) 為語句關于 n 的所占存儲空間的函數。在考量算法的空間復雜度,主要考慮算法執行時所需要的輔助空間。
一般情況下,一個程序在機器上運行時,除了需要存儲程序本身的指令、常數、變量和輸入數據外,還需要存儲對數據操作的存儲單位。若輸入數據所占空間只取決于問題本身,和算法無關,這樣只需要分析該算法在實現時所需的輔助單元即可。若算法執行時所需的輔助空間相對于輸入數據量而言是個常量,則稱此算法為原地工作,空間復雜度為O(1)。
int n = 5;
int a[10] = {1,2,3,4,5,6,7,8,9,10};
//算法實現
int temp;
for(int i = 0; i < n/2; i++){
temp = a[i];
a[i] = a[n-i-1];
a[n-i-1] = temp;
}
//以上例子只需要用到輔助空間temp,所以空間復雜度為O(1)
int b[10] = {0};
for(int i = 0; i < n; i++){
b[i] = a[n-i-1];
}
for(int i = 0; i < n; i++){
a[i] = b[i];
}
//這個例子中需要用到 b(n) 的輔助空間,所以空間復雜度為O(n)