? 最近工作不是很忙,所以經常會上簡書翻翻有沒有好的技術文章。一次偶然點開個人中心,發現自己第一篇文章發布到現在差不多整整一年了。想想這一年來真是也無風雨也無晴。因為瑣事比較多再加上自己比較懶所以并沒有堅持下去,其實學習技術和學英語是一樣的,需要open your mouth,只有張開嘴和別人交流才能獲得進步。再加上自己以前買的書再不看真的要發霉了,所以今后每周都會寫一寫自己的學習內容和大家分享,這些內容可能包括iOS、Web、TCP/IP、算法和數據結構等內容。一是作為自己的學習筆記,二來希望能得到大家的批評指正。
? 這篇文章作為數據結構部分的第一篇文章,主要會簡單介紹一下數據結構,大部分都是概念性的一些東西,所以會以筆記的形式記錄一下。還會包括一些算法(數據結構和算法關系很緊密)、線性表的一些知識。那什么是數據結構?簡單的說就是下面這句話:
是相互之間存在一種或多種特定關系的數據元素的集合
? 如果你想要了解的更具體,可以點擊這里。
數據:是描述客觀事物的符號,是計算機中可操作的對象,能被計算機識別,并輸入給計算機處理的符號合集
數據元素:是組成數據的、有一定意義的基本單位,在計算機中通常作為整體處理。也被稱為記錄
-
數據項:一個數據元素可以由若干個數據項組成
它們之間的關系如下圖:
關系圖數據結構中的數據組織形式又分為邏輯結構和物理結構。
邏輯結構是指數據對象中數據元素之間的相互關系。可以分為以下四種:
-
集合結構:元素同屬于一個集合,但之間沒有任何關系或關聯。元素無規則的散部在集合之內。
?
-
線性結構:數據元素之間一對一,首尾相連。
?
-
樹形結構:數據元素之間存在一對多的連接關系
?
-
圖形結構(又叫網絡結構):數據元素之間是多對多的關系。
說完了邏輯結構再說說物理結構:是數據的邏輯結構在計算機中的存儲形式。物理結構也有兩種:
1.順序存儲結構:把數據存放在地址連續的存儲單元之中,每一個元素之間首尾相連,這種存儲方式要求存儲空間的容量要大于等于該集合中內容的容量。
2.鏈式存儲結構:把數據存放在任意的存儲單元之中,可連續,可不連續。這種存儲方式比順序存儲結構更加靈活,充分利用零散的物理存儲空間,需要注意的是每一個元素利用空間存儲自身的內容之外還需要分配空間用來存儲該集合下另一個元素的物理存儲地址。
數據結構和算法密不可分,合理的數據存儲結構和算法能夠大幅度的提高邏輯運算、數據讀寫的消耗時間。下面簡單說一部分算法
? 什么是算法:
算法:是指解題方案的準確而完整的描述,是一系列解決問題的清晰指令,算法代表著用系統的方法描述解決問題的策略機制。也就是說,能夠對一定規范的輸入,在有限時間內獲得所要求的輸出。如果一個算法有缺陷,或不適合于某個問題,執行這個算法將不會解決這個問題。不同的算法可能用不同的時間、空間或效率來完成同樣的任務。一個算法的優劣可以用空間復雜度與時間復雜度來衡量
現在有一個需求是求出1+2+3+......+100的和,如果不經過思索,不考慮性能我們很快會寫出下面這段代碼:
int sum = 0; for (int i = 0; i <= 100; i ++) { sum = sum + i; } printf("%d\n",sum);
這樣的方式當然沒有問題,但是這段程序如果需要計算出正確的答案,整個for循環需要101次,顯然這種方式會花費很多時間,認真看這個問題可以發現1+2+3+......+100的規律可以理解成首尾相加都是101.把這段計算從中間對折。也就是50個101相加代碼實現如下:
int sum = 0; sum = (1 + 100) * 100 / 2; printf("%d\n",sum);
結果也是5050,但這一次程序沒有發生循化,只運行了一次。顯然,算法提高了效率。
算法的特性
? 1.輸入項:一個算法有0個或多個輸入,以刻畫運算對象的初始情況,所謂0個輸入是指算法本身定出了初始條件
? 2.輸出項:一個算法有一個或多個輸出,以反映對輸入數據加工后的結果。沒有輸出的算法是毫無意義的
? 3.有窮性:算法的有窮性是指算法必須能在執行有限個步驟之后終止
? 4.確切性:算法的每一步驟必須有確切的定義
? 5.可行性:算法中執行的任何計算步驟都是可以被分解為基本的可執行的操作步,即每個計算步都可以在有限時間內完成(也稱之為有效性)
?
上面這些是算法的特征,那么如果創造出一個算法如何評定這個算法是否是一個有效并合理的算法呢,評定一個算法有以下五個要求:
? 1.正確性:能正確反映問題需求,能得到正確問題答案。
? 2.可讀性:供人們閱讀的容易程度。
? 3.健壯性:對不合理數據的反映能力和處理能力,容錯性。
? 4.高效率(時間復雜度):相同數據處理量下能獲得正確答案的時間越少,效率越高。
? 5.低資源消耗(空間復雜度):不占用過多的計算機計算能力。
算法效率的度量方法###
一般我們度量算法的效率有兩種方式:1.事后統計方法(不推薦),2.事前分析估算方法。這里我們通常采用第二種方式。
還是回到1到100累加的問題,第一種普通運算方式下程序執行了n + 3次
int sum = 0; // 1 次 for (int i = 0; i <= 100; i ++) { // 100 + 1次 sum = sum + i; } printf("%d\n",sum); // 1次
第二種算法程序執行了3次
int sum = 0; // 1次 sum = (1 + 100) * 100 / 2; // 1次 printf("%d\n",sum); // 1次
顯然隨著n的次數增加第一種方法程序運行的次數會越來越來多,第二種方法不會隨著n的增加而改變。
現在如果有兩個算法A:2n+3 B: 3n + 1。我們來比較一下這兩個算法的效率。
次數 2n+3 2n 3n+1 3n n=1 5 2 4 3 n=2 7 4 7 6 n=100 203 200 301 300 結論:給定兩個函數發f(n)和g(n),如果存在一個整數N,使得對于所有的n > N,f(n)總是比g(n)大,那么我們說f(n)的增長漸進快于g(n)
時間復雜度###
算法的時間復雜度也就是算法的時間度量,記作:T(n) = O(f(n)),隨著問題規模n的增大,算法執行時間的增長率和f(n)的增長率相同,叫做漸進時間復雜度。簡稱時間復雜度。我們用O()來體現時間復雜度的記法。
時間復雜度的(大O階)的方法:
? 1.用常數取代運算時間中的所有加法常數。
? 2.在修改后的運算次數函數中,只保留最高階項。
? 3.如果最高階項存在并且部位1,則去除與這個項相乘的常數。
下面舉幾個例子來說明常見的時間復雜度類型
1.下面的時間復雜度是O(n + 3)->O(n) ,將常數項變為1,保留最高階項。
int sum = 0; // 1 次 for (int i = 0; i <= 100; i ++) { // 100 + 1次 sum = sum + i; } printf("%d\n",sum); // 1次
2 O(3) -> O(1),常數項變為1,無最高階項
int sum = 0; // 1次 sum = (1 + 100) * 100 / 2; // 1次 printf("%d\n",sum); // 1次
3.O(logn)
int count = 1; while (count < 100) { count = count * 2; };
常用的是時間復雜度所消耗的時間排序:
O(1) < O(logn) < O(n) < O(nlogn) < O(nn) < O(nnn) < O(2的n次方) < O(n!) < O(n的n次方)*
這篇文章的算法部分只是簡單的介紹了,主要是為了配合數據結構。以后會專門寫一些文章去記錄算法的學習歷程。下一篇文章會介紹一些線性表、單鏈表、雙鏈表、棧和隊列的相關知識。
?
?
?
?
?
?
?
?
?
?
-