這道題是我刷leetcode遇到的第一個難度為Hard的題,筆者在大學(xué)學(xué)習(xí)算法課的時候接觸過類似的題目,不過由于時間久了,加之當(dāng)時并沒有對這類題型有一個深刻的理解,所以忘了做法了。在查閱了一些技術(shù)類博客之后,才找回了當(dāng)時的思路。
題目敘述如下:
There are two sorted arrays nums1and nums2 of size m and n respectively.
Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
Example 1:
nums1 = [1, 3]
nums2 = [2]
The median is 2.0
Example 2:
nums1 = [1, 2]
nums2 = [3, 4]
The median is (2 + 3)/2 = 2.5
題目簡介
這道題的輸入是兩個已經(jīng)sorted的數(shù)組,要求返回兩數(shù)組合并后的中位數(shù),時間復(fù)雜度要求為O(log (m+n))
知識要點
- 本題若不考慮時間復(fù)雜度的要求,我們很容易想到mergeSort。將兩個排序好的數(shù)組合并成一個數(shù)組稱為一次merge。做法很簡單:設(shè)置兩個指向兩數(shù)組的頭指針,每次取更小的元素往新數(shù)組里添加,并向后移動該指針,直到兩個數(shù)組的數(shù)都被取出。(本題用這種思想不符合時間復(fù)雜度要求)
- 二分查找的思想,能夠使時間復(fù)雜度降至O(log (m+n))
解題思路
Approach 1: MergeSort
應(yīng)用mergeSort中一次merge,從而找到我們要的中位數(shù)。此方法很簡單,在此不列代碼。但是此方法不符合O(log (m+n))時間復(fù)雜度的要求
Approach 2: Binary Discard
Binary Discard 是筆者自己起的名字,參考 Leetcode 4 Median of Two Sorted Arrays 原文的解釋是英文,在這里我簡單翻譯一下:
在這里問題泛化為:尋找兩個sorted數(shù)組的第k小的元素。
如果我們比較一下A里第k/2個和B里第k/2個元素(即比較A[k/2-1]和B[k/2-1])的話,存在三種情況:(這里我們比較理想地認為k為偶數(shù),且兩個數(shù)組的元素個數(shù)都大于等于k/2。事實證明非理想情況下,通過下文中的細節(jié)處理,結(jié)果相同)
A[k/2-1] = B[k/2-1]
A[k/2-1] < B[k/2-1]
A[k/2-1] > B[k/2-1]
第一種情況:我們已經(jīng)找到了目標(biāo)值,正好就是A[k/2-1]或B[k/2-1]。我們可以用一個表格來清晰的表示,A和B mergeSort之后的數(shù)組的情況如下:
1th : (k-2)th | (k-1)th | kth | (k+1)th : last |
---|---|---|---|
A[0:k/2-2] and B[0:k/2-2] | A[k/2-1] | B[k/2-1] | A[k/2:last] and B[k/2:last] |
第二種情況:A[0:k/2-1]中的所有元素,都在AB合并數(shù)組里的前k個最小元素里。換句話說:A[k/2-1]小于AB合并數(shù)組的第k小的元素。這一點我們可以通過反證法來證明,還是很好理解的,在這里就不證明了。所以我們可以丟棄A[0:k/2-1]中的所有元素。
**第三種情況: **與情況二同理
接下來我們考慮一下edge condition,即遞歸函數(shù)的終止條件。
- 當(dāng)A或B其中一個數(shù)組為空時,返回A[k-1] (或B[k-1])
- 當(dāng)k = 1時(且A,B均不空),返回min(A[0], B[0])
- 當(dāng)A[k/2-1] = B[k/2-1]時,返回其中一個即可
剩下的就是一些細節(jié)處理了。
- 為了操作方便,我們令m總是小于n
- 我們用<code>pa = min(k/2, m);</code>來表示A中選取元素的數(shù)量;用<code>pb = k - pa;</code>表示B中選取元素的數(shù)量。這樣的話一些特殊情況(比如當(dāng)m < k/2時,或者k為奇數(shù)時)也同樣能夠得到正確結(jié)果。
- 若A,B元素個數(shù)和 m+n 為奇數(shù),中位數(shù)為尋找第 (m+n)/2+1 最小的數(shù);
若A,B元素個數(shù)和 m+n 為偶數(shù),中位數(shù)為尋找第 (m+n)/2 和第 (m+n)/2+1 最小的數(shù)的平均數(shù)
具體的C++代碼如下:
class Solution {
public:
int min(int a, int b){
return a<b? a:b;
}
int findKth(int k, vector<int> nums1, vector<int> nums2){
int m = nums1.size(), n = nums2.size();
//assume m <= n;
if (m > n)
return findKth(k, nums2, nums1);
//2 terminate conditions
if (m == 0)
return nums2[k-1];
if (k == 1)
return min(nums1[0], nums2[0]);
//two parts and discard one
int pa = min(k/2, m);
int pb = k - pa;
if (nums1[pa-1] > nums2[pb-1]){
nums2.erase(nums2.begin(), nums2.begin()+pb);
return findKth(k-pb, nums1, nums2);
}
else if (nums1[pa-1] < nums2[pb-1]){
nums1.erase(nums1.begin(), nums1.begin()+pa);
return findKth(k-pa, nums1, nums2);
}
else
return nums1[pa-1];
}
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int cnt = nums1.size() + nums2.size();
if (cnt % 2 == 1)
return (double)findKth(cnt/2+1, nums1, nums2);
else
return (findKth(cnt/2, nums1, nums2) + findKth(cnt/2+1, nums1, nums2)) / 2.0;
}
};