參考: @CyC2018
正常實現
Input : [1,2,3,4,5]
key : 3
return the index : 2
public int binarySearch(int[] nums, int key) {
int l = 0, h = nums.length - 1;
while (l <= h) {
int m = l + (h - l) / 2;
if (nums[m] == key) {
return m;
} else if (nums[m] > key) {
h = m - 1;
} else {
l = m + 1;
}
}
return -1;
}
時間復雜度
二分查找也稱為折半查找,每次都能將查找區間減半,這種折半特性的算法時間復雜度為 O(logN)。
mid 計算
有兩種計算中值 m 的方式:
- m = (l + h) / 2
- m = l + (h - l) / 2
l + h 可能出現加法溢出,也就是說加法的結果大于整型能夠表示的范圍。但是 l 和 h 都為正數,因此 h - l 不會出現加法溢出問題。所以,最好使用第二種計算法方法。
未成功查找的返回值
循環退出時如果仍然沒有查找到 key,那么表示查找失敗。可以有兩種返回值:
- -1:以一個錯誤碼表示沒有查找到 key
- l:將 key 插入到 nums 中的正確位置
變種
二分查找可以有很多變種,實現變種要注意邊界值的判斷。例如在一個有重復元素的數組中查找 key 的最左位置的實現如下:
public int binarySearch(int[] nums, int key) {
int l = 0, h = nums.length - 1;
while (l < h) {
int m = l + (h - l) / 2;
if (nums[m] >= key) {
h = m;
} else {
l = m + 1;
}
}
return l;
}
該實現和正常實現有以下不同:
- h 的賦值表達式為 h = m
- 循環條件為 l < h
- 最后返回 l 而不是 -1
在 nums[m] >= key 的情況下,可以推導出最左 key 位于 [l, m] 區間中,這是一個閉區間。h 的賦值表達式為 h = m,因為 m 位置也可能是解。
在 h 的賦值表達式為 h = m 的情況下,如果循環條件為 l <= h,那么會出現循環無法退出的情況,因此循環條件只能是 l < h。以下演示了循環條件為 l <= h 時循環無法退出的情況:
nums = {0, 1, 2}, key = 1
l m h
0 1 2 nums[m] >= key
0 0 1 nums[m] < key
1 1 1 nums[m] >= key
1 1 1 nums[m] >= key
...
當循環體退出時,不表示沒有查找到 key,因此最后返回的結果不應該為 -1。為了驗證有沒有查找到,需要在調用端判斷一下返回位置上的值和 key 是否相等。
因此,對h和l的賦值總結如下:
h 的賦值和循環條件有關,當循環條件為 l <= h 時,h = mid - 1;當循環條件為 l < h 時,h = mid。解釋如下:在循環條件為 l <= h 時,如果 h = mid,會出現循環無法退出的情況,例如 l = 1,h = 1,此時 mid 也等于 1,如果此時繼續執行 h = mid,那么就會無限循環;在循環條件為 l < h,如果 h = mid - 1,會錯誤跳過查找的數,例如對于數組 [1,2,3],要查找 1,最開始 l = 0,h = 2,mid = 1,判斷 key < arr[mid] 執行 h = mid - 1 = 0,此時循環退出,直接把查找的數跳過了。
l 的賦值一般都為 l = mid + 1。
題目如下:
540.有序數組的Single Element(Medium)
具體題目實現:
69.求開方(Easy)
思路:
一個數 x 的開方 sqrt 一定在 0 ~ x 之間,并且滿足 sqrt == x / sqrt。可以利用二分查找在 0 ~ x 之間查找 sqrt。
對于 x = 8,它的開方是 2.82842...,最后應該返回 2 而不是 3。在循環條件為 l <= h 并且循環退出時,h 總是比 l 小 1,也就是說 h = 2,l = 3,因此最后的返回值應該為 h 而不是 l。
public int mySqrt(int x) {
if (x <= 1) {
return x;
}
int l = 1, h = x;
while (l <= h) {
int mid = l + (h - l) / 2;
int sqrt = x / mid;
if (sqrt == mid) {
return mid;
} else if (mid > sqrt) {
h = mid - 1;
} else {
l = mid + 1;
}
}
return h;
}
441.擺硬幣(Easy)
有三種解法,分別是暴力解法、二分查找、數學解法,對應的時間復雜度分別是O(n)、O(logn)、O(1)。
1. 暴力解法
public int arrangeCoins(int n) {
if (n<1) {
return 0;
}
int rowNum = 1;
int remain = n - rowNum;
while (remain >= rowNum + 1) {
rowNum++;
remain = remain - rowNum; //更新剩余的值
}
return rowNum;
}
2. 二分查找
//方法二:二分查找,時間復雜度O(LogN).
//思路就是找到一個k,使得所有和剛好大于n,那么k-1就是答案。這個假設是基于行號k=n。
//但是這個方法在leetcode中超出時間限制了
public int arrangeCoins(int n) {
int l = 0, h = n;
while(l <= n ) {
int mid = l + (h - l) / 2;
long tmp = mid * (mid + 1)/2;
if(tmp == n) return mid;
else if(tmp < n) l = mid + 1;
else h = mid - 1;
}
return h;
}
3. 數學解法
//用解方程的公式,可以得到其正數解為:k = sqrt(2n + 1/4) - 1/2
//唯一的問題是這里2n + 1/4有可能會超出sqrt函數的參數范圍
//查一下sqrt函數的參數范圍吧,我也不清楚
public int arrangeCoins(int n) {
return (int)(Math.sqrt(2) * Math.sqrt(n + 0.125) - 0.5);
}
744.大于給定元素的最小元素(Easy)
題目描述:
給定一個有序的字符數組 letters 和一個字符 target,要求找出 letters 中大于 target 的最小字符,如果找不到就返回第 1 個字符。
public char nextGreatestLetter(char[] letters, char target) {
int n = letters.length;
int l = 0, h = n - 1;
while(l <= h) {
int m = l + (h - l) / 2;
if (letters[m] <= target) {
l = m + 1;
}else {
h = m - 1;
}
}
return l < n ? letters[l] : letters[0];
//? :運算符的意思是如果?前面為真,就返回:左邊的值,否則返回右邊的值
}
278.第一個錯誤版本(Easy)
題目描述:
給定一個元素 n 代表有 [1, 2, ..., n] 版本,在第 x 位置開始出現錯誤版本,導致后面的版本都錯誤。可以調用 isBadVersion(int x) 知道某個版本是否錯誤,要求找到第一個錯誤的版本。
思路:
- 如果第m個版本出錯,則表示第一個錯誤版本在[l,m]之間,則令h=m;否則第一個錯誤版本在[m+1,h]之間,令l=m+1;
- 因為h的賦值表達式為h=m,則循環條件就是 l<h。
/* The isBadVersion API is defined in the parent class VersionControl.
boolean isBadVersion(int version); */
public class Solution extends VersionControl {
public int firstBadVersion(int n) {
int l = 1, h = n;
while(l < h) {
int mid = l + (h - l) / 2;
if (isBadVersion(mid)) {
h = mid;
}else {
l = mid + 1;
}
}
return l;
}
}
540.有序數組的Single Element(Medium)
題目描述:
一個有序數組只有一個數不出現兩次,找出這個數。
輸入: [1,1,2,3,3,4,4,8,8]
輸出: 2
思路:
- 要求時間復雜度在O(1)~O(logn),因此不能用遍歷數組并進行異或(如果a、b兩個值不相同,則異或結果為1。如果a、b兩個值相同,異或結果為0)操作來求解,這么做的時間復雜度為O(n)。
- 令index為single element在數組中的位置。引入index之后,index之前與index之后數組成對的狀態不同。如果m為偶數,并且m+1<index(index之前),那么num[m] == num[m+1],若m+1 >= index,那么num[m] != num[m+1]
- 從上面的規律可知,如果num[m] == num[m+1],則index所在的位置是[m+2,h],此時令l = m+2;如果num[m] != num[m+1],則index所在的位置是[l,m],此時令h = m。
- 因為h的賦值表達式為h = m,那么循環條件應為l < h。
public int singleNonDuplicate(int[] nums) {
int l = 0, h = nums.length - 1;
while (l < h) {
int m = l + (h - l) / 2;
if (m % 2 == 1) {
m--; //保證m為偶數
}if (nums[m] == nums[m + 1]) {
l = m + 2;
}else {
h = m;
}
}
return nums[l];
}
153.旋轉數組的最小數字(Medium)
題目描述:
假設數組中不存在重復元素,找到原有序數組經過旋轉后得到的數組中的最小元素。
輸入: [3,4,5,1,2]
輸出: 1
思路:
只要mid位置上的元素比h位置上的元素小,就說明最小元素在m位置及m之前的位置,否則在m之后的位置
public int findMin(int[] nums) {
int l = 0, h = nums.length - 1;
while (l < h) {
int m = l + (h - l) / 2;
if (nums[m] <= nums[h]) {
h = m;
}else {
l = m + 1;
}
}
return nums[l];
}
以下題目保留:沒看懂沒想通
34.查找區間(Medium)
題目描述:
給定一個按照升序排列的整數數組 nums,和一個目標值 target。找出給定目標值在數組中的開始位置和結束位置。時間復雜度必須是 O(log n)。如果數組中不存在目標值,返回 [-1, -1]。
輸入: nums = [5,7,7,8,8,10], target = 8
輸出: [3,4]
輸入: nums = [5,7,7,8,8,10], target = 6
輸出: [-1,-1]
這個題先保留,目前處于看答案也懵逼的狀態。。。。。
可以用二分查找找出第一個位置和最后一個位置,但是尋找的方法有所不同,需要實現兩個二分查找。我們將尋找 target 最后一個位置,轉換成尋找 target+1 第一個位置,再往前移動一個位置。這樣我們只需要實現一個二分查找代碼即可。
public int[] searchRange(int[] nums, int target) {
int first = findFirst(nums, target);
int last = findFirst(nums, target + 1) - 1;
if (first == nums.length || nums[first] != target) {
return new int[]{-1, -1};
} else {
return new int[]{first, Math.max(first, last)};
}
}
private int findFirst(int[] nums, int target) {
int l = 0, h = nums.length; // 注意 h 的初始值
while (l < h) {
int m = l + (h - l) / 2;
if (nums[m] >= target) {
h = m;
} else {
l = m + 1;
}
}
return l;
}
在尋找第一個位置的二分查找代碼中,需要注意 h 的取值為 nums.length,而不是 nums.length - 1。先看以下示例:
nums = [2,2], target = 2
如果 h 的取值為 nums.length - 1,那么 last = findFirst(nums, target + 1) - 1 = 1 - 1 = 0。這是因為 findLeft 只會返回 [0, nums.length - 1] 范圍的值,對于 findFirst([2,2], 3) ,我們希望返回 3 插入 nums 中的位置,也就是數組最后一個位置再往后一個位置,即 nums.length。所以我們需要將 h 取值為 nums.length,從而使得 findFirst返回的區間更大,能夠覆蓋 target 大于 nums 最后一個元素的情況。