力扣DAY68 | 熱100 | 尋找兩個正序數組的中位數

前言

困難 ○ 這題搞了3天實在太難了，本質就是每次排除k/2個數，直到找到第k個數。

題目

給定兩個大小分別為?m?和?n?的正序（從小到大）數組?nums1?和?nums2。請你找出并返回這兩個正序數組的?中位數?。

算法的時間復雜度應該為?O(log (m+n))?。

示例 1：

輸入：nums1 = [1,3], nums2 = [2]
輸出：2.00000
解釋：合并數組 = [1,2,3] ，中位數 2

示例 2：

輸入：nums1 = [1,2], nums2 = [3,4]
輸出：2.50000
解釋：合并數組 = [1,2,3,4] ，中位數 (2 + 3) / 2 = 2.5

提示：

nums1.length == m
nums2.length == n
0 <= m <= 1000
0 <= n <= 1000
1 <= m + n <= 2000
-106 <= nums1[i], nums2[i] <= 106

思路

筆者一開始的思路是比較兩個數組的中點排除一半數組，直到有一邊只剩一個數，這樣做的缺點在于判斷條件過多，到最后還要判斷奇偶數，非常麻煩。

官方題解

給定兩個有序數組，要求找到兩個有序數組的中位數，最直觀的思路有以下兩種：

使用歸并的方式，合并兩個有序數組，得到一個大的有序數組。大的有序數組的中間位置的元素，即為中位數。

不需要合并兩個有序數組，只要找到中位數的位置即可。由于兩個數組的長度已知，因此中位數對應的兩個數組的下標之和也是已知的。維護兩個指針，初始時分別指向兩個數組的下標 0 的位置，每次將指向較小值的指針后移一位（如果一個指針已經到達數組末尾，則只需要移動另一個數組的指針），直到到達中位數的位置。

假設兩個有序數組的長度分別為 m 和 n，上述兩種思路的復雜度如何？

第一種思路的時間復雜度是 O(m+n)，空間復雜度是 O(m+n)。第二種思路雖然可以將空間復雜度降到 O(1)，但是時間復雜度仍是 O(m+n)。

如何把時間復雜度降低到 O(log(m+n)) 呢？如果對時間復雜度的要求有 log，通常都需要用到二分查找，這道題也可以通過二分查找實現。

根據中位數的定義，當 m+n 是奇數時，中位數是兩個有序數組中的第 (m+n)/2 個元素，當 m+n 是偶數時，中位數是兩個有序數組中的第 (m+n)/2 個元素和第 (m+n)/2+1 個元素的平均值。因此，這道題可以轉化成尋找兩個有序數組中的第 k 小的數，其中 k 為 (m+n)/2 或 (m+n)/2+1。

假設兩個有序數組分別是 A 和 B。要找到第 k 個元素，我們可以比較 A[k/2?1] 和 B[k/2?1]，其中 / 表示整數除法。由于 A[k/2?1] 和 B[k/2?1] 的前面分別有 A[0..k/2?2] 和 B[0..k/2?2]，即 k/2?1 個元素，對于 A[k/2?1] 和 B[k/2?1] 中的較小值，最多只會有 (k/2?1)+(k/2?1)≤k?2 個元素比它小，那么它就不能是第 k 小的數了。

因此我們可以歸納出三種情況：

如果 A[k/2?1]<B[k/2?1]，則比 A[k/2?1] 小的數最多只有 A 的前 k/2?1 個數和 B 的前 k/2?1 個數，即比 A[k/2?1] 小的數最多只有 k?2 個，因此 A[k/2?1] 不可能是第 k 個數，A[0] 到 A[k/2?1] 也都不可能是第 k 個數，可以全部排除。

如果 A[k/2?1]>B[k/2?1]，則可以排除 B[0] 到 B[k/2?1]。

如果 A[k/2?1]=B[k/2?1]，則可以歸入第一種情況處理。

可以看到，比較 A[k/2?1] 和 B[k/2?1] 之后，可以排除 k/2 個不可能是第 k 小的數，查找范圍縮小了一半。同時，我們將在排除后的新數組上繼續進行二分查找，并且根據我們排除數的個數，減少 k 的值，這是因為我們排除的數都不大于第 k 小的數。

有以下三種情況需要特殊處理：

如果 A[k/2?1] 或者 B[k/2?1] 越界，那么我們可以選取對應數組中的最后一個元素。在這種情況下，我們必須根據排除數的個數減少 k 的值，而不能直接將 k 減去 k/2。

如果一個數組為空，說明該數組中的所有元素都被排除，我們可以直接返回另一個數組中第 k 小的元素。

如果 k=1，我們只要返回兩個數組首元素的最小值即可。

class Solution {
public:double findk(vector<int>& nums1, vector<int>& nums2, int k){double ans;int m = nums1.size();int n = nums2.size();int index1 = 0, index2 = 0; //區間起點while(true){//一個數組已完全排除if (index1 == m)return nums2[index2 + k - 1];if (index2 == n)return nums1[index1 + k - 1];//剩余一個要排除，排除大的返回小的if (k == 1)return min(nums1[index1], nums2[index2]);//區間終點，k/2-1是區間長度，如果該長度超過數組長度，直接取數組最后一個值int newindex1 = min(index1 + k / 2 - 1, m - 1);int newindex2 = min(index2 + k / 2 - 1, n - 1);//區間終點值，也就是要比較的值int point1 = nums1[newindex1];int point2 = nums2[newindex2];//終點值小的一邊包括終點全被排除//更新k，更新小的一邊的起點坐標（上一個終點的下一位）//等號在哪里不影響結果if (point1 <= point2){k -= newindex1 - index1 + 1;index1 = newindex1 + 1;}else{k -= newindex2 - index2 + 1;index2 = newindex2 + 1;}}return ans;}double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {int m = nums1.size();int n = nums2.size();double ans;if ((m+n)%2 == 0){ans = (findk(nums1, nums2, (m+n)/2)+findk(nums1, nums2, (m+n)/2+1))/2;}else{ans = findk(nums1, nums2, (m+n)/2+1);}return ans;}
};

心得

結束二分專題，這個題目需要非常強的邏輯思維，否則很容易被繞進去。再回顧下解法：奇數找中間數，偶數找中間兩個數除2。定義一個函數找兩個數組的第k位數，定義初始起點為0，數組長度為k/2-1(保證每次排除不會把k排走)，進入循環后計算數組終點：起點+長度，如果超過整個數組長度則取最后一位。比較兩個區間終點，把小的一邊排除，循環比較。直到一邊被完全排除，直接返回另一個數組的index+k個數；或者k==1，還剩一個數要排除，排除大的，返回小的。做這個專題的時候太過急躁了，過于低估，很多題目沒有好好想清楚邊界情況就框框做，這個是個壞習慣。靜下心來，筆算每個題的思路，具體到抽象再到具體，嚴謹嚴謹再嚴謹！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/78336.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/78336.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/78336.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！