相關概念
- 排序:使一串記錄,按照其中某個或某些關鍵字的大小,遞增或遞減的排列起來。
- 穩定性:它描述了在排序過程中,相等元素的相對順序是否保持不變。假設在待排序的序列中,有兩個元素a和b,它們的值相等,并且在排序前a在b前面。如果在排序后,a仍然在b前面,那么就稱該排序算法是穩定的;反之,如果排序后a跑到了b后面,那么這個排序算法就是不穩定的。
- 內部排序:當排序的數據量非常小時,待排序的數據全部存放在計算機的內存中,并且排序操作也在內存里完成。
- 外部排序:當待排序的數據量非常大,無法全部存入內存時,就需要借助外部存儲設備(如硬盤、磁帶等)來輔助完成排序。外部排序通常將數據分成多個較小的部分,先把這些部分依次讀入內存進行內部排序,生成有序的子文件,再把這些有序子文件合并成一個最終的有序文件。
任何排序都可以分為單趟排序和多趟排序。將排序拆解開來,更方便理解。
插入排序
直接插入排序
直接插入排序的思想是:將插入的元素按大小逐一插入到已經排序好的有序序列中,直到所有的元素都插入完成,得到一個新的有序序列。
// 打印
void PrintArr(int* a, int n)
{assert(a);for (int i = 0; i < n; i++){printf("%d ", a[i]);}printf("\n");
}
單趟排序的思路:假設一個序列已經排序好了,現在要插入一個元素,怎么插入呢?看下面的過程。
// 單趟
// 要比較的最后一個元素的下標
int end;
// 要插入的新元素,先保存起來
int temp = a[end+1];
while(end >= 0)
{// 如果比要比較的元素小,則將這個元素后移if(tmp < a[end]){a[end+1] = a[end];// 繼續跟前一個元素比較end--;}else{break;}
}
// 走到這,1.tmp比要比較的元素大 2.比較完了,tmp比第一個元素還小,end為-1
a[end+1] = tmp;
多趟排序的思路:那么,我們就可以將亂序序列的第一個元素看做是一個已經排序好的序列,將它的后一個元素插入到這個排序好的序列中,這兩個元素就是新的排序好的序列,再將后一個元素插入到這個已經排序好的序列,依次類比。直到最后一個元素插入到已經排序好的序列中,這整個亂序序列就變成有序序列了。
void InsertSort(int* a, int n)
{assert(a);//多趟排序for (int i = 0; i < n - 1; i++) // 注意:i結束條件為最后一個元素的前一個元素下標{// 單趟// 要比較的最后一個元素的下標int end = i;// 要插入的新元素,先保存起來int tmp = a[end + 1];// 把end+1的元素插入到[0,end]while (end >= 0){// 如果比最后一個元素小,則將最后一個元素后移if (tmp < a[end]){a[end + 1] = a[end];end--;}else{break;}}// 走到這,1.tmp比要比較的元素大 2.比較完了,比第一個元素還小,end為-1a[end + 1] = tmp;}
}
我們來測試一下。
void TestInsertSort()
{int a[] = {2, 1, 4, 3, 6, 7, 0, 5, 10, 8, 9};PrintArr(a, sizeof(a) / sizeof(a[0]));InsertSort(a, sizeof(a) / sizeof(a[0]));PrintArr(a, sizeof(a) / sizeof(a[0]));
}int main()
{TestInsertSort();return 0;
}
特性總結
- 元素集合越接近有序,直接插入排序算法的時間效率越高。
- 時間復雜度:O(N^2)。
- 空間復雜度:O(1)。
- 穩定性:穩定。
希爾排序
也叫縮小增量排序。對直接插入排序的優化。直接插入排序在序列有序或接近有序的情況下效率可以達到O(N),而在逆序或接近逆序的情況下效率就是O(N^2),所以效率時好時壞。
希爾排序是如何對直接插入排序進行優化的呢?
- 預排序。先將數組接近有序。
- 直接插入排序。數組接近有序,再直接插入排序。
預排序:將間距為gap的值分為一組,分別對每個組進行插入排序。
我們先實現一組的直接插入排序。
int gap;
int end;
int tmp = a[end+gap];while(end >= 0)
{if(tmp < a[end]){a[end+gap] = a[end];end -= gap;}else{break;}
}
a[end+gap] = tmp;
其實,就相當于是插入排序,只不過插入排序gap為1。
多組是怎么排序的呢?一組一組排嗎?不是的,多組并排,非常巧妙。
int gap;
for (int i = 0; i < n - gap; i++) // i < n-gap很巧妙
{int end = i;int tmp = end + gap;while (end >= 0){if (tmp < a[end]){a[end + gap] = a[end];end -= gap;}else{break;}}a[end + gap] = tmp;
}
gap越大,前面大的數據可以越快到后面,后面小的數,可以越快到前面,但是gap越大,越不接近有序。gap=1時,就是直接插入排序。
那gap設置為幾呢?希爾是這樣設計的:gap=n;gap? = n / gap + 1;只要gap大于1就是預排序,gap等于1為直接插入排序。
void ShellSort(int* a, int n)
{assert(a);int gap = n;// gap大于1預排序 ==1直接插入排序while (gap > 1){//預排序:把間距為gap的值分為一組 進行插入排序。+1保證最后是直接插入排序gap = gap / 3 + 1;//多組并排for (int i = 0; i < n - gap; i++){int end = i;int tmp = end + gap;while (end >= 0){if (tmp < a[end]){a[end + gap] = a[end];end -= gap;}else{break;}}a[end + gap] = tmp;}// 測試用的打印PrintArr(a, n);}
}
我們來測試一下。
void TestInsertSort()
{int a[] = {2, 1, 4, 3, 6, 7, 0, 5, 10, 8, 9};PrintArr(a, sizeof(a) / sizeof(a[0]));InsertSort(a, sizeof(a) / sizeof(a[0]));PrintArr(a, sizeof(a) / sizeof(a[0]));
}void TestShellSort()
{int a[] = { 19,30,11,20,1,2,5,7,4,8,6,26,3,29 };PrintArr(a, sizeof(a) / sizeof(a[0]));ShellSort(a, sizeof(a) / sizeof(a[0]));PrintArr(a, sizeof(a) / sizeof(a[0]));
}
下面我們來測試一下直接插入排序和希爾排序的效率。
void TestOp()
{const int N = 100000;srand(time(0));int* a1 = (int*)malloc(sizeof(int) * N);int* a2 = (int*)malloc(sizeof(int) * N);for (int i = 0; i < N; i++){a1[i] = rand();a2[i] = a1[i];}int begin1 = clock();InsertSort(a1, N);int end1 = clock();int begin2 = clock();ShellSort(a2, N);int end2 = clock();printf("InsertSort time: %d milliseconds\n", end1 - begin1);printf("ShellSort time: %d milliseconds\n", end2 - begin2);free(a1);free(a2);
}int main()
{TestOp();return 0;
}
特性總結
- 希爾排序是對直接插入排序的優化。
- 當gap>1時都是預排序,目的是讓序列接近有序。當gap==1時,數組已經接近有序了,直接插入排序,可以達到優化效果。
- 希爾排序的時間復雜度不好計算,因為gap的取值方法有很多。大概為O(N^1.25)~O(1.6 * N^1.25)。
- 穩定性:不穩定。
選擇排序
直接選擇排序
每一次都從待排序序列中找出最小元素與最大元素,放在序列的起始位置和末尾位置,直到最后所有元素排完。
void SelectSort(int* a, int n)
{assert(a);int begin = 0;int end = n-1;while (begin < end){int mini = begin; // 最小元素的下標int maxi = begin; // 最小元素的下標for (int i = begin + 1; i <= end; i++){//在[begin,end]找最小值和最大值的下標if (a[i] < a[mini]){mini = i;}if (a[i] > a[maxi]){maxi = i;}}Swap(&a[begin], &a[mini]);// 如果begin和maxi的位置重疊,最大值已經被換走了,所以maxi的值需要修正if (begin == maxi){maxi = mini;}Swap(&a[end], &a[maxi]);begin++;end--;}
}
來測試一下。
void TestSelectSort()
{int a[] = { 9,1,2,5,7,4,8,6,3,5 };PrintArr(a, sizeof(a) / sizeof(a[0]));SelectSort(a, sizeof(a) / sizeof(a[0]));PrintArr(a, sizeof(a) / sizeof(a[0]));
}int main()
{TestSelectSort();return 0;
}
特性總結
- 效率不高。
- 時間復雜度:O(N^2)。
- 空間復雜度:O(1)。
- 穩定性:不穩定。
堆排序
利用堆來進行選擇排序,排升序,建大堆;排降序,建小堆。關于堆排序可以看下面這篇文章。
《二叉樹:二叉樹的順序結構->堆》
// 大堆向下調整算法
// 注意:調整的樹的左右子樹必須為大堆
void AdjustDown(int* a, int n, int root)
{// 父親int parent = root;// 1.選出左右孩子較大的孩子跟父親比較// 默認較大的孩子為左孩子int child = parent * 2 + 1;// 終止條件孩子到葉子結點最后跟父親比一次while (child < n){// 2.如果右孩子大于左孩子,則較大的孩子為右孩子 if (child + 1 < n && a[child + 1] > a[child]){child++;}// 3.如果孩子大于父親,則跟父親交換if (a[child] > a[parent]){Swap(&a[child], &a[parent]);parent = child;child = parent * 2 + 1;}else{break;}}
}void HeapSort(int* a, int n)
{assert(a);//建堆 排升序 建大堆for (int i = (n - 1 - 1) / 2; i >= 0; i--){AdjustDown(a, n, i);}int end = n - 1;while (end >= 1){// 交換堆頂與最后一個元素Swap(&a[0], &a[end]);// 向下調整AdjustDown(a, end, 0);end--;}
}
來測試一下。
void TestHeapSort()
{int a[] = { 9,1,2,5,7,4,8,6,3,5 };PrintArr(a, sizeof(a) / sizeof(a[0]));HeapSort(a, sizeof(a) / sizeof(a[0]));PrintArr(a, sizeof(a) / sizeof(a[0]));
}int main()
{TestHeapSort();return 0;
}
特性總結
- 使用堆來選數,效率高。
- 時間復雜度:O(NlogN)。
- 空間復雜度:O(1)。
- 穩定性:不穩定。
交換排序
根據序列中兩個鍵值的比較結果來對換這兩個記錄在序列中的位置。特點是:鍵值較大的記錄向序列的尾部移動,鍵值較小的記錄向序列的前部移動。
冒泡排序
void BubbleSort(int* a, int n)
{assert(a);int i = 0;// 整體for (int j = 0; j < n; j++){// 單趟// 判斷是否有序,如果有序,不用比較了,直接退出int flag = 0;for (i = 0; i < n-1-j; i++){if (a[i] > a[i + 1]){// 交換Swap(&a[i], &a[i + 1]);flag = 1;}}if (flag == 0){break;}}
}
來測試一下。
void TestBubbleSort()
{//int a[] = { 0,5,7,6,8,9,3,2,4,1 };//int a[] = { 0,9,1,2,3,4,5,6,7,8 };int a[] = { 9,8,7,6,5,4,3,2,1,0 };PrintArr(a, sizeof(a) / sizeof(a[0]));BubbleSort(a, sizeof(a) / sizeof(a[0]));PrintArr(a, sizeof(a) / sizeof(a[0]));
}int main()
{TestSelectSort();return 0;
}
特性總結
- 非常容易理解。
- 時間復雜度:O(N^2)。
- 空間復雜度:O(1)。
- 穩定性:穩定。
快速排序
是一種二叉樹結構的交換排序方法。取待排序元素序列中的某元素key作為基準值,按照該key,將排序集合分為兩個子序列,左子序列中所有元素都小于key,右子序列所有元素都大于key。然后左子序列和右子序列分別重復該過程,直到所有的元素都到相應的位置上。
通常取key為最右邊的值,或最左邊的值。
左右指針法
這樣,比key小的值,都換到前面了,比key大的值都換到后面了,而key在正確位置。
來看單趟排序是怎么排的。
// 單趟
int PartSort(int* a, int begin, int end)
{// key下標// 選最后一個值作為keyint keyIndex = end;while (begin < end){// 讓左邊先走// 左邊找比key大的while (begin < end && a[begin] <= a[keyIndex]) // 注意:為>=,不然會造成死循環,例如 3 5 4 7 1 2 8 5 7 5{begin++;}// 右邊再走// 右邊找比key小的while (begin < end && a[end] >= a[keyIndex]) // 注意:為>=,不然會造成死循環,例如 3 5 4 7 1 2 8 5 7 5{end--;}// 交換// 左邊的大值就交換到后邊了,右邊的小值就交換到前面了Swap(&a[begin], &a[end]);}// 走到這,代表相遇了,相遇的位置的值和key交換// 交換完之后,不管左邊和右邊是否是有序的,總之,key的位置到了正確的位置// 如果選最后一個值作為key,讓左邊先走可以保證相遇的位置的值是比key大的Swap(&a[begin], &a[keyIndex]);// 返回相遇位置return begin;
}
多趟排序,將左子序列和右子序列遞歸重復該過程即可完成整個排序。
// 多趟
void QuickSort(int* a, int left, int right)
{// 遞歸結束條件if (left >= right)return;// 此時相遇位置的值已經是正確的位置int div = PartSort(a, left, right);PrintArr(a + left, right - left + 1);// 用于打印測試的printf("[%d, %d]%d[%d, %d]\n", left, div - 1, div, div + 1, right);// 遞歸的思想,讓該位置的左邊和右邊按照同樣的思想進行排序QuickSort(a, left, div - 1);QuickSort(a, div + 1, right);
}
?來測試一下。
void TestQuickSort()
{int a[] = { 6,1,2,7,9,3,4,8,10,5 };// 如果序列本來就有序// int a[] = { 1,2,3,4,5,6,7,8,9};PrintArr(a, sizeof(a) / sizeof(a[0]));QuickSort(a, 0,sizeof(a) / sizeof(a[0])-1);PrintArr(a, sizeof(a) / sizeof(a[0]));
}int main()
{TestQuickSort();return 0;
}
可以看到遞歸的整個過程。?
再來測試一下。
void TestQuickSort()
{// int a[] = { 6,1,2,7,9,3,4,8,10,5 };// 如果序列本來就有序int a[] = { 1,2,3,4,5,6,7,8,9};PrintArr(a, sizeof(a) / sizeof(a[0]));QuickSort(a, 0,sizeof(a) / sizeof(a[0])-1);PrintArr(a, sizeof(a) / sizeof(a[0]));
}int main()
{TestQuickSort();return 0;
}
快速排序的最好情況:如果每次遞歸取key值都能取到中位數,排序的效率是最高的,因為每次都能平均將左子序列和右子序列劃分開。時間復雜度為O(NlogN)。
快速排序的最壞情況:每次遞歸取key值都是最大值或最小值,排序的效率是最差的,也就是序列在有序或接近有序的情況下,每次劃分都會產生一個空的子序列和一個長度僅比原序列少 1 的子序列。時間復雜度為O(N^2)。
那么,實際中,我們無法保證取到的key是中位數,但是,是不是可以考慮不要取到最大的或最小的。
三位數取中
三位數取中,能避免取到最大值和最小值。如果在最壞的情況有序的情況下,取序列中間的元素作為key值,與最后的元素交換,還是最右邊的值作為key值,此時就變成了最好的情況。如果是在其他,也能避免取到最大值和最小值。也就是說三位數取中,讓最壞的情況不再出現,時間復雜度綜合為O(NlogN)。
// 三位數選中
int GetMidIndex(int* a,int begin,int end)
{int midIndex = (begin + end) / 2;if (a[begin] > a[midIndex]){// begin > mid mid > endif (a[midIndex] > a[end]){return midIndex;}// begin > mid mid<end else{if (a[begin] < a[end]){return begin;}else{return midIndex;}}}// begin <midelse{if (a[midIndex] < a[end]){return midIndex;}// begin<mid mid>endelse{if (a[begin] < a[end]){return end;}else{return begin;}}}
}// 單趟
int PartSort1(int* a, int begin, int end)
{// 三位數選中 避免最壞情況int midIndex = GetMidIndex(a, begin, end);Swap(&a[midIndex], &a[end]);// key下標// 選最后一個值作為keyint keyIndex = end;while (begin < end){// 讓左邊先走// 左邊找比key大的while (begin < end && a[begin] <= a[keyIndex]) // 注意:為>=,不然會造成死循環,例如 3 5 4 7 1 2 8 5 7 5{begin++;}// 右邊再走// 右邊找比key小的while (begin < end && a[end] >= a[keyIndex]) // 注意:為>=,不然會造成死循環,例如 3 5 4 7 1 2 8 5 7 5{end--;}// 交換// 左邊的大值就交換到后邊了,右邊的小值就交換到前面了Swap(&a[begin], &a[end]);}// 走到這,代表相遇了,相遇的位置的值和key交換// 交換完之后,不管左邊和右邊是否是有序的,總之,key的位置到了正確的位置// 如果選最后一個值作為key,讓左邊先走可以保證相遇的位置的值是比key大的Swap(&a[begin], &a[keyIndex]);// 返回相遇位置return begin;
}// 多趟
void QuickSort(int* a, int left, int right)
{// 遞歸結束條件if (left >= right)return;// 此時相遇位置的值已經是正確的位置int div = PartSort1(a, left, right);// PrintArr(a + left, right - left + 1);// 用于打印測試的// printf("[%d, %d]%d[%d, %d]\n", left, div - 1, div, div + 1, right);// 遞歸的思想,讓該位置的左邊和右邊按照同樣的思想進行排序QuickSort(a, left, div - 1);QuickSort(a, div + 1, right);
}
挖坑法
取最右邊(也可以左邊的)的值作為key。該位置為坑,左邊找比key大的元素,填入到坑里,該元素的位置成為新的坑;右邊找比坑小的元素,填入到新坑里,該元素位置成為新的坑,直到相遇,將key填入到新坑。此時key的左邊就是比key小的,右邊就是比key大的。再將該key左邊的序列和右邊的序列迭代重復此操作即可。
// 單趟
int PartSort2(int* a, int begin, int end)
{assert(a);// 三位數選中 避免最壞情況int midIndex = GetMidIndex(a, begin, end);Swap(&a[midIndex], &a[end]);// 最后一個元素為坑// 坑的意思就是這的值被拿走了,可以覆蓋新的值int key = a[end];while (begin < end){// begin找大的放進坑 begin成為新坑while (begin < end && a[begin] <= key){begin++;}a[end] = a[begin];// end找小的放進新坑 end成為新坑while (begin < end && a[end] >= key){end--;}a[begin] = a[end];}//把最后一個元素放到相遇位置a[begin] = key;return begin;
}
// 多趟
void QuickSort(int* a, int left, int right)
{// 遞歸結束條件if (left >= right)return;// 此時相遇位置的值已經是正確的位置// 左右指針法// int div = PartSort1(a, left, right);// 挖坑法int div = PartSort2(a, left, right);// PrintArr(a + left, right - left + 1);// 用于打印測試的// printf("[%d, %d]%d[%d, %d]\n", left, div - 1, div, div + 1, right);// 遞歸的思想,讓該位置的左邊和右邊按照同樣的思想進行排序QuickSort(a, left, div - 1);QuickSort(a, div + 1, right);
}
前后指針法?
// 單趟
int PartSort3(int* a, int begin, int end)
{assert(a);//三位數選中 避免最壞情況int midIndex = GetMidIndex(a, begin, end);Swap(&a[midIndex], &a[end]);int keyIndex = end;int prev = begin - 1;int cur = begin;while (cur < end){if (a[cur] < a[keyIndex] && ++prev != a[cur]) // ++prev如果和cur相等 自己跟自己交換不用交換{//交換Swap(&a[prev], &a[cur]);}cur++;}Swap(&a[++prev], &a[keyIndex]);return prev;
}
// 多趟
void QuickSort(int* a, int left, int right)
{// 遞歸結束條件if (left >= right)return;// 此時相遇位置的值已經是正確的位置// 左右指針法// int div = PartSort1(a, left, right);// 挖坑法// int div = PartSort2(a, left, right);// 前后指針法int div = PartSort3(a, left, right);// PrintArr(a + left, right - left + 1);// 用于打印測試的// printf("[%d, %d]%d[%d, %d]\n", left, div - 1, div, div + 1, right);// 遞歸的思想,讓該位置的左邊和右邊按照同樣的思想進行排序QuickSort(a, left, div - 1);QuickSort(a, div + 1, right);
}
快速排序就像一顆二叉樹一樣,選出一個key分出左區間和右區間,左區間的值都比key小,右區間的值都比key大,再再左區間中找出一個key分出左區間和右區間,在右區間中找出一個key分出左區間和右區間......
快速排序還有可以優化的地方,當不斷的遞歸劃分區間,區間已經數據很少時,不用再遞歸方式劃分區間排序了,使用插入排序去排序,減少整體的遞歸次數。
// 多趟
void QuickSort(int* a, int left, int right)
{// 遞歸結束條件if (left >= right)return;// 此時相遇位置的值已經是正確的位置// 左右指針法// int div = PartSort1(a, left, right);// 挖坑法// int div = PartSort2(a, left, right);// 前后指針法int div = PartSort3(a, left, right);// PrintArr(a + left, right - left + 1);// 用于打印測試的// printf("[%d, %d]%d[%d, %d]\n", left, div - 1, div, div + 1, right);// 區間大于十個元素用快速排序if ((right - left + 1) > 10){int div = PartSort3(a, left, right);// 遞歸的思想,讓該位置的左邊和右邊按照同樣的思想進行排序QuickSort(a, left, div - 1);QuickSort(a, div + 1, right);}// 小于十個元素用插入排序else{InsertSort(a + left, right - left + 1);}
}
特性總結
- 快速排序整體的綜合性能和使用場景都是比較好的,所以才敢叫快速排序。
- 時間復雜度:O(NlogN)。
- 空間復雜度:O(1),使用棧模擬則為O(logN)。
- 穩定性:不穩定。