在面試題中可能會遇到排序算法,畢竟作為程式設計師內功心法,熟練掌握排序算法是很重要的,本文總結了八大經典排序算法的 Python 實現。排序算法是《數據結構與算法》中最基本的算法之一。排序算法可以分為內部排序和外部排序,內部排序是數據記錄在內存中進行排序,而外部排序是因排序的數據很大,一次不能容納全部的排序記錄,在排序過程中需要訪問外存。常見的內部排序算法有:插入排序、希爾排序、選擇排序、冒泡排序、歸併排序、快速排序、堆排序、基數排序等。名詞解釋:
穩定性:排序後 2 個相等鍵值的順序和排序之前它們的順序相同平方階 (O(n²)) 排序各類簡單排序:直接插入、直接選擇和冒泡排序。線性對數階 (O(nlogn)) 排序快速排序、堆排序和歸併排序。線性階 (O(n)) 排序基數排序,此外還有桶、箱排序。關於穩定性:
穩定的排序算法:冒泡排序、插入排序、歸併排序和基數排序。(冒插歸基)不穩定的排序算法:選擇排序、快速排序、希爾排序、堆排序。(選快希堆)二、冒泡排序冒泡排序是一種簡單的排序算法。它重複地走訪過要排序的數列,一次比較兩個元素,如果它們的順序錯誤就把它們交換過來。走訪數列的工作是重複地進行直到沒有再需要交換,也就是說該數列已經排序完成。這個算法的名字由來是因為越小的元素會經由交換慢慢「浮」到數列的頂端。這個算法的名字由來是因為越小的元素會經由交換慢慢 "浮" 到數列的頂端(升序或降序排列),就如同碳酸飲料中二氧化碳的氣泡最終會上浮到頂端一樣,故名 "冒泡排序"。
算法原理:
比較相鄰的元素,如果第一個比第二個大,就交換他們兩個。對每一對相鄰元素做同樣的工作,從開始第一對到結尾的最後一對。在這一點,最後的元素應該會是最大的數。持續每次對越來越少的元素重複上面的步驟,直到沒有任何一對數字需要比較。動圖演示過程如下:
def bubble_sort(nums):
for i in range(len(nums) - 1):
flag = True # 每一趟置flag為True
for j in range(0, len(nums) - i - 1):
if nums[j] > nums[j + 1]:
nums[j], nums[j + 1] = nums[j + 1], nums[j]
flag = False # 有交換 flag置為False
# flag為True 說明到這趟已經沒有交換 提前跳出循環 提高算法效率
if flag:
break
return nums
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(bubble_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
三、選擇排序選擇排序是一種簡單直觀的排序算法,無論什麼數據進去都是 O(n²) 的時間複雜度。所以用到它的時候,數據規模越小越好。唯一的好處可能就是不佔用額外的內存空間了吧。
算法原理:
首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置再從剩餘未排序元素中繼續尋找最小(大)元素,然後放到已排序序列的末尾。動圖演示如下:
算法實現:
def select_sort(nums):
for i in range(len(nums)-1):
min_index = i
# i+1是開始從i之後的元素找最小值,並用minindex標記它的索引
for j in range(i+1, len(nums)):
if nums[j] < nums[min_index]:
min_index = j
# 如果和最開始的標記的最小元素不等,就交換兩個元素
if min_index != i:
nums[i], nums[min_index] = nums[min_index], nums[i]
return nums
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(select_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
四、插入排序插入排序的代碼實現雖然沒有冒泡排序和選擇排序那麼簡單粗暴,但它的原理應該是最容易理解的了,因為只要打過撲克牌的人都應該能懂。插入排序是一種最簡單直觀的排序算法,它的工作原理是通過構建有序序列,對於未排序數據,在已排序序列中從後向前掃描,找到相應位置並插入。插入排序和冒泡排序一樣,也有一種優化算法,叫做拆半插入。
算法原理:
將第一待排序序列第一個元素看做一個有序序列,把第二個元素到最後一個元素當成是未排序序列。從頭到尾依次掃描未排序序列,將掃描到的每個元素插入有序序列的適當位置。(如果待插入的元素與有序序列中的某個元素相等,則將待插入元素插入到相等元素的後面)動態圖演示如下:
算法實現:
def insert_ort(arr):
for i in range(len(arr)):
preIndex = i-1
current = arr[i]
while preIndex >= 0 and arr[preIndex] > current:
arr[preIndex + 1] = arr[preIndex]
preIndex -= 1
arr[preIndex + 1] = current
return arr
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(insert_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
五、希爾排序希爾排序,也稱遞減增量排序算法,是插入排序的一種更高效的改進版本。但希爾排序是不穩定排序算法。希爾排序是基於插入排序的以下兩點性質而提出改進方法的:
插入排序在對幾乎已經排好序的數據操作時,效率高,即可以達到線性排序的效率;但插入排序一般來說是低效的,因為插入排序每次只能將數據移動一位;希爾排序的基本思想是:先將整個待排序的記錄序列分割成為若干子序列分別進行直接插入排序,待整個序列中的記錄「基本有序」時,再對全體記錄進行依次直接插入排序。算法原理:
選擇一個增量序列 t1,t2,……,tk,其中 ti > tj, tk = 1;每趟排序,根據對應的增量 ti,將待排序列分割成若干長度為 m 的子序列,分別對各子表進行直接插入排序。僅增量因子為 1 時,整個序列作為一個表來處理,表長度即為整個序列的長度。動圖演示如下:
算法實現:
def shell_sort(nums):
n = len(nums)
gap = n // 2 # 定義增量
# gap等於1的時候相當於最後一步是一插入排序
while gap >= 1:
for j in range(gap, n):
i = j
# 增量的插入排序版本
while (i-gap) >= 0:
if nums[i] < nums[i-gap]:
nums[i], nums[i-gap] = nums[i-gap], nums[i]
i -= gap
else:
break
gap //= 2
return nums
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(shell_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
六、歸併排序歸併排序(Merge sort)是建立在歸併操作上的一種有效的排序算法。該算法是採用分治法(Divide and Conquer)的一個非常典型的應用。作為一種典型的分而治之思想的算法應用,歸併排序的實現由兩種方法:
自上而下的遞歸(所有遞歸的方法都可以用迭代重寫,所以就有了第 2 種方法);和選擇排序一樣,歸併排序的性能不受輸入數據的影響,但表現比選擇排序好的多,因為始終都是 O(nlogn) 的時間複雜度。代價是需要額外的內存空間。
算法原理:
開闢內存空間,使其大小為兩個已經排序序列之和,該空間用來存放合併後的序列;設定兩個指針,最初位置分別為兩個已經排序序列的起始位置;比較兩個指針所指向的元素,選擇相對小的元素放入到合併空間,並移動指針到下一位置;動態圖演示如下:
算法實現:
from math import floor
def merge_sort(arr):
if(len(arr) < 2):
return arr
# 二分
middle = floor(len(arr) / 2)
left, right = arr[0:middle], arr[middle:]
# 遞歸
return merge(merge_sort(left), merge_sort(right))
def merge(left, right):
result = []
# 分治
while left and right:
if left[0] <= right[0]:
result.append(left.pop(0))
else:
result.append(right.pop(0))
while left:
result.append(left.pop(0))
while right:
result.append(right.pop(0))
return result
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(merge_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
七、快速排序快速排序是由東尼·霍爾所發展的一種排序算法。在平均狀況下,排序 n 個項目要 Ο(nlogn) 次比較。在最壞狀況下則需要 Ο(n²) 次比較,但這種狀況並不常見。事實上,快速排序通常明顯比其他 Ο(nlogn) 算法更快,因為它的內部循環(inner loop)可以在大部分的架構上很有效率地被實現出來。快速排序使用分治法(Divide and conquer)策略來把一個串行(list)分為兩個子串行(sub-lists)。快速排序又是一種分而治之思想在排序算法上的典型應用。本質上來看,快速排序應該算是在冒泡排序基礎上的遞歸分治法。快速排序的名字起的是簡單粗暴,因為一聽到這個名字你就知道它存在的意義,就是快,而且效率高!它是處理大數據最快的排序算法之一了。雖然 Worst Case 的時間複雜度達到了 O(n²),但是人家就是優秀,在大多數情況下都比平均時間複雜度為 O(n logn) 的排序算法表現要更好。查閱資料了解到:快速排序的最壞運行情況是 O(n²),比如說順序數列的快排。但它的平攤期望時間是 O(nlogn),且 O(nlogn) 記號中隱含的常數因子很小,比複雜度穩定等於 O(nlogn) 的歸併排序要小很多。所以,對絕大多數順序性較弱的隨機數列而言,快速排序總是優於歸併排序。
算法原理:
從數列中挑出一個元素,稱為 "基準"(pivot);重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的後面(相同的數可以到任一邊)。在這個分區退出之後,該基準就處於數列的中間位置。這個稱為分區(partition)操作;遞歸地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序;遞歸的最底部情形,是數列的大小是0或1,也就是永遠都已經被排序好了。雖然一直遞歸下去,但是這個算法總會退出,因為在每次的迭代(iteration)中,它至少會把一個元素擺到它最後的位置去。
動態圖演示如下:def quick_sort(arr, left=None, right=None):
left = 0 if not isinstance(left,(int, float)) else left
right = len(arr) - 1 if not isinstance(right,(int, float)) else right
if left < right:
partitionIndex = partition(arr, left, right)
quick_sort(arr, left, partitionIndex - 1)
quick_sort(arr, partitionIndex + 1, right)
return arr
def partition(arr, left, right):
pivot = left
index = pivot+1
i = index
while i <= right:
if arr[i] < arr[pivot]:
swap(arr, i, index)
index += 1
i+=1
swap(arr, pivot, index - 1)
return index - 1
def swap(arr, i, j):
arr[i], arr[j] = arr[j], arr[i]
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(quick_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
八、堆排序堆排序(Heapsort)是指利用堆這種數據結構所設計的一種排序算法。堆積是一個近似完全二叉樹的結構,並同時滿足堆積的性質:即子結點的鍵值或索引總是小於(或者大於)它的父節點。堆排序可以說是一種利用堆的概念來排序的選擇排序。分為兩種方法:
大頂堆:每個節點的值都大於或等於其子節點的值,在堆排序算法中用於升序排列;小頂堆:每個節點的值都小於或等於其子節點的值,在堆排序算法中用於降序排列;堆排序的平均時間複雜度為 Ο(nlogn)。算法原理:
將待排序序列構建成一個堆 H[0……n-1],根據(升序降序需求)選擇大頂堆或小頂堆;把堆的尺寸縮小 1,並調用 shift_down(0),目的是把新的數組頂端數據調整到相應位置;動圖演示如下:
算法實現:
from math import floor
def buildMaxHeap(arr):
for i in range(floor(len(arr) / 2), -1, -1):
heapify(arr, i)
def heapify(arr, i):
left = 2 * i + 1
right = 2 * i + 2
largest = i
if left < arrLen and arr[left] > arr[largest]:
largest = left
if right < arrLen and arr[right] > arr[largest]:
largest = right
if largest != i:
swap(arr, i, largest)
heapify(arr, largest)
def swap(arr, i, j):
arr[i], arr[j] = arr[j], arr[i]
def heap_sort(arr):
global arrLen
arrLen = len(arr)
buildMaxHeap(arr)
for i in range(len(arr)-1, 0, -1):
swap(arr, 0, i)
arrLen -= 1
heapify(arr, 0)
return arr
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(heap_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]
九、基數排序基數排序是一種非比較型整數排序算法,其原理是將整數按位數切割成不同的數字,然後按每個位數分別比較。由於整數也可以表達字符串(比如名字或日期)和特定格式的浮點數,所以基數排序也不是只能使用於整數。三種排序算法都利用了桶的概念,但對桶的使用方法上有明顯差異:
基數排序是按照低位先排序,然後收集;再按照高位排序,然後再收集;依次類推,直到最高位。有時候有些屬性是有優先級順序的,先按低優先級排序,再按高優先級排序。最後的次序就是高優先級高的在前,高優先級相同的低優先級高的在前。
算法原理:
arr為原始數組,從最低位開始取每個位組成 radix 數組;對 radix 進行計數排序(利用計數排序適用於小範圍數的特點);動圖演示如下:
算法實現:
def radix_sort(nums):
# 算n:為了計算最高位
max_num = max(nums)
n = 1
while max_num > 10 ** n:
n += 1
for k in range(n):
# 初始化0-9個桶來排序
buckets = [[] for i in range(10)]
for subnum in nums:
buckets[int(subnum / (10 ** k) % 10)].append(subnum)
nums = [num for bucket in buckets for num in bucket]
return nums
s = [3, 44, 38, 5, 47, 15, 36, 26, 27, 2, 46, 4, 19, 50, 48]
print(radix_sort(s))
# 結果如下:
# [2, 3, 4, 5, 15, 19, 26, 27, 36, 38, 44, 46, 47, 48, 50]