经典排序算法Python实现

图

> 经典排序算法在面试中占有很大的比重,也是基础。
本篇博客所有排序实现均默认从小到大。

1.冒泡排序 BubbleSort

冒泡排序的原理非常简单,它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。

步骤:

  1. 比较相邻的元素。如果第一个比第二个大,就交换他们两个。
  2. 对第0个到第n-1个数据做同样的工作。这时,最大的数就“浮”到了数组最后的位置上。
  3. 针对所有的元素重复以上的步骤,除了最后一个。
  4. 持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较。

实现:

1
2
3
4
5
6
7
8
def bubble_sort(array):
for i in range(len(array)): #共需要遍历len(array)-1次
for j in range(len(array)-1):
if array[j] > array[j+1]:
array[j],array[j+1] = array[j+1],array[j]

array = [5,2,7,1,8,3,4,6,9,0]
bubble_sort(array)


2.选择排序 SelectionSort

步骤:

  1. 在未排序序列中找到最小(大)元素,存放到排序序列的起始位置。
  2. 再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
  3. 以此类推,直到所有元素均排序完毕。

实现:

1
2
3
4
5
6
7
8
9
10
11
def select_sort(array):
for i in range(0, len(array)):
min = i #记录最小值的下标
for j in range(i+1, len(array)):
if array[j] < array[min]:
min = j
array[i], array[min] = array[min], array[i]
print(array)

array = [5,2,7,1,8,3,4,6,9,0]
select_sort(array)


3.插入排序 InsertionSort

插入排序的工作原理是,对于每个未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

步骤:

  1. 从第一个元素开始,该元素可以认为已经被排序
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描
  3. 如果被扫描的元素(已排序)大于新元素,将该元素后移一位
  4. 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
  5. 将新元素插入到该位置后
  6. 重复步骤2~5

在这里插入图片描述
实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 def insert_sort(array):
for i in range(1, len(array)):
current = array[i]
index = i
while index >= 1:
if array[index-1] > current:
array[index] = array[index-1]
index -= 1
else:
break
array[index] = current

array = [5,2,7,1,8,3,4,6,9,0]
insert_sort(array)
array


4.快速排序 QuickSort

快速排序通常明显比同为Ο(n log n)的其他算法更快,因此常被采用,而且快排采用了分治法的思想。

步骤:

  1. 从数列中挑出一个元素作为基准数。
  2. 分区过程,将比基准数大的放到右边,小于或等于它的数都放到左边。
  3. 再对左右区间递归执行第二步,直至各区间只有一个数。

实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
def quick_sort(array):
return qsort(array, 0, len(array)-1)

def qsort(array, left_index, right_index):
if left_index >= right_index:
return array
pivot = array[left_index]
lp = left_index
rp = right_index
while lp < rp:
while array[rp] >= pivot and lp < rp:
rp -= 1
while array[lp] <= pivot and lp < rp:
lp += 1
array[lp], array[rp] = array[rp], array[lp]
array[left_index], array[lp] = array[lp], array[left_index]

qsort(array, left_index, lp-1)
qsort(array, lp+1, right_index)
return array

array = [5,2,7,1,8,3,4,6,9,0]
quick_sort(array)
array


5.归并排序 MergeSort

步骤:
归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组,再合并数组。

先考虑合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。

再考虑递归分解,基本思路是将数组分解成left和right,如果这两个数组内部数据是有序的,那么就可以用上面合并数组的方法将这两个数组合并排序。如何让这两个数组内部是有序的?可以再二分,直至分解出的小组只含有一个元素时为止,此时认为该小组内部已有序。然后合并排序相邻二个小组即可。

在这里插入图片描述
实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
def merge_sort(array):    #拆分操作
if len(array) <= 1:
return array
num = int(len(array)/2)
left = merge_sort(array[ :num]) #样本量减半
right = merge_sort(array[num: ]) #样本量减半
return merge(left, right)

def merge(left, right): #合并操作:外排
l, r = 0, 0
result = [] #外排需要一个装结果的辅助数组
while l<len(left) and r<len(right):
if left[l] < right[r]:
result.append(left[l])
l += 1
else:
result.append(right[r])
r += 1
result += left[l:]
result += right[r:]
return result

array = [5,2,7,1,8,3,4,6,9,0]
merge_sort(array)
array


6.堆排序 HeapSort

堆排序在 top K 问题中使用比较频繁。堆排序是采用二叉堆的数据结构来实现的,虽然实质上还是一维数组。二叉堆是一个近似完全二叉树 .

二叉堆具有以下性质:

  1. 父节点的键值总是大于或等于(小于或等于)任何一个子节点的键值。
  2. 每个节点的左右子树都是一个二叉堆(都是最大堆或最小堆)。

步骤:

  1. 构造最大堆(Build_Max_Heap):若数组下标范围为0~n,考虑到单独一个元素是大根堆,则从下标n/2开始的元素均为大根堆。于是只要从n/2-1开始,向前依次构造大根堆,这样就能保证,构造到某个节点时,它的左右子树都已经是大根堆。
  2. 堆排序(HeapSort):由于堆是用数组模拟的。得到一个大根堆后,数组内部并不是有序的。因此需要将堆化数组有序化。思想是移除根节点,并做最大堆调整的递归运算。第一次将heap[0]与heap[n-1]交换,再对heap[0…n-2]做最大堆调整。第二次将heap[0]与heap[n-2]交换,再对heap[0…n-3]做最大堆调整。重复该操作直至heap[0]和heap[1]交换。由于每次都是将最大的数并入到后面的有序区间,故操作完后整个数组就是有序的了。
  3. 最大堆调整(Max_Heapify):该方法是提供给上述两个过程调用的。目的是将堆的末端子节点作调整,使得子节点永远小于父节点 。

在这里插入图片描述

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
def heapSort(arr):
for i in range(len(arr)-1):
heapInsert(arr, i)
#至此大根堆构造完毕,下面开始不断的取出最大值,同时调整大根堆
print("The heap has been constructed:" + str(array))

size = len(arr)
arr[0], arr[size-1] = arr[size-1], arr[0]
size -= 1
while size > 0:
heapify(arr, 0, size) # heapify后,arr[0]又是堆中的最大值
arr[0], arr[size-1] = arr[size-1], arr[0]
size -= 1

#创建大根堆
def heapInsert(arr, index):
while arr[index] > arr[int((index-1)/2)]: # (index01)/2 是父节点的下标
arr[index], arr[int((index-1)/2)] = arr[int((index-1)/2)], arr[index]
index = int((index-1)/2)

#堆化(就是将不是最大值的堆顶,不断下沉到应该的位置)
def heapify(array, index, heap_size):
leftindex = index*2 + 1 #左子节点
rightindex = leftindex + 1 #右子节点
while leftindex < heap_size:
largest = rightindex if ( rightindex < heap_size and array[rightindex] > array[leftindex] ) else leftindex
largest = largest if array[largest] > array[index] else index

if largest == index:
break
array[index], array[largest] = array[largest], array[index]

index = largest
leftindex = index*2 + 1
rightindex = leftindex + 1

array = [5,2,7,1,8,3,4,6,9,0]
heapSort(array)
print(array)


希尔排序 ShellSort

希尔排序,也称递减增量排序算法,实质是分组插入排序。由 Donald Shell 于1959年提出。希尔排序是非稳定排序算法。

希尔排序的基本思想是:将数组列在一个中并对分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身还是使用数组进行排序。

假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10]
如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样:
13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10

然后我们对每列进行排序:
10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45
将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ]。这时10已经移至正确位置了,然后再以3为步长进行排序:
10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45
排序之后变为:
10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94
此时依序连接在一起时得到:[10, 14, 13, 25, 23, 33, 27, 25, 59, 39, 65, 73, 45, 94, 82, 94]
最后以1步长进行排序(此时就是简单的插入排序了)。

实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
def shell_sort(array):
n = len(array)
gap = round(n/2) #用round()函数四舍五入
while gap>0:
for i in range(gap, n):
temp = array[i]
j = i # 插入排序中要用到的————最后插入位置的下标:j
while j>=gap and array[j-gap]>temp: #这里用插入排序
array[j] = array[j-gap]
j = j-gap
array[j] = temp

gap = round(gap/2)
return array

array = [5,2,7,1,8,3,4,6,9,0]
shell_sort(array)


总结

下面为七种经典排序算法指标对比情况:
在这里插入图片描述

坚持原创分享,您的支持将鼓励我继续创作!