堆排序是指利用堆这种数据结构所设计的一种排序算法。堆是一个近似完全二叉树的结构,并且同时满足堆积的性质:即子节点的键值或索引总是小于(大于)它的父节点
1. 前言
堆分为”最大堆”和”最小堆”。最大堆通常用来进行升序排序,而最小堆通常用来进行降序排序,两者属于对称关系,下面就详细的对最大堆实现升序排序进行说明。
最大堆升序排序基本思想:
初始化堆:将数列
a[1....n]
构成最大堆交换数据:将a[1]和a[n]交换,使a[n]是数列中的最大值,然后将a[1…n-1]重新调整为最大堆。接着将a[1]和a[n-1]交换,使a[n-1]是数列a[1…n-1]中的最大值;依此类推,直到整个数列都是有序的
下面,通过图文来解析堆排序实现的过程,注意实现中使用到了”数组实现的二叉堆的性质”。在第一个元素的索引为0的情形中:
性质一: 索引为
i
的左孩子的索引是(2*i + 1)
性质而: 索引为
i
的右孩子的索引是(2*i + 2)
性质三: 索引为
i
的父节点的索引是floor((i - 1)/2)
2. 堆排序实现
下面演示heap_sort_asc(a, n)对a={20,30,90,40,70,110,60,10,100,50,80}, n=11进行堆排序过程。下面是数组a对应的初始化结构:
2.1 初始化堆
在堆排序算法中,首先要将待排序的数组转化为二叉堆。下面演示将数组{20,30,90,40,70,110,60,10,100,50,80}转化为最大堆{110,100,90,40,80,20,60,10,30,50,70}的步骤
i=11/2 - 1, 即i=4
上面是maxheap_down(a, 4, 9)调整过程。maxheap_down(a, 4, 9)的作用是将a[4…9]进行下调;a[4]的左孩子是a[9],右孩子是a[10]。调整时,选择左右孩子中较大的一个(即a[10])和a[4]交换
i=3
上面是maxheap_down(a, 3, 9)调整过程。maxheap_down(a, 3, 9)的作用是将a[3…9]进行下调;a[3]的左孩子是a[7],右孩子是a[8]。调整时,选择左右孩子中较大的一个(即a[8])和a[4]交换
i=2
上面是maxheap_down(a, 2, 9)调整过程。maxheap_down(a, 2, 9)的作用是将a[2…9]进行下调;a[2]的左孩子是a[5],右孩子是a[6]。调整时,选择左右孩子中较大的一个(即a[5])和a[2]交换
i=1
上面是maxheap_down(a, 1, 9)调整过程。maxheap_down(a, 1, 9)的作用是将a[1…9]进行下调;a[1]的左孩子是a[3],右孩子是a[4]。调整时,选择左右孩子中较大的一个(即a[3])和a[1]交换。交换之后,a[3]为30,它比它的右孩子a[8]要大,接着,再将它们交换
i=0
上面是maxheap_down(a, 0, 9)调整过程。maxheap_down(a, 0, 9)的作用是将a[0…9]进行下调;a[0]的左孩子是a[1],右孩子是a[2]。调整时,选择左右孩子中较大的一个(即a[2])和a[0]交换。交换之后,a[2]为20,它比它的左右孩子要大,选择较大的孩子(即左孩子)和a[2]交换
调整完毕,就得到了最大堆。此时,数组{20,30,90,40,70,110,60,10,100,50,80}也就变成了{110,100,90,40,80,20,60,10,30,50,70}。
2.2 交换数据
在将数组转换成最大堆之后,接着要进行交换数据,从而使数组成为一个真正的有序数组。 交换数据部分相对比较简单,下面仅仅给出将最大值放在数组末尾的示意图。
上面是当n=10是,交换数据的示意图。当n=10,首先交换a[0]和a[10],使的a[10]是a[0…10]之间的最大值,然后,调整a[0…9]使它称为最大堆。交换之后: a[10]是有序的! 当n=9时, 首先交换a[0]和a[9],使得a[9]是a[0…9]之间的最大值;然后,调整a[0…8]使它称为最大堆。交换之后: a[9…10]是有序的! … 依此类推,直到a[0…10]是有序的
3. 时间复杂度和稳定性
时间复杂度:O(N*logN)
假设被排序的数列中有N个数。遍历一趟的时间复杂度是O(N),需要遍历多少次呢? 堆排序是采用的二叉堆进行排序的,二叉堆就是一棵二叉树,它需要遍历的次数就是二叉树的深度,而根据完全二叉树的定义,它的深度至少是log(N+1)。最多是多少呢? 由于二叉堆是完全二叉树,因此,它的深度最多也不会超过log(2N)。因此,遍历一趟的时间复杂度是O(N),而遍历次数介于log(N+1)和log(2N)之间;因此得出它的时间复杂度是O(N*logN)。
稳定性:堆排序是不稳定的算法,它不满足稳定算法的定义。它在交换数据的时候,是比较父结点和子节点之间的数据,所以,即便是存在两个数值相等的兄弟节点,它们的相对顺序在排序也可能发生变化
4. 代码实现
1 | package org.example.sort; |