介绍
堆(Heap)是一种特殊的树形数据结构,其中每个节点都满足其父节点的值大于或等于(小于或等于)其子节点的值。堆结构最常用于排序算法中,常见的有堆排序,堆还可以在优先队列、图形算法等领域中使用。
在本文中,我们将使用Python实现堆的数据结构和一些操作,例如:堆的插入、删除、构建等。在学习过程中,您将熟悉堆的概念、碰到一些Python中的经典算法应用,并建立对计算机科学的深刻理解。
正文
一、Python实现堆的基本结构
在Python中,您可以使用列表来模拟实现堆的数据结构,其中根节点是列表的第一个元素。每个节点的左子节点在列表中的索引为2i,右子节点的索引为2i+1,父节点的索引为i/2整除(i为节点的索引,从1开始编号)。
二、堆的插入
堆的插入是指将一个节点添加到堆的末尾,再根据堆的性质把它安置在正确的位置,确保仍然是一个堆。我们首先将新元素插入堆的末尾,然后不断跟它的父节点进行比较,如果父节点的值小于该节点的值,则交换这两个节点的位置,直到该节点的父节点的值大于或等于该节点的值或者该节点已经上移到了根节点。
三、堆的删除
堆的删除操作分为两种情况:删除堆顶元素和删除指定元素。
(1)删除堆顶元素
我们首先获取堆顶元素,即索引为1的元素,将其与最后一个元素交换位置,然后弹出最后一个元素。此时,我们需要让堆重新满足其性质,我们从堆的根开始比较它与其子节点的值,如果与其中的最大值交换,则继续对交换后的节点进行相应的比较,直到该节点比其子节点都大(或小)。这样操作之后,堆仍然满足其性质。
(2)删除指定元素
如果我们希望删除堆中的任意元素,我们需要查找该元素在堆中的位置。最常见的方法是遍历整个堆以寻找该元素,然后再执行与删除堆顶元素相同的操作。然而,这将需要O(n)的时间,其中n是堆的大小。更快的方法是,将该元素的值替换为正无穷大(或负无穷大,具体根据堆是最大堆还是最小堆而决定),然后重复执行删除堆顶元素的操作。
四、堆的构建
通常,在实际中需要将一个未排序的列表转变为一个堆,这个过程被称为堆构建(Heapify)。
(1)堆构建的方法之一是,从最后一个非叶子节点向上进行迭代,一个接一个地执行下滤(SiftDown)操作,以确保每个节点都满足堆的性质。在下滤过程中,我们首先将节点跟它的左右子节点比较,找到其中最大(或最小)的一个,如果该最大(或最小)的子节点比该节点大(或小),则交换两个节点的值。
(2)堆构建的另一种方法是,从堆中的所有非叶子节点中选择每个节点,对它们进行上滤(SiftUp)操作,以确保每个节点都满足堆的性质。在上滤过程中,我们首先将节点跟它的父节点进行比较,如果父节点的值小于该节点的值,则交换这两个节点的位置,直到该节点的父节点的值大于或等于该节点的值或者该节点已经上移到了根节点。
代码部分
class Heap: def __init__(self, lst): self.data = lst self.size = len(lst) def heapify_down(self, i): while i * 2 <= self.size: max_child = self.get_max_child(i) if self.data[i] < self.data[max_child]: self.data[i], self.data[max_child] = self.data[max_child], self.data[i] i = max_child else: break def heapify_up(self, i): while self.get_parent(i) > 0 and self.data[i] > self.get_parent(i): self.data[i], self.data[self.get_parent(i)] = self.data[self.get_parent(i)], self.data[i] i = self.get_parent(i) def get_max_child(self, i): if i * 2 + 1 > self.size or self.data[i * 2] > self.data[i * 2 + 1]: return i * 2 else: return i * 2 + 1 def get_parent(self, i): return self.data[i // 2] if i // 2 > 0 else 0 def insert(self, val): self.size += 1 self.data.append(val) self.heapify_up(self.size) def pop(self): max_val = self.data[1] self.data[1] = self.data[self.size] self.size -= 1 self.data.pop() self.heapify_down(1) return max_val
小结
在本文中,我们介绍了堆的定义、基本结构和常见操作。同时,我们使用Python代码来实现了堆的基本结构、插入和删除操作,以及堆构建操作。
堆是一种非常重要的数据结构,有广泛的应用。掌握堆的基本知识和算法实现,对于理解计算机科学和编程都非常有帮助。