扫描线专题
leetcode 数组专题 06-扫描线算法(Sweep Line Algorithm)
leetcode 数组专题 06-leetcode.218 the-skyline-problem 力扣.218 天际线问题
leetcode 数组专题 06-leetcode.252 meeting room 力扣.252 会议室
leetcode 数组专题 06-leetcode.253 meeting room ii 力扣.253 会议室 II
chat
什么是扫描线算法?
扫描线算法(Sweep Line Algorithm)是一种常用于解决几何问题(尤其是涉及区间、时间线或事件的重叠问题)的算法。
它的基本思想是“模拟一条扫描线从一个方向扫过所有事件”,在扫描过程中维护一个数据结构来追踪当前的状态(例如活动区间的数量、最小值、最大值等)。
扫描线算法的基本步骤
-
事件表示:每个问题中的区间(例如会议时间)或事件,都可以转化为若干个关键事件(例如开始时间和结束时间)。
-
事件排序:将所有事件按照时间排序(如果时间相同,则根据事件的类型来排序,例如结束事件优先于开始事件)。
-
扫描过程:从最早的事件开始,按照排序顺序逐一处理每个事件,并在处理每个事件时更新状态(例如活动会议的数量、最大活动时间等)。
-
数据维护:根据事件类型,更新当前的活动状态。例如,遇到一个开始事件时,我们增加一个计数,遇到结束事件时,减少计数,或者更新其他需要维护的值。
-
输出结果:在扫描过程中,根据需求输出解答。
应用场景
扫描线算法广泛应用于处理各种区间问题,典型的应用包括:
- 会议安排(检测会议时间是否有重叠)
- 区间覆盖问题(检查是否有足够的资源覆盖所有区间)
- 计算最大并发数(计算在某一时间点活跃的事件数量,如计算最多同时存在的会议数)
- 凸包问题(计算一个点集的最小凸包)
扫描线算法的具体步骤
1. 事件表示与排序
假设我们有若干个区间(如会议的开始时间和结束时间),我们首先将每个区间拆解为两个事件:
一个是开始事件,另一个是结束事件。
每个事件可以表示为一个元组 (time, type)
,其中 time
表示事件发生的时间,type
可以是 +1
(表示开始)或者 -1
(表示结束)。
例如,会议区间 [(5, 10), (8, 12), (13, 16)]
可以拆解为事件:
[(5, +1), (10, -1), (8, +1), (12, -1), (13, +1), (16, -1)]
事件按时间排序。如果有多个事件发生在相同的时间点,则优先处理结束事件,因为结束事件可以使得下一个开始事件得以处理。
2. 事件扫描与状态更新
扫描线的核心是对事件的处理。在扫描线遍历时,我们保持一个计数器(或其他数据结构)来跟踪当前的活动状态。对于会议安排问题,我们使用一个计数器来记录当前同时进行的会议数量。
- 当遇到一个 开始事件(
+1
),增加计数器,表示新的会议开始。 - 当遇到一个 结束事件(
-1
),减少计数器,表示一个会议结束。
3. 结果输出
在扫描过程中,我们可以输出每个时间点的活动状态。例如,我们可以在每次更新计数器时,检查当前同时进行的会议数,或者记录最大会议数等。
例子:检测会议是否有重叠
假设我们有一组会议的时间区间,使用扫描线算法来判断是否所有会议都能参加。
给定的会议区间:[[0, 30], [5, 10], [15, 20]]
1. 拆解事件
我们将每个会议区间拆解成开始事件和结束事件:
[(0, +1), (30, -1), (5, +1), (10, -1), (15, +1), (20, -1)]
2. 事件排序
按时间排序事件,时间相同的情况下优先处理结束事件:
[(0, +1), (5, +1), (10, -1), (15, +1), (20, -1), (30, -1)]
3. 扫描事件并更新状态
我们从第一个事件开始,逐一扫描:
- 在时间
0
处,遇到开始事件+1
,活动会议数增加到 1。 - 在时间
5
处,遇到开始事件+1
,活动会议数增加到 2,说明此时有两个会议重叠。 - 在时间
10
处,遇到结束事件-1
,活动会议数减少到 1。 - 在时间
15
处,遇到开始事件+1
,活动会议数增加到 2,说明此时又有两个会议重叠。 - 在时间
20
处,遇到结束事件-1
,活动会议数减少到 1。 - 在时间
30
处,遇到结束事件-1
,活动会议数减少到 0。
4. 判断是否有重叠
在扫描过程中,我们发现活动会议数有过大于 1 的情况(特别是在时间 5
和时间 15
),因此有重叠会议,返回 false
。
扫描线算法的优势
-
时间复杂度:事件排序的时间复杂度是
O(n log n)
,其中n
是会议数或事件数。扫描线的遍历时间复杂度是O(n)
。因此,整体时间复杂度是O(n log n)
,比暴力算法(O(n^2)
)要高效得多。 -
空间复杂度:需要存储所有事件,空间复杂度为
O(n)
。 -
易于扩展:扫描线算法可以很容易地适应更多的需求,例如统计某一时刻活动的最大数量、求得活动的区间并进行其他计算等。
扩展应用
- 最大并发活动数:通过扫描线算法,我们可以轻松地计算在某个时刻同时进行的最多会议数(即最大并发数)。
- 区间合并:我们还可以通过扫描线算法来合并重叠的区间。
- 区间覆盖:检查一组区间是否能完全覆盖一个目标区间等。
总结
扫描线算法是一种非常强大且高效的算法,尤其适用于处理与区间重叠、事件排序相关的几何问题。
在许多情况下,它比暴力算法要高效得多,尤其是在数据量大的时候,能够显著减少计算的复杂度。
参考资料
https://leetcode.cn/problems/4sum/