题目描述
给定一个未排序的整数数组 nums
,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。
请你设计并实现时间复杂度为 O(n)
的算法解决此问题。
示例 1:
输入:nums = [100,4,200,1,3,2] 输出:4 解释:最长数字连续序列是 [1, 2, 3, 4]。它的长度为 4。
示例 2:
输入:nums = [0,3,7,2,5,8,4,6,0,1] 输出:9
提示:
0 <= nums.length <= 105
-109 <= nums[i] <= 109
思路
题目最大难点在于设计出时间复杂度为 O(n)
的算法解决此问题。
从示例看出序列有重复元素,第一步就是通过哈希去重;
unordered_set<int> hash;
经过哈希去重后,元素还是无序的,如果采用快排的情况,此题的时间复杂度就不符合O(n)
的要求了。
我们考虑枚举数组中的每个数 x,考虑以其为起点,不断尝试匹配 x+1,x+2,⋯ 是否存在,假设最长匹配到了 x+y,那么以 x 为起点的最长连续序列即为 x,x+1,x+2,⋯,x+y,其长度为 y+1,我们不断枚举并更新答案即可。
// 比如当前遍历的元素为 10
// 我只需要加多一层循环去判定 11 是否在哈希表中,12 是否在哈希表中...
// 每存在一个连续元素,连续序列长度就 +1
用一个哈希表存储数组中的数,这样查看一个数是否存在即能优化至 O(1) 的时间复杂度。
但是,仅仅是这样我们的算法时间复杂度最坏情况下还是会达到 O(n 2)(即外层需要枚举 O(n) 个数,内层需要暴力匹配 O(n) 次),无法满足题目的要求。但仔细分析这个过程,我们会发现其中执行了很多不必要的枚举,如果已知有一个 x,x+1,x+2,⋯,x+y 的连续序列,而我们却重新从 x+1,x+2 或者是 x+y 处开始尝试匹配,那么得到的结果肯定不会优于枚举 x 为起点的答案,因此我们在外层循环的时候碰到这种情况跳过即可。
// 假如这个哈希表中存在 [11 12 13]
// 第一次遍历的元素是 11 ,此时循环就会寻找哈希表是否存在 12、13、14 ...
// 第二次遍历的元素是 12 ,此时循环就会寻找哈希表是否存在 13、14、15 ...
// 第三次遍历的元素是 13 ,此时循环就会寻找哈希表是否存在 14、15、16 ...
// 从这里可以看到, 13 一共被其他元素寻找了两次,这就是多出来的不必要枚举
那么怎么判断是否跳过呢?由于我们要枚举的数 x 一定是在数组中不存在前驱数 x−1 的,不然按照上面的分析我们会从 x−1 开始尝试匹配,因此我们每次在哈希表中检查是否存在 x−1 即能判断是否需要跳过了。
代码实现
class Solution {
public:
int longestConsecutive(vector<int>& nums) {
// 哈希表
unordered_set<int> hash;
// 将 nums 中的元素存入哈希表去重
for (auto& e : nums) {
hash.insert(e);
}
// 定义 局部连续长度、最大连续长度
int maxlen = 0;
int len = 0;
// 开始遍历哈希表
for (auto& num : hash) {
// 如果当前遍历元素 x ,在哈希表中找到它的前驱数 x-1 ,则跳过
if (hash.find(num - 1) != hash.end()) {
continue;
}
// 确保 x 没有前驱数
int n = num;
// 循环寻找最大连续长度
while (hash.find(n++) != hash.end()) {
++len;
}
maxlen = max(maxlen, len);
len = 0;
}
return maxlen;
}
};
复杂度分析
时间复杂度:O(n),其中 n 为数组的长度。具体分析已在上面正文中给出。
空间复杂度:O(n),哈希表存储数组中所有的数需要 O(n) 的空间。