题目描述
如何得到一个数据流中的中位数?
如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。
如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
样例
输入:1, 2, 3, 4
输出:1,1.5,2,2.5
解释:每当数据流读入一个数据,就进行一次判断并输出当前的中位数。
算法
(堆) $O(1)$
用 小根堆 + 大根堆
结构来维护中位数,大根堆存储比较小的一部分数,小根堆存储比较大的一部分数
需要维护结构中大根堆的元素个数最多比小根堆元素个数多 1
如果数的个数是奇数,中位数就是大根堆堆顶,如果是偶数,中位数就是小根堆堆顶和大根堆堆顶之和 / 2
代码实现技巧:每次先把元素添加到大根堆中,如果大根堆堆顶比小根堆堆顶大,构成逆序就需要交换,且要保证大根堆的元素个数最多比小根堆元素个数多 1
时间复杂度
每次往堆中插入元素的时间复杂度为 $O(1)$,求中位数的时间也是 $O(1)$,所以总时间复杂度为 $O(n)$
C++ 代码
class Solution {
public:
priority_queue<int> max_heap;
priority_queue<int, vector<int>, greater<int>> min_heap;
void insert(int num){
max_heap.push(num);
if (min_heap.size() && max_heap.top() > min_heap.top())
{
int maxv = max_heap.top(), minv = min_heap.top();
max_heap.pop(), min_heap.pop();
max_heap.push(minv), min_heap.push(maxv);
}
if (max_heap.size() > min_heap.size() + 1)
{
int maxv = max_heap.top();
max_heap.pop();
min_heap.push(maxv);
}
}
double getMedian(){
if ((max_heap.size() + min_heap.size()) % 2 == 1) return max_heap.top();
return (max_heap.top() + min_heap.top()) / 2.0;
}
};