题目描述
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/find-median-from-data-stream
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
算法1
(大顶堆+小顶堆) $O(log(n))$
维护两个堆。大顶堆维护比较小的元素;小顶堆维护比较大的元素;则最后中间的up.top或者down.top()即为中位数。
维护堆的方法:当num>=down.top() 时,表示数值较大,放到up;否则(为了保证down中的数最小,小的数push到down中,并且弹出一个down的最大数到up,)。
再维护两个堆的元素个数。
时间复杂度
参考文献
C++ 代码
class MedianFinder {
public:
/** initialize your data structure here. */
MedianFinder() {
}
priority_queue<int> down;
priority_queue<int, vector<int>, greater<int>> up;
void addNum(int num) {
if(down.empty() || num >= down.top()) up.push(num);
else{
down.push(num);
up.push(down.top());
down.pop();
}
if(up.size() > down.size() + 1){
down.push(up.top());
up.pop();
}
}
double findMedian() {
if((up.size() + down.size())% 2 == 1) return up.top();
else return (up.top() + down.top()) / 2.0;
}
};
/**
* Your MedianFinder object will be instantiated and called as such:
* MedianFinder* obj = new MedianFinder();
* obj->addNum(num);
* double param_2 = obj->findMedian();
*/