题目描述
给一非空的单词列表,返回前 k 个出现次数最多的单词。
返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率,按字母顺序排序。
示例 1:
输入: [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 “i” 在 “love” 之前。
示例 2:
输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。
注意:
假定 k 总为有效值, 1 ≤ k ≤ 集合元素数。
输入的单词均由小写字母组成。
尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/top-k-frequent-words
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
算法1
(大顶堆) $O(nlogk)$
先统计所有字符串出现个数
再根据优先队列,维护K个元素
其中为了找到出现次数最大的k个元素,利用小顶堆,次数小的直接弹出来。
这里使用大顶堆,但是将出现的次数取反
例如 a-1, b-2, c-2, d-3;经过大顶堆排序-1a, -2c, -2b, -3d; 先按照次数大小排序,次数一样的按照字典序排序c大于b,所以c在前。若k=3,则弹出当前最大值-1.
时间复杂度
参考文献
C++ 代码
class Solution {
public:
vector<string> topKFrequent(vector<string>& words, int k) {
priority_queue<pair<int,string>> q;
unordered_map<string, int> hash;
for(auto &r:words) ++hash[r];
for(auto t:hash){
pair<int,string> p(-t.second, t.first);
q.push(p);
if(q.size() > k) q.pop();
}
vector<string> res(k);
for(int i=k-1;i>=0; --i){
res[i] = q.top().second;
q.pop();
}
return res;
}
};