题目描述
如果我们交换字符串 X
中的两个不同位置的字母,使得它和字符串 Y
相等,那么称 X
和 Y
两个字符串相似。
例如,"tars"
和 "rats"
是相似的 (交换 0
与 2
的位置);"rats"
和 "arts"
也是相似的,但是 "star"
不与 "tars"
,"rats"
,或 "arts"
相似。
总之,它们通过相似性形成了两个关联组:{"tars", "rats", "arts"}
和 {"star"}
。注意,"tars"
和 "arts"
是在同一组中,即使它们并不相似。形式上,对每个组而言,要确定一个单词在组中,只需要这个词和该组中至少一个单词相似。
我们给出了一个不包含重复的字符串列表 strs
。列表中的每个字符串都是 strs
中其它所有字符串的一个字母异位词。请问 strs
中有多少个相似字符串组?
样例
输入:strs = ["tars","rats","arts","star"]
输出:2
输入:strs = ["omv","ovm"]
输出:1
注意
1 <= strs.length <= 300
1 <= strs[i].length <= 300
strs[i]
只包含小写字母。strs
中的所有单词都具有相同的长度,且是彼此的字母异位词。
算法
(枚举,并查集) $O(n^2m)$
- 暴力枚举字符串对。由于字符串之间都是字母异位词,所以可以通过统计两个字符串相同位置上不相同字符的个数,如果个数为 $0$ 或者为 $2$ 则两个字符串相似。
- 对于相似的字符串,用并查集把他们合并。
- 最后,并查集中集合的个数就是答案。
时间复杂度
- 枚举判断的时间复杂度为 $O(n^2m)$,并查集的时间近似为常数,故总时间复杂度为 $O(n^2m)$。其中 $m$ 是字符串的最大长度。
空间复杂度
- 并查集需要数组,故空间复杂度为 $O(n)$。
C++ 代码
class Solution {
public:
vector<int> f, sz;
int find(int x) {
return x == f[x] ? x : x = find(f[x]);
}
void uni(int x, int y) {
if (sz[x] > sz[y]) {
f[y] = x;
sz[x] += sz[y];
}
else {
f[x] = y;
sz[y] += sz[x];
}
}
bool check(int i, int j, const vector<string>& strs) {
const int m = strs[i].size();
int diff = 0;
for (int k = 0; k < m; k++)
if (strs[i][k] != strs[j][k])
diff++;
return diff == 0 || diff == 2;
}
int numSimilarGroups(vector<string>& strs) {
const int n = strs.size();
f.resize(n);
sz.resize(n);
for (int i = 0; i < n; i++) {
f[i] = i;
sz[i] = 1;
}
for (int i = 0; i < n; i++)
for (int j = i + 1; j < n; j++) {
int x = find(i), y = find(j);
if (x == y)
continue;
if (check(i, j, strs))
uni(x, y);
}
int ans = 0;
for (int i = 0; i < n; i++)
if (i == find(i))
ans++;
return ans;
}
};
check
函数中tot == 2
时无需检查交换后是否相等,因为题目保证都是字母异位词已简化~
为什么堆溢出了= =。。。。。。
之前没有考虑有两个字符串相等的情况,现已修正
膜