翻译
原题链接
简述一下就是每次询问重新定义一个字母排序表,问在这个顺序下n个字符串的序列的逆序数是多少。
字典树计算逆序数
先考虑初始状况下,即 a < b < . . . < z a<b<...<z a<b<...<z的情况下,逆序数如何计算。而对于这种多字符串问题,优先考虑的肯定是字典树,我们可以对所有字符串构建一棵字典树,在字典树的每个节点上记录所有经过它的字符串的下标,然后计算两种情况的逆序数:
(1) S i S_{i} Si是 S j S_{j} Sj的前缀,则它们在字典树上的情况一定会在某一个节点 n o d e t node_{t} nodet处满足 i ∈ n o d e t , j ∈ n o d e t i \in node_{t}, j \in node_{t} i∈nodet,j∈nodet,而 i i i将不会出现在 n o d e t node_{t} nodet的任何子节点上,假如 i > j i > j i>j,那就产生了一组逆序对。我们记这种情况的总逆序数为 A N S 1 ANS_{1} ANS1
(2) S i S_{i} Si与 S j S_{j} Sj存在一位不一样的字符,则一定存在一个节点 n o d e t node_{t} nodet,在这里两个字符串走了不同的路,称这两个字符串在这个节点上出现了分歧(后面要用)。于是我们可以遍历每个节点下的两条分支,在这两个分支中跑一遍求逆序数,采用双指针的方式,类似归并排序时求逆序数,复杂度大约为 O ( 13 ∗ 26 ∗ n ) O(13*26*n) O(13∗26∗n),记这种情况的总逆序对数为 A N S 2 ANS_{2} ANS2
于是,答案就是 A N S 1 + A N S 2 ANS_{1}+ANS_{2} ANS1+ANS2。
打乱字母表下如何计算逆序数
那么好,现在考虑字母表排序打乱的情况,上述过程会有什么变化。容易发现,第一种情况不会受到任何影响,仍然是 A N S 1 ANS_{1} ANS1。
对于第二种情况,假如新的顺序变成了 a > b a>b a>b,发现原本因为分歧原因为 a a a与 b b b的字符串大小关系发生变化,在初始的排序下,我们不再需要它们的逆序对,而是要顺序对。而这种变化会在 a a a与 b b b大小关系变化时同时发生,可以将所有因此需要调整的地方统一处理。
思路可能有点抽象,直接上方法。不再直接求 A N S 2 ANS_{2} ANS2,而是两个列表 w 1 [ 26 ] [ 26 ] w_{1}[26][26] w1[26][26]和 w 2 [ 26 ] [ 26 ] w_{2}[26][26] w2[26][26],其中 w 1 [ c 1 ] [ c 2 ] w1[c_{1}][c_{2}] w1[c1][c2]表示两个字符串因为 c 1 c_{1} c1和 c 2 c_{2} c2产生了分歧而产生的顺序对数, w 2 w_{2} w2则是逆序对数,则初始的 A N S 2 ANS2 ANS2其实可以直接表示为:
A N S 2 = ∑ i = 0 25 ∑ j = i + 1 25 w 2 [ i ] [ j ] ANS_{2}=\sum_{i=0}^{25}\sum_{j=i+1}^{25}w_{2}[i][j] ANS2=∑i=025∑j=i+125w2[i][j]
而在新的顺序下,我们设一个数组 w e i g h t [ 26 ] weight[26] weight[26]表示 a a a到 z z z的权重,则 A N S 2 ANS_{2} ANS2可以表示为:
A N S 2 = ∑ i = 0 25 ∑ j = i + 1 25 w 1 [ i ] [ j ] ∗ ( i f w e i g h t [ i ] > w e i g h t [ j ] ) ANS_{2}=\sum_{i=0}^{25}\sum_{j=i+1}^{25}w_{1}[i][j]*(if\ weight[i]>weight[j]) ANS2=∑i=025∑j=i+125w1[i][j]∗(if weight[i]>weight[j])
+ ∑ i = 0 25 ∑ j = i + 1 25 w 2 [ i ] [ j ] ∗ ( i f w e i g h t [ i ] < w e i g h t [ j ] ) \ \ \ \ \ \ \ \ \ \ \ \ +\sum_{i=0}^{25}\sum_{j=i+1}^{25}w_{2}[i][j]*(if\ weight[i]<weight[j]) +∑i=025∑j=i+125w2[i][j]∗(if weight[i]<weight[j])
最后别忘了加上 A N S 1 ANS_{1} ANS1。
时间复杂度
建树阶段为
O
(
∑
i
=
1
n
∣
S
i
∣
)
O(\sum_{i=1}^{n}|S_{i}|)
O(∑i=1n∣Si∣),
求
A
N
S
1
ANS_{1}
ANS1阶段为
O
(
∑
i
=
1
n
∣
S
i
∣
)
O(\sum_{i=1}^{n}|S_{i}|)
O(∑i=1n∣Si∣),
求
w
1
w_{1}
w1,
w
2
w_{2}
w2阶段为
O
(
13
∗
26
∗
∑
i
=
1
n
∣
S
i
∣
)
O(13*26*\sum_{i=1}^{n}|S_{i}|)
O(13∗26∗∑i=1n∣Si∣),
回答询问阶段为
O
(
13
∗
26
∗
q
)
O(13*26*q)
O(13∗26∗q)。
注意,上述时间复杂度只是大约,大概率达不到,且中间有一些微微的剪枝优化 。
此外,千万不要新建一个vector并用另一个vector给它赋值,只为了弄个新的变量名方便写代码,因为vector赋值是默认 O ( s i z e ) O(size) O(size)一个一个拷贝过去的,而不是指针!!!(因为这个TLE了半天)
代码
#include<bits/stdc++.h>
#define int long long
using namespace std;
struct node{
int nxt[26];
int value=-1;
int h;
vector<int> v;
} G[1000006];
int H[500005];
int new_weight[26];
int szG=1;
int w; // 子串形成的逆序对数
int w1[26][26], w2[26][26]; // i与j的比较中产生的逆序对数, 反转后产生的逆序对数
int n, q;
inline void ct(int x, int y) { // 求w1顺序对, w2逆序对
if(G[x].value > G[y].value) swap(x, y); // 保证分别为a子树,b子树
int value1 = G[x].value, value2 = G[y].value;
int t1 = 0, t2 = 0;
while(t1 < G[x].v.size() && t2 < G[y].v.size()) {
if(G[x].v[t1] < G[y].v[t2]) {
w2[value1][value2] += G[y].v.size() - t2;
t1 ++;
} else {
w1[value1][value2] += G[x].v.size() - t1;
t2 ++;
}
}
}
inline void ct2(int x) { // 求ANS1,即前缀关系的逆序数
vector<int> v1, v2; // 消失的,剩余的
for(int i=0;i<G[x].v.size();i++) {
int now = G[x].v[i];
if(H[now] == G[x].h) {
v1.push_back(now);
} else {
v2.push_back(now);
}
}
int t1 = 0, t2 = 0;
while(t1 < v1.size() && t2 < v2.size()) {
if(v1[t1] < v2[t2]) {
t1 ++;
} else {
w += v1.size() - t1;
t2 ++;
}
}
}
inline void dfs(int id) {
if(id != 0 && G[id].v.size() <= 1) return;
for(int i=0;i<26;i++) {
if(G[id].nxt[i] == 0) continue;
for(int j=i+1;j<26;j++) {
if(G[id].nxt[j] == 0) continue;
ct(G[id].nxt[i], G[id].nxt[j]);
}
}
ct2(id);
for(int i=0;i<26;i++) {
if(G[id].nxt[i] == 0) continue;
dfs(G[id].nxt[i]);
}
}
signed main() {
cin>>n>>q;
for(int i=1;i<=n;i++) {
string s; cin>>s;
H[i] = s.length();
int id = 0; // 根
for(int j=0;j<s.size();j++) {
if(G[id].nxt[s[j]-'a'] == 0) { // 下一个节点不存在
G[szG].value = s[j] - 'a';
G[szG].h = G[id].h + 1;
G[id].nxt[s[j]-'a'] = szG;
szG++;
}
id = G[id].nxt[s[j]-'a'];
G[id].v.push_back(i);
}
}
dfs(0);
while(q--) {
string s; cin>>s;
for(int i=0;i<26;i++) {
new_weight[s[i]-'a'] = i;
}
int sum = 0;
for(int i=0;i<26;i++) {
for(int j=i+1;j<26;j++) {
if(new_weight[i] < new_weight[j])
sum += w1[i][j];
else
sum += w2[i][j];
}
}
printf("%lld\n", w + sum);
}
return 0;
}