結果
| 問題 |
No.206 数の積集合を求めるクエリ
|
| コンテスト | |
| ユーザー |
tsutaj
|
| 提出日時 | 2018-06-26 17:08:44 |
| 言語 | C++14 (gcc 13.3.0 + boost 1.87.0) |
| 結果 |
AC
|
| 実行時間 | 1,815 ms / 7,000 ms |
| コード長 | 3,982 bytes |
| コンパイル時間 | 1,266 ms |
| コンパイル使用メモリ | 89,044 KB |
| 実行使用メモリ | 27,024 KB |
| 最終ジャッジ日時 | 2024-06-30 22:54:47 |
| 合計ジャッジ時間 | 27,527 ms |
|
ジャッジサーバーID (参考情報) |
judge3 / judge4 |
(要ログイン)
| ファイルパターン | 結果 |
|---|---|
| sample | AC * 3 |
| other | AC * 28 |
ソースコード
#include <cstdio>
#include <vector>
#include <algorithm>
#include <cassert>
#include <iostream>
using namespace std;
using ll = long long int;
// Garner のアルゴリズム ( 計算量 O(N^2) )
// x ≡ a_1 (mod m_1), ..., x ≡ a_N (mod m_N) を満たす最小の x を返す
// m_1, m_2, ... m_N は相異なる素数である必要がある
// x = k_0 + k_1*m_1 + k_2*(m_1*m_2) + ... k_{N-1}*(m_1*m_2* ... *m_{N-1}) として、
// 1 つ目の式から順に操作することで係数 k_i を下から決定していく
ll mod_pow(ll X, ll N, ll mod) {
ll ret = 1;
for(; N>0; N>>=1) {
if(N & 1) (ret *= X) %= mod;
(X *= X) %= mod;
}
return ret;
}
ll garner(vector<ll> values, vector<ll> mods, ll mod) {
assert(values.size() == mods.size());
int N = values.size();
vector<ll> coeff(N);
for(int i=0; i<N; i++) {
ll val_A = values[i] % mods[i];
ll val_B = 0, mod_acc = 1;
for(int j=0; j<i; j++) {
(val_B += mod_acc * coeff[j]) %= mods[i];
(mod_acc *= mods[j]) %= mods[i];
}
ll val = (val_A - val_B + mods[i]) % mods[i];
(val *= mod_pow(mod_acc, mods[i]-2, mods[i])) %= mods[i];
coeff[i] = val;
}
ll ans = 0, mod_acc = 1;
for(int i=0; i<N; i++) {
(ans += (mod_acc * coeff[i]) % mod) %= mod;
(mod_acc *= mods[i]) %= mod;
}
return ans;
}
// NTT (剰余環を用いた FFT)
// garner のアルゴリズムが必須
template<ll mod, ll primitive_root>
struct NTT {
int get_mod() { return mod; }
vector<ll> dft(vector<ll> A, int N, int sgn = 1) {
if(N == 1) return A;
vector<ll> F(N / 2), G(N / 2);
for(int i=0; i<N/2; i++) {
F[i] = A[2*i + 0];
G[i] = A[2*i + 1];
}
F = dft(F, N / 2, sgn);
G = dft(G, N / 2, sgn);
ll zeta = mod_pow(primitive_root, (mod - 1) / N, mod);
if(sgn < 0) zeta = mod_pow(zeta, mod - 2, mod);
ll pow_zeta = 1;
for(int i=0; i<N; i++) {
A[i] = (F[i % (N / 2)] + pow_zeta * G[i % (N / 2)]) % mod;
(pow_zeta *= zeta) %= mod;
}
return A;
}
vector<ll> inv_dft(vector<ll> A, int N) {
A = dft(A, N, -1);
ll inv_N = mod_pow(N, mod-2, mod);
for(int i=0; i<N; i++) {
(A[i] *= inv_N) %= mod;
}
return A;
}
vector<ll> multiply(vector<ll> A, vector<ll> B) {
int sz = A.size() + B.size() + 1;
int N = 1; while(N < sz) N *= 2;
A.resize(N), B.resize(N);
A = dft(A, N), B = dft(B, N);
vector<ll> F(N);
for(int i=0; i<N; i++) {
F[i] = (A[i] * B[i]) % mod;
}
return inv_dft(F, N);
}
};
using NTT_1 = NTT< 167772161, 3>;
using NTT_2 = NTT< 469762049, 3>;
using NTT_3 = NTT<1224736769, 3>;
vector<ll> convolution_using_ntt(vector<ll> A, vector<ll> B, ll mod) {
for(auto &x : A) x %= mod;
for(auto &x : B) x %= mod;
NTT_1 ntt_1; NTT_2 ntt_2; NTT_3 ntt_3;
vector< vector<ll> > convo(3);
convo[0] = ntt_1.multiply(A, B);
convo[1] = ntt_2.multiply(A, B);
convo[2] = ntt_3.multiply(A, B);
int N = convo[0].size();
vector<ll> ret(N), mods(3);
mods[0] = ntt_1.get_mod();
mods[1] = ntt_2.get_mod();
mods[2] = ntt_3.get_mod();
for(int i=0; i<N; i++) {
vector<ll> values(3);
for(int k=0; k<3; k++) {
values[k] = convo[k][i];
}
ret[i] = garner(values, mods, mod);
}
return ret;
}
int main() {
int L, M, N; cin >> L >> M >> N;
vector<ll> X(N), Y(N);
for(int i=0; i<L; i++) {
int val; cin >> val; val--;
X[val]++;
}
for(int i=0; i<M; i++) {
int val; cin >> val;
Y[N - val]++;
}
vector<ll> ans = convolution_using_ntt(X, Y, 1LL << 60);
int Q; cin >> Q;
for(int i=0; i<Q; i++) {
cout << ans[N+i-1] << endl;
}
return 0;
}
tsutaj