結果
問題 | No.802 だいたい等差数列 |
ユーザー | marurunn11 |
提出日時 | 2022-01-02 21:10:25 |
言語 | C++17 (gcc 12.3.0 + boost 1.83.0) |
結果 |
TLE
|
実行時間 | - |
コード長 | 26,916 bytes |
コンパイル時間 | 8,506 ms |
コンパイル使用メモリ | 334,284 KB |
実行使用メモリ | 148,360 KB |
最終ジャッジ日時 | 2024-10-12 01:16:05 |
合計ジャッジ時間 | 15,089 ms |
ジャッジサーバーID (参考情報) |
judge1 / judge2 |
(要ログイン)
テストケース
テストケース表示入力 | 結果 | 実行時間 実行使用メモリ |
---|---|---|
testcase_00 | TLE | - |
testcase_01 | -- | - |
testcase_02 | -- | - |
testcase_03 | -- | - |
testcase_04 | -- | - |
testcase_05 | -- | - |
testcase_06 | -- | - |
testcase_07 | -- | - |
testcase_08 | -- | - |
testcase_09 | -- | - |
testcase_10 | -- | - |
testcase_11 | -- | - |
testcase_12 | -- | - |
testcase_13 | -- | - |
testcase_14 | -- | - |
testcase_15 | -- | - |
testcase_16 | -- | - |
testcase_17 | -- | - |
testcase_18 | -- | - |
testcase_19 | -- | - |
testcase_20 | -- | - |
testcase_21 | -- | - |
testcase_22 | -- | - |
testcase_23 | -- | - |
testcase_24 | -- | - |
testcase_25 | -- | - |
testcase_26 | -- | - |
testcase_27 | -- | - |
testcase_28 | -- | - |
testcase_29 | -- | - |
testcase_30 | -- | - |
testcase_31 | -- | - |
testcase_32 | -- | - |
testcase_33 | -- | - |
コンパイルメッセージ
main.cpp:778:55: warning: friend declaration 'FPS<mod> my_pow(FPS<mod>, long long int)' declares a non-template function [-Wnon-template-friend] 778 | friend FPS<mod> my_pow(FPS<mod> F, long long a); | ^ main.cpp:778:55: note: (if this is not what you intended, make sure the function template has already been declared and add '<>' after the function name here)
ソースコード
#pragma GCC target("avx2") #pragma GCC optimize("O3") #pragma GCC optimize("unroll-loops") #include "bits/stdc++.h" #ifdef _MSC_VER #include <intrin.h> //gcc上ではこれがあると動かない。__popcnt, umul128 等用のincludeファイル。 #define __builtin_popcount __popcnt #define __builtin_popcountll __popcnt64 // 1 の位から何個 0 が連なっているか。(0 入れると壊れる) inline unsigned int __builtin_ctz(unsigned int x) { unsigned long r; _BitScanForward(&r, x); return r; } inline unsigned int __builtin_ctzll(unsigned long long x) { unsigned long r; _BitScanForward64(&r, x); return r; } // 2進での leading 0 の個数。(0 入れると壊れる) inline unsigned int __builtin_clz(unsigned x) { return (unsigned int)__lzcnt(x); } inline unsigned int __builtin_clzll(unsigned x) { return (unsigned int)__lzcnt64(x); } #pragma warning(disable : 4996) #pragma intrinsic(_umul128) #endif #include <atcoder/all> //using namespace atcoder; using namespace std; //---------- 多倍長関連 ---------- //#include <boost/multiprecision/cpp_int.hpp> //#include <boost/multiprecision/cpp_dec_float.hpp> //using namespace boost::multiprecision; typedef long long ll; typedef long double ld; #define int long long #define LL128 boost::multiprecision::int128_t #define LL boost::multiprecision::cpp_int #define LD100 boost::multiprecision::cpp_dec_float_100 #define LD50 boost::multiprecision::cpp_dec_float_50 #define rep(i, n) for(long long i = 0; i < (n); ++i) #define REP(i, s, n) for(long long i = (s); i < (n); ++i) #define rrep(i, n) for(long long i = (n) - 1; i >= 0; --i) #define sqrt(d) pow((ld) (d), 0.50) #define PII pair<int, int> #define MP make_pair #define PB push_back #define ALL(v) v.begin(), v.end() const int INF2 = std::numeric_limits<int>::max() / 2 - 100000000; const long long INF = std::numeric_limits<long long>::max() / 2 - 100000000; const ld pi = acos(-1); constexpr int MOD = 1000000007; //1e9 + 7 //constexpr int MOD = 998244353; // 7 * 17 * 2^23 + 1 //---------- chmax, min 関連 ---------- template<class T> inline void chmax(T& a, T b) { if (a < b) a = b; } template<class T> inline void chmin(T& a, T b) { if (a > b) a = b; } //---------- 整数の根号関連 ---------- //res * res <= n なる最大の整数 res を返す。 template<typename T = long long> T floor_sqrt(T n) { assert(n >= 0); T res = max((T)floor(sqrt(n)) - (T)2, (T)0); while ((res + 1) * (res + 1) <= n) res++; return res; } //res * res >= n なる最小の整数 res を返す。 template<typename T = long long> T ceil_sqrt(T n) { T res = floor_sqrt(n); if (res * res == n) return res; else return res + 1; } template<typename T = long long> T round_sqrt(T n) { T res = floor_sqrt(n); if (abs(n - res * res) >= abs(n - (res + 1) * (res + 1))) res++; return res; } //---------- gcd, lcm ---------- template<typename T = long long> T my_gcd(T a, T b) { if (b == (T)0) return a; return my_gcd<T>(b, a % b); } template<typename T = long long> T my_lcm(T a, T b) { return a / my_gcd<T>(a, b) * b; } // ax + by = gcd(a, b) を解く。返り値は、gcd(a, b)。 //但し、a, b が負である場合は、返り値が正であることは保障されない。 long long my_gcd_ext(long long a, long long b, long long& x, long long& y) { if (b == 0) { x = 1; y = 0; return a; } long long tempo = my_gcd_ext(b, a % b, y, x); //bx' + ry' = gcd(a, b) → (qb + r)x + by = gcd(a, b) に戻さないといけない。// (r = a % b) //b(x' - qy') + (bq + r)y' = gcd(a, b) と同値変形できるから、 // x = y', y = x' - qy' y -= (a / b) * x; return tempo; } //中国式剰余の定理 (CRT) // x = base1 (mod m1) かつ x = base2 (mod m2) を解く。 // リターン値を (r, m) とすると解は x = r (mod m) で、m = lcm(m1, m2) // 解なしの場合は (0, -1) をリターン pair<long long, long long> CRT(long long base1, long long m1, long long base2, long long m2) { long long p, q; long long gcd0 = my_gcd_ext(m1, m2, p, q); if ((base2 - base1) % gcd0 != 0) return make_pair(0, -1); long long lcm0 = m1 * (m2 / gcd0); // 括弧がないとオーバーフローのリスクがある。 p *= (base2 - base1) / gcd0; p %= (m2 / gcd0); q *= (base2 - base1) / gcd0; q %= (m1 / gcd0); long long r = (base1 + m1 * p) % lcm0; if (r < 0) r += lcm0; return make_pair(r, lcm0); } //M を法として、a の逆元を返す。但し gcd(a, M) = 1。 long long my_invmod(long long a, long long M) { long long x = 0, y = 0; long long memo = my_gcd_ext(a, M, x, y); assert(memo == 1LL); x %= M; if (x < 0) x += M; return x; } //繰り返し2乗法 //N^aの、Mで割った余りを求める。 template<typename T = long long> T my_pow(T N, T a, T M) { T tempo; if (a == 0) { return 1; } else { if (a % 2 == 0) { tempo = my_pow(N, a / 2, M); return (tempo * tempo) % M; } else { tempo = my_pow(N, a - 1, M); return (tempo * N) % M; } } } // 繰り返し2乗法 // T = modint でも動く。 template<typename T = long long> T my_pow(T N, long long a) { T tempo; if (a == 0) { return 1; } else { if (a % 2 == 0) { tempo = my_pow(N, a / 2); return (tempo * tempo); } else { tempo = my_pow(N, a - 1); return (tempo * N); } } } // base を底としたときの、n の i桁目を、v.at(i) に入れる。 vector<signed> ll_to_vector(signed base, long long n) { long long tempo = n; long long tempo2 = n; //桁数を求めるときに使う signed n_digit = 1; while (tempo2 >= base) { tempo2 /= base; n_digit++; } vector<signed> v(n_digit, 0); // v のサイズを適切に調整。 long long denominator = my_pow<long long>((long long)base, (long long)(n_digit - 1)); for (signed i = 0; i < n_digit; i++) { v.at(i) = tempo / denominator; tempo -= v.at(i) * denominator; denominator /= base; } return v; } // M 桁に足りない場合、0 を追加して強制的に M 桁にする。 vector<signed> ll_to_vector(signed base, long long n, int M) { vector<signed> v = ll_to_vector(base, n); //assert((int)v.size() <= M); if ((int)v.size() >= M) return v; else { int diff = M - v.size(); vector<signed> res(diff, 0); for (int i = 0; i < (int)v.size(); i++) res.emplace_back(v.at(i)); return res; } } //エラトステネスの篩で、prime で ないところに false を入れる。O(n loglog n) // T = int (defalt, sieve が ll で間に合うことはないので。) // vector<char> に替えるとむしろ遅くなる。 template<typename T = int> vector<bool> sieve_bool(T N) { vector<bool> res(N + 1, true); res.at(0) = false; res.at(1) = false; for (T i = 2; 2 * i <= N; i++) { res.at(2 * i) = false; } for (T i = 3; i * i <= N; i += 2) { //ここからは奇数のみ探索。i の倍数に false を入れる。 if (res.at(i)) { T j = i * i; // i^2 未満の i の倍数には、すでに false が入っているはず。 while (j <= N) { res.at(j) = false; j += 2 * i; } } } return res; }; // n + 1 の サイズの vector を返す。res.at(i) には、i の 1 以外で最小の約数を入れる。 // res.at(i) == i で、i != 0, 1 なら i は素数。 // 2e8 なら、2.3 ~ 2.4 sec 程度で終わる。sieve_bool は 0.7 sec なので、3 倍強遅い。ll にすると、3.2 sec に伸びてしまう。 // T = int (defalt, sieve が ll で間に合うことはないので。) template<typename T = int> vector<T> sieve(T n) { n++; // n まで判定する。配列サイズは +1。 vector<T> res(n, 0); for (T i = 1; i < n; i++) { if (i % 2 == 0) res.at(i) = 2; // 偶数をあらかじめ処理。 else res.at(i) = i; // 奇数には自分自身を入れる。 } for (T i = 3; i * i < n; i += 2) { //ここからは奇数のみ探索。i の倍数に i を入れる。 if (res.at(i) == i) { T j = i * i; // i^2 未満の i の倍数には、すでに最小の約数が入っているはず。 while (j < n) { if (res.at(j) == j) res.at(j) = i; j += 2 * i; } } } return res; }; //O (sqrt(n)) で素数判定する用。 bool is_prime(long long N) { if (N == 1 || N == 0) return false; if (N == 2 || N == 3) return true; if (N % 2 == 0) return false; if (N % 3 == 0) return false; for (long long i = 1; (6 * i + 1) * (6 * i + 1) <= N; ++i) { if (N % (6 * i + 1) == 0) return false; } for (long long i = 0; (6 * i + 5) * (6 * i + 5) <= N; ++i) { if (N % (6 * i + 5) == 0) return false; } return true; } // 素因分解アルゴリズム (O(sqrt(N)) → O(N^0.25) のρ法も持っている。 // T = long long (defalt) template<typename T = long long> map<T, T> PrimeFactor(T N) { map<T, T> res; T i = 2; while (i * i <= N) { while (N % i == 0) { res[i]++; N /= i; } i += 1 + (i % 2); //i == 2 の場合だけ +1, その他の場合は +2 } if (N > 1) res[N]++; //sqrt((元の N)) より大きな素因数は高々1つしかない。 return res; } //関数 sieve で得た、vector min_factor を持ってるときに、素因数分解を高速で行うための関数。 // T = int (defalt, sieve が ll で間に合うことはないので。) template<typename T = int> map<T, T> PrimeFactor2(T target, vector<T>& min_factor) { map<T, T> res; if (min_factor.empty() || (T)min_factor.size() - 1 < target) min_factor = sieve<T>(target); while (target > 1) { res[min_factor[target]]++; target /= min_factor[target]; } return res; } //約数全列挙を O(sqrt(N)) で行うための関数。 vector<long long> count_dividers(long long target) { vector <long long> dividers, tempo; long long i = 1; while (i * i < target + 1) { if (target % i == 0) { dividers.push_back(i); if (i < target / i) tempo.push_back(target / i); // if節がないと、平方数の時、sqrt(target) がダブルカウントされる。 } i++; } for (long long j = 0; j < (long long)tempo.size(); j++) { dividers.push_back(tempo.at(tempo.size() - 1 - j)); } return dividers; } //関数 sieve で得た、vector min_factor を持ってるときに、約数全列挙を高速で行うための関数。 // T = int (defalt, sieve が ll で間に合うことはないので。) template<typename T = int> vector<T> count_dividers2(T target, vector<T>& min_factor, bool is_sort = false) { vector<T> dividers = { 1 }; map<T, T> memo = PrimeFactor2<T>(target, min_factor); for (auto&& iter = memo.begin(); iter != memo.end(); iter++) { vector <T> tempo = dividers; for (T k = 0; k < (T)tempo.size(); k++) { T times = 1; for (T j = 1; j <= (iter->second); j++) { times *= iter->first; dividers.push_back(tempo[k] * times); } } } if (is_sort) sort(dividers.begin(), dividers.end()); //sortしないと小さい順に並ばないが、必要ないなら消しても良い。 return dividers; } class UnionFind { public: vector<int> parent; vector<int> rank; vector<int> v_size; UnionFind(int N) : parent(N), rank(N, 0), v_size(N, 1) { rep(i, N) { parent[i] = i; } } int root(int x) { if (parent[x] == x) return x; return parent[x] = root(parent[x]); //経路圧縮 } void unite(int x, int y) { int rx = root(x); int ry = root(y); if (rx == ry) return; //xの根とyの根が同じなので、何もしない。 if (rank[rx] < rank[ry]) { parent[rx] = ry; v_size[ry] += v_size[rx]; } else { parent[ry] = rx; v_size[rx] += v_size[ry]; if (rank[rx] == rank[ry]) rank[rx]++; } } bool same(int x, int y) { return (root(x) == root(y)); } int count_tree() { int N = parent.size(); int res = 0; rep(i, N) { if (root(i) == i) res++; } return res; } int size(int x) { return v_size[root(x)]; } }; // 幾何。二点間距離。 ld calc_dist(int x1, int y1, int x2, int y2) { int tempo = (x1 - x2) * (x1 - x2) + (y1 - y2) * (y1 - y2); ld res = sqrt((ld)tempo); return res; } //ランレングス圧縮 vector<pair<int, char>> RunLength(string S) { int N = S.size(); vector<pair<int, char>> memo; if (N == 1) { memo.push_back(MP(1, S.at(0))); return memo; } int tempo = 1; for (int i = 1; i < N; i++) { if (i != N - 1) { if (S.at(i) == S.at(i - 1)) tempo++; else { memo.push_back(MP(tempo, S.at(i - 1))); tempo = 1; } } else { if (S.at(i) == S.at(i - 1)) { tempo++; memo.push_back(MP(tempo, S.at(i - 1))); } else { memo.push_back(MP(tempo, S.at(i - 1))); memo.push_back(MP(1, S.at(i))); } } } return memo; } void printf_ld(ld res) { printf("%.12Lf\n", res); //cout << std::fixed << std::setprecision(12) << res << endl; } template<typename T = long long> void print_vec(vector<T> v) { int N = v.size(); rep(i, N) { if (i != N - 1) cout << v.at(i) << " "; else cout << v.at(i) << endl; } } //mint 構造体。自動で mod を取る。 //m は定数である必要があるので入力を用いることはできない。 template<int m, typename T> class mint { public: T val; //---------- コンストラクタ ---------- constexpr mint(T v = 0) noexcept : val(v% m) { if (val < 0) val += m; } //------------------------------ 二項演算子のオーバーロード ------------------------------ constexpr mint& operator += (const mint& r) noexcept { val += r.val; if (val >= m) val -= m; return *this; } constexpr mint& operator -= (const mint& r) noexcept { val -= r.val; if (val < 0) val += m; return *this; } constexpr mint& operator *= (const mint& r) noexcept { val = val * r.val % m; return *this; } constexpr mint& operator /= (const mint& r) noexcept { //a * u + b * v = 1 を互除法で解く。但し、gcd(a, m) == 1 でなければならない。 T a = r.val, b = m, u = 1, v = 0; while (b) { T q = a / b; a -= q * b; swap(a, b); //互除法。余りをとって swap。 u -= q * v; swap(u, v); } val = val * u % m; if (val < 0) val += m; return *this; } constexpr mint operator + (const mint& r) const noexcept { return mint(*this) += r; } constexpr mint operator - (const mint& r) const noexcept { return mint(*this) -= r; } constexpr mint operator * (const mint& r) const noexcept { return mint(*this) *= r; } constexpr mint operator / (const mint& r) const noexcept { return mint(*this) /= r; } constexpr bool operator == (const mint& r) const noexcept { return this->val == r.val; } constexpr bool operator != (const mint& r) const noexcept { return this->val != r.val; } //------------------------------ 単項演算子のオーバーロード ------------------------------ //---------- 前置インクリメントのオーバーロード ---------- constexpr mint operator ++() noexcept { this->val++; if (this->val >= m) this->val -= m; return mint(*this); } constexpr mint operator --() noexcept { this->val--; if (this->val < 0) this->val += m; return mint(*this); } //---------- 後置インクリメントのオーバーロード ---------- constexpr mint operator++(signed) noexcept { mint temp(val); ++val; if (val >= m) val -= m; return temp; } constexpr mint operator--(signed) noexcept { mint temp(val); --val; if (val < 0) val += m; return temp; } constexpr mint operator -() const noexcept { return mint(-val); } //---------- 入出力のオーバーロード ---------- friend constexpr ostream& operator << (ostream& os, const mint<m, T>& x) noexcept { return os << x.val; } friend istream& operator >> (istream& is, mint<m, T>& x) noexcept { T init_val; is >> init_val; x = mint<m, T>(init_val); return is; } //---------- 繰り返し二乗法 ---------- constexpr mint<m, T> modpow(const mint<m, T>& a, T n) noexcept { if (n == 0) return 1; auto t = modpow(a, n / 2); t = t * t; if (n & 1) t = t * a; return t; } //---------- 逆元 ---------- constexpr mint<m, T> inverse() noexcept { mint<m, T> e(1); return e / (*this); } //---------- 二項係数 N_C_a ---------- /* constexpr mint<m, T> modcomb(const T& N, const T& a) noexcept { if (N < a) return 0; mint<m, T> answer = 1; rep(i, a) { answer *= mint<m, T>(N - i); answer *= mint<m, T>(i + 1).inverse(); } return answer; } */ }; using modint = mint<MOD, long long>; vector<modint> dp_fac; // 階乗。x ! まで計算する。結果は dp (デフォルトで dp_fac<modint>) に保存する。 // long long にするためには、第二引数に vector<long long> を指定する必要がある。20 ! = 2.43e18 まで long long に入る。 template<typename T = modint> T factorial(int x, vector<T>& dp = dp_fac) { assert(x >= 0); //既に計算済み if ((int)dp.size() > x) { return dp.at(x); } int n = dp.size(); //dp サイズを x + 1 に伸ばす。 for (int i = n; i < x + 1; i++) { if (i == 0) dp.push_back((T)1); else dp.push_back(dp.back() * i); } return dp.at(x); } // 二項係数 N_C_a template<typename T = modint, typename U = int> T my_comb(U N, U a, vector<T>& dp = dp_fac) { if (N < a) return (T)0; T ans = factorial<T>(N, dp); ans /= factorial<T>(a, dp); ans /= factorial<T>(N - a, dp); return ans; } ld now_clock() { ld t = (ld)clock() / (ld)CLOCKS_PER_SEC; return t; } // FPS ライブラリ // ※ 係数に負数を含む場合は、掛け算に NNT を使えない。 constexpr long long mod1 = 998244353; constexpr long long mod2 = 1224736769; template<long long mod = MOD> class FPS { private: int N; //ベクトルのサイズで 1 以上の整数。次数は N - 1 int MAXN = 1001001; //(1e6) 保持する最大のサイズ。 public: vector<mint<mod, long long>> v; //-------------------- ↓↓コンストラクタ↓↓ -------------------- FPS(): N(1){} //デフォルト FPS(int _N, mint<mod, long long> v0) : N(_N), v(_N, v0) { assert(N > 0); fix();} //要素数と初期値 FPS(vector<mint<mod, long long>> _v) : N((int)_v.size()), v(_v) { assert(N > 0); fix();} //-------------------- ↑↑コンストラクタ↑↑ -------------------- //-------------------- ↓↓二項演算子のオーバーロード (FPS 同士)↓↓ -------------------- constexpr FPS& operator += (const FPS& r) noexcept { int newN = max(N, r.N); vector<mint<mod, long long>> res_v(newN, 0); for (int i = 0; i < newN; i++) res_v.at(i) = (i < N ? v[i] : 0) + (i < r.N ? r.v[i] : 0); v = res_v; // vector 本体を書き換え N = v.size(); // 桁数書き換え fix(); return *this; } constexpr FPS& operator -= (const FPS& r) noexcept { int newN = max(N, r.N); vector<mint<mod, long long>> res_v(newN, 0); for (int i = 0; i < newN; i++) res_v.at(i) = (i < N ? v[i] : 0) - (i < r.N ? r.v[i] : 0); v = res_v; // vector 本体を書き換え N = v.size(); // 桁数書き換え fix(); return *this; } constexpr FPS& operator *= (const FPS& r) noexcept { return *this = multiplication_FFT(*this, r); // O(NlogN) の掛け算 //multiplication_naive(r); return *this; // O(N^2) の掛け算 } constexpr FPS operator + (const FPS& r) const noexcept { return FPS(*this) += r; } constexpr FPS operator - (const FPS& r) const noexcept { return FPS(*this) -= r; } constexpr FPS operator * (const FPS& r) const noexcept { return FPS(*this) *= r; } constexpr bool operator == (const FPS& r) const noexcept { if (v.size() != r.v.size()) return false; for (int i = 0; i < (int)v.size(); i++) { if (v.at(i) != r.v.at(i)) return false; } return true; } //-------------------- ↑↑二項演算子のオーバーロード (FPS 同士)↑↑ -------------------- friend FPS<mod> my_pow(FPS<mod> F, long long a); //-------------------- ↓↓二項演算子のオーバーロード (FPS と int)↓↓ -------------------- constexpr FPS<mod>& operator *= (const mint<mod, long long>& r) noexcept { for (int i = 0; i < N; ++i) v.at(i) *= r; return *this; } constexpr FPS<mod>& operator /= (const mint<mod, long long>& r) noexcept { for (int i = 0; i < N; ++i) v.at(i) /= r; return *this; } //f(z) に z^d を掛ける。 constexpr FPS<mod>& operator<<(const int& d) { v.insert(v.begin(), d, 0); N += d; return *this; } //f(z) を z^d で割る。 constexpr FPS<mod>& operator>>(const int& d) { if (d >= N) return *this = FPS<mod>(1, (mint<mod, long long>)0); //全ての項の次数が -1 以下。 v.erase(v.begin(), v.begin() + d); N -= d; return *this; } constexpr FPS<mod> operator * (const mint<mod, long long>& r) const noexcept { return FPS(*this) *= r; } constexpr FPS<mod> operator / (const mint<mod, long long>& r) const noexcept { return FPS(*this) /= r; } //-------------------- ↑↑二項演算子のオーバーロード (FPS と int)↑↑ -------------------- //次数の修正 void fix() { while (N > MAXN) { v.pop_back(); --N; } } private: // O(N^2) の掛け算 void multiplication_naive(const FPS<mod>& r) { vector<mint<mod, long long>> res((int)v.size() + (int)r.v.size() - 1); for (int i = 0; i < (int)v.size(); ++i) { for (int j = 0; j < (int)r.v.size(); ++j) { res[i + j] += v[i] * r.v[j]; // 答えの i + j の位に v[i] * r.v[j] を足す } } v = res; N = v.size(); fix(); } // --------------- ↓↓多項式の数論変換 とそれを用いた掛け算↓↓ --------------- // mod0 = u * 2^n + 1; //mod0 は prime // mint (法は mod0) に依存。 template<long long mod0> vector<mint<mod0, long long>> ntt(vector<mint<mod0, long long>> a, bool inverse = false) { assert(mod0 != 1000000007); // 1e9 + 7; 1e9 + 6 = 2 * (5e8 + 3) //---------- ↓ いくつかの ntt-friendly な有名素数の原始根 ↓ ---------- mint<mod0, long long> g = 3; // mod0 = 167772161, u = 5, n = 25 // mod0 = 469762049, u = 7, n = 26 // mod0 = 998244353, u = 119, n = 23 // mod0 = 1224736769, u = 73, n = 24 if (mod0 == 924844033 || mod0 == 1012924417) g = 5; // mod0 = 924844033, u = 441, n = 21 // mod0 = 1012924417, u = 483, n = 21 if (mod0 == 163577857) g = 23; // mod0 = 163577857, u = 39, n = 22 //---------- ↑ いくつかの ntt-friendly な有名素数の原始根 ↑ ---------- //---------- ↓ MOD = u * 2^n + 1 なる u, n を求める ↓ ---------- long long u = mod0 - 1; int n = 0; if (mod0 == 167772161) { u = 5; n = 25; } else if (mod0 == 469762049) { u = 7; n = 26; } else if (mod0 == 998244353) { u = 119; n = 23; } else if (mod0 == 1224736769) { u = 73; n = 24; } else if (mod0 == 924844033) { u = 441; n = 21; } else if (mod0 == 1012924417) { u = 483; n = 21; } else if (mod0 == 163577857) { u = 39; n = 22; } else { while (u % 2 == 0) { u /= 2; ++n; } } //---------- ↑ mod0 = u * 2^n + 1 なる u, n を求める ↑ ---------- int N = a.size(); int h = 0; // h = log_2(n) for (int i = 0; (1LL << i) < N; ++i) ++h; // バタフライ演算用の配置入れ替え for (int i = 0; i < N; ++i) { int j = 0; for (int k = 0; k < h; ++k) j |= (i >> k & 1) << (h - 1 - k); if (i < j) swap(a[i], a[j]); } // 事前計算 // vw[log2(b)] = my_pow(g, (mod0 - 1) / (2 * b), mod0); vector<mint<mod0, long long>> vw(h + 1, 1); for (int i = h; i >= 0; --i) { if (i == h) { vw[i] = my_pow(g, (mod0 - 1) / (2 * (1LL << i))); if (inverse) vw[i] = vw[i].inverse(); } else { vw[i] = vw[i + 1] * vw[i + 1]; } } // バタフライ演算 int pos = 0; for (int b = 1; b < N; b *= 2) { // 第 log_2(b) + 1 段 // ブロックサイズ = b * 2 mint<mod0, long long> w = 1; for (int j = 0; j < b; ++j) { // ブロック内 j 個目 // 重み w = (1 の原始 2b 乗根の j 乗) if (j) w *= vw[pos]; for (int k = 0; k < N; k += b * 2) { // k を先頭とするブロック mint<mod0, long long> s = a[j + k]; // 前 mint<mod0, long long> t = a[j + k + b] * w; // 後 a[j + k] = s + t; // 前の更新 a[j + k + b] = s - t; // 後の更新 } } ++pos; } // 逆変換時にサイズで割る調整 if (inverse) { mint<mod0, long long> Ninv = N; Ninv = Ninv.inverse(); for (int i = 0; i < N; ++i) { a[i] *= Ninv; } } return a; } template<long long mod0> vector<mint<mod0, long long>> convolve_ntt(vector<mint<mod0, long long>> a, vector<mint<mod0, long long>> b) { int s = a.size() + b.size() - 1; // 畳み込み結果のサイズ int t = 1; // FFT に使う配列のサイズ(2 の累乗) while (t < s) t *= 2; a.resize(t); // FFT するためにリサイズ b.resize(t); // FFT するためにリサイズ vector<mint<mod0, long long>> A = ntt<mod0>(a, false); vector<mint<mod0, long long>> B = ntt<mod0>(b, false); for (int i = 0; i < t; ++i) { A[i] *= B[i]; // 畳み込み結果の FFT 結果を得る } A = ntt<mod0>(A, true); // IFFT で畳み込み結果を得る A.resize(s); // 畳み込み結果を入れるためにリサイズ return A; } // O(NlogN) の掛け算 (符号込) FPS<mod> multiplication_FFT(FPS<mod> l, const FPS<mod>& r) { if (l.v.size() <= 60 || r.v.size() <= 60) { l.multiplication_naive(r); return l; } vector<mint<mod1, long long>> l1((int)l.v.size()); vector<mint<mod2, long long>> l2((int)l.v.size()); for (int i = 0; i < (int)l.v.size(); ++i) { l1.at(i) = l.v.at(i).val; l2.at(i) = l.v.at(i).val; } vector<mint<mod1, long long>> r1((int)r.v.size()); vector<mint<mod2, long long>> r2((int)r.v.size()); for (int i = 0; i < (int)r.v.size(); ++i) { r1.at(i) = r.v.at(i).val; r2.at(i) = r.v.at(i).val; } vector<mint<mod1, long long>> res1 = convolve_ntt<mod1>(l1, r1); vector<mint<mod2, long long>> res2 = convolve_ntt<mod2>(l2, r2); vector<mint<mod, long long>> res((int)res1.size()); for (int i = 0; i < (int)res.size(); ++i) { long long rem1 = (i < (int)res1.size() ? res1.at(i).val : 0); long long rem2 = (i < (int)res2.size() ? res2.at(i).val : 0); pair<long long, long long> tmp = CRT(rem1, mod1, rem2, mod2); res.at(i) = tmp.first; } return FPS<mod>(res); } // --------------- ↑↑多項式の数論変換 とそれを用いた掛け算↑↑ --------------- }; template<long long mod> FPS<mod> my_pow(FPS<mod> F, long long a) { FPS<mod> tempo(1, 1); if (a == 0) { return tempo; } else { if (a % 2 == 0) { tempo = my_pow<mod>(F, a / 2); return (tempo * tempo); } else { tempo = my_pow<mod>(F, a - 1); return (tempo * F); } } } signed main() { int N, M, D1, D2; cin >> N >> M >> D1 >> D2; vector<modint> v1(M + 1, 1); v1.at(0) = 0; vector<modint> v2(M + 1, 0); REP(i, D1, D2 + 1) v2.at(i) = 1; FPS<MOD> f1(v1); FPS<MOD> f2(v2); f2 = my_pow<MOD>(f2, N - 1); FPS<MOD> f3 = f1 * f2; modint res = 0; REP(i, 1, M + 1) res += f3.v.at(i); cout << res << endl; }