// QCFium 法 #pragma GCC target("avx2") #pragma GCC optimize("O3") #pragma GCC optimize("unroll-loops") #ifndef HIDDEN_IN_VS // 折りたたみ用 // 警告の抑制 #define _CRT_SECURE_NO_WARNINGS // ライブラリの読み込み #include using namespace std; // 型名の短縮 using ll = long long; using ull = unsigned long long; // -2^63 ～ 2^63 = 9 * 10^18（int は -2^31 ～ 2^31 = 2 * 10^9） using pii = pair; using pll = pair; using pil = pair; using pli = pair; using vi = vector; using vvi = vector; using vvvi = vector; using vvvvi = vector; using vl = vector; using vvl = vector; using vvvl = vector; using vvvvl = vector; using vb = vector; using vvb = vector; using vvvb = vector; using vc = vector; using vvc = vector; using vvvc = vector; using vd = vector; using vvd = vector; using vvvd = vector; template using priority_queue_rev = priority_queue, greater>; using Graph = vvi; // 定数の定義 const double PI = acos(-1); int DX[4] = { 1, 0, -1, 0 }; // 4 近傍（下，右，上，左） int DY[4] = { 0, 1, 0, -1 }; int INF = 1001001001; ll INFL = 4004004003094073385LL; // (int)INFL = INF, (int)(-INFL) = -INF; // 入出力高速化 struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp; // 汎用マクロの定義 #define all(a) (a).begin(), (a).end() #define sz(x) ((int)(x).size()) #define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), x)) #define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), x)) #define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");} #define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順 #define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順 #define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順 #define repe(v, a) for(const auto& v : (a)) // a の全要素（変更不可能） #define repea(v, a) for(auto& v : (a)) // a の全要素（変更可能） #define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索（昇順） #define repis(i, set) for(int i = lsb(set), bset##i = set; i >= 0; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素（昇順） #define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て（昇順） #define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去 #define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了 #define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 半開矩形内判定 // 汎用関数の定義 template inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; } template inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新（更新されたら true を返す） template inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新（更新されたら true を返す） template inline T getb(T set, int i) { return (set >> i) & T(1); } template inline T smod(T n, T m) { n %= m; if (n < 0) n += m; return n; } // 非負mod // 演算子オーバーロード template inline istream& operator>>(istream& is, pair& p) { is >> p.first >> p.second; return is; } template inline istream& operator>>(istream& is, vector& v) { repea(x, v) is >> x; return is; } template inline vector& operator--(vector& v) { repea(x, v) --x; return v; } template inline vector& operator++(vector& v) { repea(x, v) ++x; return v; } #endif // 折りたたみ用 #if __has_include() #include using namespace atcoder; #ifdef _MSC_VER #include "localACL.hpp" #endif //using mint = modint1000000007; using mint = modint998244353; //using mint = static_modint<999999017>; //using mint = modint; // mint::set_mod(m); namespace atcoder { inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; } inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; } } using vm = vector; using vvm = vector; using vvvm = vector; using vvvvm = vector; using pim = pair; #endif #ifdef _MSC_VER // 手元環境（Visual Studio） #include "local.hpp" #else // 提出用（gcc） inline int popcount(int n) { return __builtin_popcount(n); } inline int popcount(ll n) { return __builtin_popcountll(n); } inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : -1; } inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : -1; } template inline int lsb(const bitset& b) { return b._Find_first(); } inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; } inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; } #define dump(...) #define dumpel(v) #define dump_list(v) #define dump_mat(v) #define input_from_file(f) #define output_to_file(f) #define Assert(b) { if (!(b)) { vc MLE(1<<30); EXIT(MLE.back()); } } // RE の代わりに MLE を出す #endif mint TLE(int n, int m) { // dp[w][j] : 幅 w で値 [0..j) vvm dp(n + 1, vm(m + 1)); dp[0][0] = 1; repi(w, 0, n) { repi(j, 1, m) { dp[w][j] += dp[w][j - 1]; rep(l, w) dp[w][j] += dp[l][j - 1] * dp[w - 1 - l][j - 1]; } } dumpel(dp); return dp[n][m]; } /* 0: 1 1 1 1 1 1 1 1 1 1 1 1: 0 1 2 3 4 5 6 7 8 9 10 2: 0 0 2 6 12 20 30 42 56 72 90 3: 0 0 1 9 30 70 135 231 364 540 765 4: 0 0 0 10 64 220 560 1190 2240 3864 6240 5: 0 0 0 8 118 630 2170 5810 13188 26628 49260 6: 0 0 0 4 188 1656 7916 27076 74760 177744 378312 7: 0 0 0 1 258 4014 27326 121023 409836 1153740 2836548 8: 0 0 0 0 302 8994 89582 520626 2179556 7303164 20817588 9: 0 0 0 0 298 18654 279622 2161158 11271436 45179508 149837028 10: 0 0 0 0 244 35832 832680 8674188 56788112 273613032 61067911 // https://oeis.org/A122888 // 合成 z → z+z^2 を m 回やって [z^n] らしい */ //【二次元畳込み（mod 998244353）】O((ha + hb) (wa + wb) (log(ha + hb) + log(wa + wb))) /* * a[0..ha)[0..wa) と b[0..hb)[0..wb) の二次元畳込みを返す． */ vvm convolution_2D(vvm a, vvm b) { // verify : https://atcoder.jp/contests/abc345/tasks/abc345_g int ha = sz(a), wa = sz(a[0]); int hb = sz(b), wb = sz(b[0]); // 縦方向，横方向ともに素朴に畳み込む． if ((ll)ha * wa * hb * wb <= 100000LL) { vvm c(ha + hb - 1, vm(wa + wb - 1)); rep(ia, ha) rep(ib, hb) rep(ja, wa) rep(jb, wb) { c[ia + ib][ja + jb] += a[ia][ja] * b[ib][jb]; } return c; } // 列方向には素朴に畳込み，行方向には NTT で畳み込む． if ((ll)ha * hb <= 800LL) { // 幅を 2 冪に拡張しておく． int W = 1 << (msb(wa + wb - 2) + 1); rep(i, ha) a[i].resize(W); rep(i, hb) b[i].resize(W); // 行方向の NTT rep(i, ha) internal::butterfly(a[i]); rep(i, hb) internal::butterfly(b[i]); vvm c(ha + hb - 1, vm(wa + wb - 1)); vm tmp(W); rep(ia, ha) rep(ib, hb) { // 各点積 rep(j, W) tmp[j] = a[ia][j] * b[ib][j]; // 行方向の INTT internal::butterfly_inv(tmp); rep(j, wa + wb - 1) c[ia + ib][j] += tmp[j]; } // 定数倍の調整 mint inv = mint(W).inv(); rep(i, ha + hb - 1) rep(j, wa + wb - 1) c[i][j] *= inv; return c; } // 行方向には素朴に畳込み，列方向には NTT で畳み込む． if ((ll)wa * wb <= 800LL) { // 高さを 2 冪に拡張しつつ転置する． int H = 1 << (msb(ha + hb - 2) + 1); vvm aT(wa, vm(H)), bT(wb, vm(H)); rep(i, ha) rep(j, wa) aT[j][i] = a[i][j]; rep(i, hb) rep(j, wb) bT[j][i] = b[i][j]; // 列方向の NTT rep(j, wa) internal::butterfly(aT[j]); rep(j, wb) internal::butterfly(bT[j]); vvm c(ha + hb - 1, vm(wa + wb - 1)); vm tmp(H); rep(ja, wa) rep(jb, wb) { // 各点積 rep(i, H) tmp[i] = aT[ja][i] * bT[jb][i]; // 列方向の INTT internal::butterfly_inv(tmp); rep(i, ha + hb - 1) c[i][ja + jb] += tmp[i]; } // 定数倍の調整 mint inv = mint(H).inv(); rep(i, ha + hb - 1) rep(j, wa + wb - 1) c[i][j] *= inv; return c; } // 両方向とも NTT で畳み込む． // 高さと幅を 2 冪に拡張しておく． int H = 1 << (msb(ha + hb - 2) + 1); int W = 1 << (msb(wa + wb - 2) + 1); a.resize(H); b.resize(H); rep(i, H) { a[i].resize(W); b[i].resize(W); } // 行方向の NTT rep(i, H) { internal::butterfly(a[i]); internal::butterfly(b[i]); } // 転置 vvm aT(W, vm(H)), bT(W, vm(H)); rep(i, H) rep(j, W) { aT[j][i] = a[i][j]; bT[j][i] = b[i][j]; } // 列方向の NTT rep(j, W) { internal::butterfly(aT[j]); internal::butterfly(bT[j]); } // 各点積 rep(j, W) rep(i, H) aT[j][i] *= bT[j][i]; // 列方向の INTT rep(j, W) internal::butterfly_inv(aT[j]); // 転置 rep(i, H) rep(j, W) a[i][j] = aT[j][i]; // 行方向の INTT rep(i, H) internal::butterfly_inv(a[i]); // 不要な部分の削除 a.resize(ha + hb - 1); rep(i, ha + hb - 1) a[i].resize(wa + wb - 1); // 定数倍の調整 mint inv = mint(H * W).inv(); rep(i, ha + hb - 1) rep(j, wa + wb - 1) a[i][j] *= inv; return a; } //【関数の合成】O(N (log N)^2) /* * FPS f(z), g(z) を * f(z) = Σi∈[0..n) f[i] z^i * g(z) = Σj∈[1..m) g[j] z^j * と定め，[z^[0..N)] f(g(z)) を返す． * * 利用：【二次元畳込み（mod 998244353）】 */ vm composition(const vm& f, const vm& g, int N) { // 参考 : https://qiita.com/ryuhe1/items/23d79bb84b270f7359e0 // verify : https://judge.yosupo.jp/problem/composition_of_formal_power_series_large if (N == 0) return vm(); if (N == 1) return vm{ f[0] }; if (sz(g) == 0) { vm res(N); res[0] = f[0]; return res; } // 2^K : N 以上の最小の 2 冪 int K = msb(N - 1) + 1; vvvm q(K); q[0] = vvm(sz(g), vm(2)); q[0][0][0] = 1; repi(i, 1, sz(g) - 1) q[0][i][1] = -g[i]; repi(k, 1, K - 1) { auto q_pos(q[k - 1]); int sz_q = sz(q[k - 1]); for (int i = 1; i < sz_q; i += 2) rep(j, sz(q[k - 1][i])) q[k - 1][i][j] *= -1; auto qk_dbl = convolution_2D(q_pos, q[k - 1]); rep(i, min((sz(qk_dbl) + 1) / 2, (1 << (K - k)))) q[k].emplace_back(move(qk_dbl[2 * i])); if (sz(q[k]) > N) q[k].resize(N); } int sz_q = sz(q[K - 1]); for (int i = 1; i < sz_q; i += 2) rep(j, sz(q[K - 1][i])) q[K - 1][i][j] *= -1; if (sz(q[K - 1]) > N) q[K - 1].resize(N); vvm p(1, vm(N)); rep(i, min(sz(f), N)) p[0][N - 1 - i] = f[i]; auto tmp = convolution_2D(p, q[K - 1]); int sz_p = min(2, sz(tmp)); p.resize(sz_p); rep(i, sz_p) { int j_min = N - (1 << (K - 1)); int j_max = min(N, sz(tmp[i])) - 1; p[i].resize(j_max - j_min + 1); repi(j, j_min, j_max) p[i][j - j_min] = tmp[i][j]; } repir(k, K - 2, 0) { vvm p_dbl(sz(p) * 2 - 1, vm(sz(p[0]))); rep(i, sz(p)) rep(j, sz(p[i])) p_dbl[i * 2][j] = p[i][j]; auto tmp = convolution_2D(p_dbl, q[k]); int sz_p = min({ 1 << (K - k), N, sz(tmp) }); p.resize(sz_p); rep(i, sz_p) { int j_min = 1 << k; int j_max = min(1 << (k + 1), sz(tmp[i])) - 1; p[i].resize(j_max - j_min + 1); repi(j, j_min, j_max) p[i][j - j_min] = tmp[i][j]; } } vm res(N); rep(i, min(N, sz(p))) res[i] = p[i][0]; return res; } // O(n (log n)^2 log m) は許してもらえなかった． mint TLE2(int n, int m) { vm res{ 0, 1 }, pow2{ 0, 1, 1 }; while (m > 0) { // dump(pow2); if (m & 1) res = composition(res, pow2, n + 2); pow2 = composition(pow2, pow2, n + 2); m /= 2; } // dump(res); return res[n + 1]; } //【オンライン畳込み（mod 998244353）】 /* * Online_convolution(int n) : O(n) * a[0..n) と b[0..n) の畳込み c[0..n) を計算できるよう初期化する． * * set(mint a, mint b) : ならし O((log n)^2) * t 回目に呼び出すときは，a=a[t], b=b[t] を与える． * * reset() : ならし O((log n)^2) * 直前の set() を取り消す． * * mint [](int i) : O(1) * c[i] = Σj∈[0..i] a[j] b[i-j] を返す． * 制約 : a[0..i], b[0..i] を指定済でなくてはならない． * * mint back() : O(1) * 直前に決定された c[i] を返す． */ class Online_convolution { // 参考 : https://qiita.com/Kiri8128/items/1738d5403764a0e26b4c int n, t; // t : 次が何回目の呼び出しか vm as, bs, cs; vector his; public: // 長さ n の数列同士の畳込みを行えるよう初期化する． Online_convolution(int n) : n(n), t(0), as(n), bs(n), cs(n) { // verify : https://atcoder.jp/contests/abc280/tasks/abc280_e } Online_convolution() : n(0), t(0) {} // t 回目に呼び出すときは，a=a[t], b=b[t] を与える． void set(mint a, mint b) { // verify : https://atcoder.jp/contests/abc280/tasks/abc280_e as[t] = a; bs[t] = b; int i1_max = lsb(t + 2), i2_max = i1_max; // 対角線上の正方形領域に対する処理を行う場合 if (popcount(t + 2) == 1) { i1_max -= 2; i2_max -= 1; } // 2^i : 正方形の一辺の長さ（対角線より下） repi(i, 0, i1_max) { // cs_sub[0..j_max] まで計算する必要がある． int j_max = min((1 << (i + 1)) - 2, n - 1 - t); // len : 真に計算するべき正方形の一辺の長さ int len = min(1 << i, j_max + 1); // as[x_min..x_min+len) と bs[y_min..y_min+len) を畳み込む． int x_min = t + 1 - (1 << i); int y_min = (1 << i) - 1; vm as_sub, bs_sub; copy(as.begin() + x_min, as.begin() + (x_min + len), back_inserter(as_sub)); copy(bs.begin() + y_min, bs.begin() + (y_min + len), back_inserter(bs_sub)); vm cs_sub = convolution(as_sub, bs_sub); repi(j, 0, j_max) { cs[t + j] += cs_sub[j]; his.emplace_back(t + j, cs_sub[j]); } } // 2^i : 正方形の一辺の長さ（対角線以上） repi(i, 0, i2_max) { // cs_sub[0..j_max] まで計算する必要がある． int j_max = min((1 << (i + 1)) - 2, n - 1 - t); // len : 真に計算するべき正方形の一辺の長さ int len = min(1 << i, j_max + 1); // as[x_min..x_min+len) と bs[y_min..y_min+len) を畳み込む． int x_min = (1 << i) - 1; int y_min = t + 1 - (1 << i); vm as_sub, bs_sub; copy(as.begin() + x_min, as.begin() + (x_min + len), back_inserter(as_sub)); copy(bs.begin() + y_min, bs.begin() + (y_min + len), back_inserter(bs_sub)); vm cs_sub = convolution(as_sub, bs_sub); repi(j, 0, j_max) { cs[t + j] += cs_sub[j]; his.emplace_back(t + j, cs_sub[j]); } } t++; } // 直前の set() を取り消す． void reset() { t--; int i1_max = lsb(t + 2), i2_max = i1_max; if (popcount(t + 2) == 1) { i1_max -= 2; i2_max -= 1; } repi(i, 0, i1_max) { int j_max = min((1 << (i + 1)) - 2, n - 1 - t); repi(j, 0, j_max) { auto [pos, val] = his.back(); his.pop_back(); cs[pos] -= val; } } repi(i, 0, i2_max) { int j_max = min((1 << (i + 1)) - 2, n - 1 - t); repi(j, 0, j_max) { auto [pos, val] = his.back(); his.pop_back(); cs[pos] -= val; } } as[t] = 0; bs[t] = 0; } // c[i] を返す． mint const& operator[](int i) const { // verify : https://atcoder.jp/contests/abc280/tasks/abc280_e Assert(i < t); return cs[i]; } // 直前に決定された c[i] を返す． mint back() const { // verify : https://judge.yosupo.jp/problem/log_of_formal_power_series return cs[t - 1]; } #ifdef _MSC_VER friend ostream& operator<<(ostream& os, const Online_convolution& c) { os << "a: " << c.as << endl; os << "b: " << c.bs << endl; os << "c: " << c.cs; return os; } #endif }; //【階乗など（法が大きな素数）】 /* * Factorial_mint(int N) : O(n) * N まで計算可能として初期化する． * * mint fact(int n) : O(1) * n! を返す． * * mint fact_inv(int n) : O(1) * 1/n! を返す（n が負なら 0 を返す） * * mint inv(int n) : O(1) * 1/n を返す． * * mint perm(int n, int r) : O(1) * 順列の数 nPr を返す． * * mint bin(int n, int r) : O(1) * 二項係数 nCr を返す． * * mint bin_inv(int n, int r) : O(1) * 二項係数の逆数 1/nCr を返す． * * mint mul(vi rs) : O(|rs|) * 多項係数 nC[rs] を返す．（n = Σrs） * * mint hom(int n, int r) : O(1) * 重複組合せの数 nHr = n+r-1Cr を返す（0H0 = 1 とする） * * mint neg_bin(int n, int r) : O(1) * 負の二項係数 nCr = (-1)^r -n+r-1Cr を返す（n ≦ 0, r ≧ 0） */ class Factorial_mint { int n_max; // 階乗と階乗の逆数の値を保持するテーブル vm fac, fac_inv; public: // n! までの階乗とその逆数を前計算しておく．O(n) Factorial_mint(int n) : n_max(n), fac(n + 1), fac_inv(n + 1) { // verify : https://atcoder.jp/contests/dwacon6th-prelims/tasks/dwacon6th_prelims_b fac[0] = 1; repi(i, 1, n) fac[i] = fac[i - 1] * i; fac_inv[n] = fac[n].inv(); repir(i, n - 1, 0) fac_inv[i] = fac_inv[i + 1] * (i + 1); } Factorial_mint() : n_max(0) {} // ダミー // n! を返す． mint fact(int n) const { // verify : https://atcoder.jp/contests/dwacon6th-prelims/tasks/dwacon6th_prelims_b Assert(0 <= n && n <= n_max); return fac[n]; } // 1/n! を返す（n が負なら 0 を返す） mint fact_inv(int n) const { // verify : https://atcoder.jp/contests/abc289/tasks/abc289_h Assert(n <= n_max); if (n < 0) return 0; return fac_inv[n]; } // 1/n を返す． mint inv(int n) const { // verify : https://atcoder.jp/contests/exawizards2019/tasks/exawizards2019_d Assert(0 < n && n <= n_max); return fac[n - 1] * fac_inv[n]; } // 順列の数 nPr を返す． mint perm(int n, int r) const { // verify : https://atcoder.jp/contests/abc172/tasks/abc172_e Assert(n <= n_max); if (r < 0 || n - r < 0) return 0; return fac[n] * fac_inv[n - r]; } // 二項係数 nCr を返す． mint bin(int n, int r) const { // verify : https://judge.yosupo.jp/problem/binomial_coefficient_prime_mod Assert(n <= n_max); if (r < 0 || n - r < 0) return 0; return fac[n] * fac_inv[r] * fac_inv[n - r]; } // 二項係数の逆数 1/nCr を返す． mint bin_inv(int n, int r) const { // verify : https://www.codechef.com/problems/RANDCOLORING Assert(n <= n_max); Assert(r >= 0 || n - r >= 0); return fac_inv[n] * fac[r] * fac[n - r]; } // 多項係数 nC[rs] を返す． mint mul(const vi& rs) const { // verify : https://yukicoder.me/problems/no/2141 if (*min_element(all(rs)) < 0) return 0; int n = accumulate(all(rs), 0); Assert(n <= n_max); mint res = fac[n]; repe(r, rs) res *= fac_inv[r]; return res; } // 重複組合せの数 nHr = n+r-1Cr を返す（0H0 = 1 とする） mint hom(int n, int r) { // verify : https://mojacoder.app/users/riantkb/problems/toj_ex_2 if (n == 0) return (int)(r == 0); Assert(n + r - 1 <= n_max); if (r < 0 || n - 1 < 0) return 0; return fac[n + r - 1] * fac_inv[r] * fac_inv[n - 1]; } // 負の二項係数 nCr を返す（n ≦ 0, r ≧ 0） mint neg_bin(int n, int r) { // verify : https://atcoder.jp/contests/abc345/tasks/abc345_g if (n == 0) return (int)(r == 0); Assert(-n + r - 1 <= n_max); if (r < 0 || -n - 1 < 0) return 0; return (r & 1 ? -1 : 1) * fac[-n + r - 1] * fac_inv[r] * fac_inv[-n - 1]; } }; Factorial_mint fm((int)2e5 + 10); //【オンライン合成（二項式，mod 998244353）】 /* * Online_composition(int n, mint g1, mint g2, Factorial_mint* fm) : O(n) * g(z) = g1 z + g2 z^2 とし，f(g(z)) を [z^n] まで計算できるよう初期化する． * 制約 : fm は n! まで計算可能 * * set(mint a) : ならし O((log n)^2) * t 回目に呼び出すときは，a = [z^t]f(z) を与える． * * mint [](int i) : O(1) * [z^i] f(g(z)) を返す． * 制約 : a[0..i] を指定済でなくてはならない． * * mint back() : O(1) * 直前に決定された f(g(z)) の係数を返す． */ class Online_composition { int n, t; // t : 次が何回目の呼び出しか vm as; vm g1_pow, g2_pow; vvm g_pow; vvm fen; // f(g(z)) の係数列を分けて格納しておくフェニック木（1-indexed） vm cs; vector his; Factorial_mint* fm; public: // g(z) = g1 z + g2 z^2 とし，f(g(z)) を [z^n] まで計算できるよう初期化する． Online_composition(int n_, mint g1, mint g2, Factorial_mint* fm) : n(1 << (msb(n_) + 1)), t(0), as(n), g1_pow(n), g2_pow(n), fen(n + 1), cs(n), fm(fm) { int K = msb(n); g1_pow[0] = 1; g2_pow[0] = 1; repi(i, 1, n - 1) { g1_pow[i] = g1_pow[i - 1] * g1; g2_pow[i] = g2_pow[i - 1] * g2; } g_pow.resize(K); g_pow[0] = vm{ 0, g1, g2 }; repi(k, 1, K - 1) { g_pow[k] = convolution(g_pow[k - 1], g_pow[k - 1]); if (sz(g_pow[k]) > n) g_pow[k].resize(n); } } Online_composition() : n(0), t(0), fm(nullptr) {} // t 回目に呼び出すときは，a = [z^t]f(z) を与える． void set(mint a) { as[t] = a; cs[t] += a * g1_pow[t]; int i = t + 1; fen[i] = vm{ a }; int K = lsb(i); rep(k, K) { fen[i] = convolution(fen[i], g_pow[k]); if (sz(fen[i]) > n) fen[i].resize(n); int i2 = i - (1 << k); rep(j, sz(fen[i2])) fen[i][j] += fen[i2][j]; } if (i != n) { int w = 1 << K; int l = i - w; // fen[i] g(z)^l からの寄与を cs[t+1..t+w] に撒く． // fen[i] は z^[0..2(w-1)] の範囲の係数を持っているので， // g(z)^l は z^[t+1-2(w-1)..t+w] の範囲の係数だけあれば十分である． int W = 1 << (msb((t + w) - (t + 1 - 2 * (w - 1)) + 1 - 1) + 1); mint W_inv = mint(W).inv(); vm fe(fen[i]); fe.resize(W); vm gl(W); repi(j, t + 1 - 2 * (w - 1), t + w) { int e2 = j - l; if (e2 < 0) continue; int e1 = l - e2; if (e1 < 0) continue; // ここで [z^j]g(z)^l が O(1) で求まらないといけないので二項式でもないと厳しそう． gl[j - (t + 1 - 2 * (w - 1))] = g1_pow[e1] * g2_pow[e2] * fm->bin(l, e1); } internal::butterfly(fe); internal::butterfly(gl); rep(i, W) fe[i] *= gl[i]; internal::butterfly_inv(fe); rep(j, w) { mint val = fe[2 * (w - 1) + j] * W_inv; cs[t + 1 + j] += val; his.emplace_back(t + 1 + j, val); } } t++; } // 直前の set() を取り消す． void reset() { t--; int i = t + 1; int K = lsb(i); if (i != n) { int w = 1 << K; rep(j, w) { auto [pos, val] = his.back(); his.pop_back(); cs[pos] -= val; } } fen[i].clear(); cs[t] -= as[t] * g1_pow[t]; as[t] = 0; } // [z^i] f(g(z)) を返す．（制約 : a[0..i] を指定済でなくてはならない．） mint operator[](int i) const { Assert(i < t); return cs[i]; } // 直前に決定された f(g(z)) の係数を返す． mint back() const { return cs[t - 1]; } #ifdef _MSC_VER friend ostream& operator<<(ostream& os, const Online_composition& O) { os << "f: " << O.as << endl; os << "g: " << O.g_pow[0] << endl; os << "h: " << O.cs << endl; return os; } #endif }; // O(n (log n)^2) だが n=200000 m=1000000000 で 5584 ms．reset() を使わないようにすれば間に合いそう． mint TLE3(int n, int m) { // dump("n, m:", n, m); vm gm(n + 2); gm[0] = 0; gm[1] = 1; gm[2] = m; Online_convolution lhs(n + 4); lhs.set(gm[0], gm[0] + 1); lhs.set(gm[1], gm[1]); lhs.set(gm[2], gm[2]); Online_composition rhs(n + 4, 1, 1, &fm); rhs.set(gm[0]); rhs.set(gm[1]); rhs.set(gm[2]); // dump(lhs); dump(rhs); repi(i, 3, n + 1) { dump("---------- i:", i, "-----------"); lhs.set(0, 0); lhs.set(0, 0); rhs.set(0); rhs.set(0); dump(lhs); dump(rhs); gm[i] = (lhs[i + 1] - rhs[i + 1]) * fm.inv(i - 2); dump("gm[i]:", gm[i]); lhs.reset(); lhs.reset(); rhs.reset(); rhs.reset(); dump(lhs); dump(rhs); lhs.set(gm[i], gm[i]); rhs.set(gm[i]); dump(lhs); dump(rhs); } return gm[n + 1]; } mint solve(int n, int m) { // dump("n, m:", n, m); vm gm(n + 2); gm[0] = 0; gm[1] = 1; gm[2] = m; Online_convolution lhs(n + 4); lhs.set(gm[0], gm[0] + 1); lhs.set(gm[1], gm[1]); lhs.set(gm[2], gm[2]); Online_composition rhs(n + 4, 1, 1, &fm); rhs.set(gm[0]); rhs.set(gm[1]); rhs.set(gm[2]); // dump(lhs); dump(rhs); repi(i, 3, n + 1) { dump("---------- i:", i, "-----------"); lhs.set(0, 0); lhs.set(0, 0); rhs.set(0); rhs.set(0); dump(lhs); dump(rhs); gm[i] = (lhs[i + 1] - rhs[i + 1]) * fm.inv(i - 2); dump("gm[i]:", gm[i]); lhs.reset(); lhs.reset(); rhs.reset(); rhs.reset(); dump(lhs); dump(rhs); lhs.set(gm[i], gm[i]); rhs.set(gm[i]); dump(lhs); dump(rhs); } return gm[n + 1]; } int main() { // input_from_file("input.txt"); // output_to_file("output.txt"); // zikken(); int n, m; cin >> n >> m; cout << solve(n, m) << endl; dump("-----"); dump(TLE(n, m)); }