#992367 (C++17) No.2801 Unique Maximum

提出ソース
結果

問題	No.2801 Unique Maximum
コンテスト
ユーザー	ecottea
提出日時	2024-07-02 18:34:16
言語	C++17 (gcc 15.2.0 + boost 1.89.0) コンパイル: `g++-15 -O2 -lm -std=c++17 -Wuninitialized -DONLINE_JUDGE -o a.out _filename_` 実行: `./a.out`
結果	AC
実行時間	3,741 ms / 4,000 ms
コード長	24,952 bytes
記録記録タグの例: 初AC ショートコード純ショートコード純主流ショートコード最速実行時間
コンパイル時間	10,788 ms
コンパイル使用メモリ	391,676 KB
実行使用メモリ	190,164 KB
最終ジャッジ日時	2026-02-23 12:23:42
合計ジャッジ時間	52,470 ms
ジャッジサーバーID （参考情報）	judge5 / judge2
このコードへのチャレンジ
（要ログイン）
ファイルパターン	結果
sample	AC * 3
other	AC * 21
権限があれば一括ダウンロードができます
ソースコード

raw source code
// QCFium 法
#pragma GCC target("avx2")
#pragma GCC optimize("O3")
#pragma GCC optimize("unroll-loops")


#ifndef HIDDEN_IN_VS // 折りたたみ用

// 警告の抑制
#define _CRT_SECURE_NO_WARNINGS

// ライブラリの読み込み
#include <bits/stdc++.h>
using namespace std;

// 型名の短縮
using ll = long long; using ull = unsigned long long; // -2^63 ～ 2^63 = 9 * 10^18（int は -2^31 ～ 2^31 = 2 * 10^9）
using pii = pair<int, int>;	using pll = pair<ll, ll>;	using pil = pair<int, ll>;	using pli = pair<ll, int>;
using vi = vector<int>;		using vvi = vector<vi>;		using vvvi = vector<vvi>;	using vvvvi = vector<vvvi>;
using vl = vector<ll>;		using vvl = vector<vl>;		using vvvl = vector<vvl>;	using vvvvl = vector<vvvl>;
using vb = vector<bool>;	using vvb = vector<vb>;		using vvvb = vector<vvb>;
using vc = vector<char>;	using vvc = vector<vc>;		using vvvc = vector<vvc>;
using vd = vector<double>;	using vvd = vector<vd>;		using vvvd = vector<vvd>;
template <class T> using priority_queue_rev = priority_queue<T, vector<T>, greater<T>>;
using Graph = vvi;

// 定数の定義
const double PI = acos(-1);
int DX[4] = { 1, 0, -1, 0 }; // 4 近傍（下，右，上，左）
int DY[4] = { 0, 1, 0, -1 };
int INF = 1001001001; ll INFL = 4004004003094073385LL; // (int)INFL = INF, (int)(-INFL) = -INF;

// 入出力高速化
struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp;

// 汎用マクロの定義
#define all(a) (a).begin(), (a).end()
#define sz(x) ((int)(x).size())
#define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), x))
#define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), x))
#define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");}
#define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順
#define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順
#define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順
#define repe(v, a) for(const auto& v : (a)) // a の全要素（変更不可能）
#define repea(v, a) for(auto& v : (a)) // a の全要素（変更可能）
#define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索（昇順）
#define repis(i, set) for(int i = lsb(set), bset##i = set; i >= 0; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素（昇順）
#define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て（昇順）
#define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去
#define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了
#define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 半開矩形内判定

// 汎用関数の定義
template <class T> inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; }
template <class T> inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新（更新されたら true を返す）
template <class T> inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新（更新されたら true を返す）
template <class T> inline T getb(T set, int i) { return (set >> i) & T(1); }
template <class T> inline T smod(T n, T m) { n %= m; if (n < 0) n += m; return n; } // 非負mod

// 演算子オーバーロード
template <class T, class U> inline istream& operator>>(istream& is, pair<T, U>& p) { is >> p.first >> p.second; return is; }
template <class T> inline istream& operator>>(istream& is, vector<T>& v) { repea(x, v) is >> x; return is; }
template <class T> inline vector<T>& operator--(vector<T>& v) { repea(x, v) --x; return v; }
template <class T> inline vector<T>& operator++(vector<T>& v) { repea(x, v) ++x; return v; }

#endif // 折りたたみ用


#if __has_include(<atcoder/all>)
#include <atcoder/all>
using namespace atcoder;

#ifdef _MSC_VER
#include "localACL.hpp"
#endif

//using mint = modint1000000007;
using mint = modint998244353;
//using mint = static_modint<999999017>;
//using mint = modint; // mint::set_mod(m);

namespace atcoder {
	inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; }
	inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; }
}
using vm = vector<mint>; using vvm = vector<vm>; using vvvm = vector<vvm>; using vvvvm = vector<vvvm>; using pim = pair<int, mint>;
#endif


#ifdef _MSC_VER // 手元環境（Visual Studio）
#include "local.hpp"
#else // 提出用（gcc）
inline int popcount(int n) { return __builtin_popcount(n); }
inline int popcount(ll n) { return __builtin_popcountll(n); }
inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : -1; }
inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : -1; }
template <size_t N> inline int lsb(const bitset<N>& b) { return b._Find_first(); }
inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; }
inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; }
#define dump(...)
#define dumpel(v)
#define dump_list(v)
#define dump_mat(v)
#define input_from_file(f)
#define output_to_file(f)
#define Assert(b) { if (!(b)) { vc MLE(1<<30); EXIT(MLE.back()); } } // RE の代わりに MLE を出す
#endif


mint TLE(int n, int m) {
	// dp[w][j] : 幅 w で値 [0..j)
	vvm dp(n + 1, vm(m + 1));
	dp[0][0] = 1;

	repi(w, 0, n) {
		repi(j, 1, m) {
			dp[w][j] += dp[w][j - 1];
			rep(l, w) dp[w][j] += dp[l][j - 1] * dp[w - 1 - l][j - 1];
		}
	}
	dumpel(dp);

	return dp[n][m];
}
/*
 0: 1 1 1 1 1 1 1 1 1 1 1
 1: 0 1 2 3 4 5 6 7 8 9 10
 2: 0 0 2 6 12 20 30 42 56 72 90
 3: 0 0 1 9 30 70 135 231 364 540 765
 4: 0 0 0 10 64 220 560 1190 2240 3864 6240
 5: 0 0 0 8 118 630 2170 5810 13188 26628 49260
 6: 0 0 0 4 188 1656 7916 27076 74760 177744 378312
 7: 0 0 0 1 258 4014 27326 121023 409836 1153740 2836548
 8: 0 0 0 0 302 8994 89582 520626 2179556 7303164 20817588
 9: 0 0 0 0 298 18654 279622 2161158 11271436 45179508 149837028
10: 0 0 0 0 244 35832 832680 8674188 56788112 273613032 61067911

// https://oeis.org/A122888
// 合成 z → z+z^2 を m 回やって [z^n] らしい
*/


//【二次元畳込み（mod 998244353）】O((ha + hb) (wa + wb) (log(ha + hb) + log(wa + wb)))
/*
* a[0..ha)[0..wa) と b[0..hb)[0..wb) の二次元畳込みを返す．
*/
vvm convolution_2D(vvm a, vvm b) {
	// verify : https://atcoder.jp/contests/abc345/tasks/abc345_g

	int ha = sz(a), wa = sz(a[0]);
	int hb = sz(b), wb = sz(b[0]);

	// 縦方向，横方向ともに素朴に畳み込む．
	if ((ll)ha * wa * hb * wb <= 100000LL) {
		vvm c(ha + hb - 1, vm(wa + wb - 1));
		rep(ia, ha) rep(ib, hb) rep(ja, wa) rep(jb, wb) {
			c[ia + ib][ja + jb] += a[ia][ja] * b[ib][jb];
		}

		return c;
	}

	// 列方向には素朴に畳込み，行方向には NTT で畳み込む．
	if ((ll)ha * hb <= 800LL) {
		// 幅を 2 冪に拡張しておく．
		int W = 1 << (msb(wa + wb - 2) + 1);
		rep(i, ha) a[i].resize(W);
		rep(i, hb) b[i].resize(W);

		// 行方向の NTT
		rep(i, ha) internal::butterfly(a[i]);
		rep(i, hb) internal::butterfly(b[i]);

		vvm c(ha + hb - 1, vm(wa + wb - 1)); vm tmp(W);
		rep(ia, ha) rep(ib, hb) {
			// 各点積
			rep(j, W) tmp[j] = a[ia][j] * b[ib][j];

			// 行方向の INTT
			internal::butterfly_inv(tmp);

			rep(j, wa + wb - 1) c[ia + ib][j] += tmp[j];
		}

		// 定数倍の調整
		mint inv = mint(W).inv();
		rep(i, ha + hb - 1) rep(j, wa + wb - 1) c[i][j] *= inv;

		return c;
	}

	// 行方向には素朴に畳込み，列方向には NTT で畳み込む．
	if ((ll)wa * wb <= 800LL) {
		// 高さを 2 冪に拡張しつつ転置する．
		int H = 1 << (msb(ha + hb - 2) + 1);
		vvm aT(wa, vm(H)), bT(wb, vm(H));
		rep(i, ha) rep(j, wa) aT[j][i] = a[i][j];
		rep(i, hb) rep(j, wb) bT[j][i] = b[i][j];

		// 列方向の NTT
		rep(j, wa) internal::butterfly(aT[j]);
		rep(j, wb) internal::butterfly(bT[j]);

		vvm c(ha + hb - 1, vm(wa + wb - 1)); vm tmp(H);
		rep(ja, wa) rep(jb, wb) {
			// 各点積
			rep(i, H) tmp[i] = aT[ja][i] * bT[jb][i];

			// 列方向の INTT
			internal::butterfly_inv(tmp);

			rep(i, ha + hb - 1) c[i][ja + jb] += tmp[i];
		}

		// 定数倍の調整
		mint inv = mint(H).inv();
		rep(i, ha + hb - 1) rep(j, wa + wb - 1) c[i][j] *= inv;

		return c;
	}

	// 両方向とも NTT で畳み込む．

	// 高さと幅を 2 冪に拡張しておく．
	int H = 1 << (msb(ha + hb - 2) + 1);
	int W = 1 << (msb(wa + wb - 2) + 1);
	a.resize(H); b.resize(H);
	rep(i, H) { a[i].resize(W); b[i].resize(W); }

	// 行方向の NTT
	rep(i, H) { internal::butterfly(a[i]); internal::butterfly(b[i]); }

	// 転置
	vvm aT(W, vm(H)), bT(W, vm(H));
	rep(i, H) rep(j, W) { aT[j][i] = a[i][j]; bT[j][i] = b[i][j]; }

	// 列方向の NTT
	rep(j, W) { internal::butterfly(aT[j]); internal::butterfly(bT[j]); }

	// 各点積
	rep(j, W) rep(i, H) aT[j][i] *= bT[j][i];

	// 列方向の INTT
	rep(j, W) internal::butterfly_inv(aT[j]);

	// 転置
	rep(i, H) rep(j, W) a[i][j] = aT[j][i];

	// 行方向の INTT
	rep(i, H) internal::butterfly_inv(a[i]);

	// 不要な部分の削除
	a.resize(ha + hb - 1);
	rep(i, ha + hb - 1) a[i].resize(wa + wb - 1);

	// 定数倍の調整
	mint inv = mint(H * W).inv();
	rep(i, ha + hb - 1) rep(j, wa + wb - 1) a[i][j] *= inv;

	return a;
}


//【関数の合成】O(N (log N)^2)
/*
* FPS f(z), g(z) を
*	f(z) = Σi∈[0..n) f[i] z^i
*	g(z) = Σj∈[1..m) g[j] z^j
* と定め，[z^[0..N)] f(g(z)) を返す．
*
* 利用：【二次元畳込み（mod 998244353）】
*/
vm composition(const vm& f, const vm& g, int N) {
	// 参考 : https://qiita.com/ryuhe1/items/23d79bb84b270f7359e0
	// verify : https://judge.yosupo.jp/problem/composition_of_formal_power_series_large

	if (N == 0) return vm();
	if (N == 1) return vm{ f[0] };
	if (sz(g) == 0) {
		vm res(N);
		res[0] = f[0];
		return res;
	}

	// 2^K : N 以上の最小の 2 冪
	int K = msb(N - 1) + 1;

	vvvm q(K);

	q[0] = vvm(sz(g), vm(2));
	q[0][0][0] = 1;
	repi(i, 1, sz(g) - 1) q[0][i][1] = -g[i];

	repi(k, 1, K - 1) {
		auto q_pos(q[k - 1]);
		int sz_q = sz(q[k - 1]);
		for (int i = 1; i < sz_q; i += 2) rep(j, sz(q[k - 1][i])) q[k - 1][i][j] *= -1;
		auto qk_dbl = convolution_2D(q_pos, q[k - 1]);
		rep(i, min((sz(qk_dbl) + 1) / 2, (1 << (K - k)))) q[k].emplace_back(move(qk_dbl[2 * i]));
		if (sz(q[k]) > N) q[k].resize(N);
	}

	int sz_q = sz(q[K - 1]);
	for (int i = 1; i < sz_q; i += 2) rep(j, sz(q[K - 1][i])) q[K - 1][i][j] *= -1;
	if (sz(q[K - 1]) > N) q[K - 1].resize(N);

	vvm p(1, vm(N));
	rep(i, min(sz(f), N)) p[0][N - 1 - i] = f[i];

	auto tmp = convolution_2D(p, q[K - 1]);

	int sz_p = min(2, sz(tmp));
	p.resize(sz_p);
	rep(i, sz_p) {
		int j_min = N - (1 << (K - 1));
		int j_max = min(N, sz(tmp[i])) - 1;
		p[i].resize(j_max - j_min + 1);
		repi(j, j_min, j_max) p[i][j - j_min] = tmp[i][j];
	}

	repir(k, K - 2, 0) {
		vvm p_dbl(sz(p) * 2 - 1, vm(sz(p[0])));
		rep(i, sz(p)) rep(j, sz(p[i])) p_dbl[i * 2][j] = p[i][j];

		auto tmp = convolution_2D(p_dbl, q[k]);

		int sz_p = min({ 1 << (K - k), N, sz(tmp) });
		p.resize(sz_p);
		rep(i, sz_p) {
			int j_min = 1 << k;
			int j_max = min(1 << (k + 1), sz(tmp[i])) - 1;
			p[i].resize(j_max - j_min + 1);
			repi(j, j_min, j_max) p[i][j - j_min] = tmp[i][j];
		}
	}

	vm res(N);
	rep(i, min(N, sz(p))) res[i] = p[i][0];

	return res;
}


// O(n (log n)^2 log m) は許してもらえなかった．
mint TLE2(int n, int m) {
	vm res{ 0, 1 }, pow2{ 0, 1, 1 };
	
	while (m > 0) {
//		dump(pow2);
		if (m & 1) res = composition(res, pow2, n + 2);
		pow2 = composition(pow2, pow2, n + 2);
		m /= 2;
	}
//	dump(res);

	return res[n + 1];
}


//【オンライン畳込み（mod 998244353）】
/*
* Online_convolution(int n) : O(n)
*	a[0..n) と b[0..n) の畳込み c[0..n) を計算できるよう初期化する．
*
* set(mint a, mint b) : ならし O((log n)^2)
*	t 回目に呼び出すときは，a=a[t], b=b[t] を与える．
*
* reset() : ならし O((log n)^2)
*	直前の set() を取り消す．
*
* mint [](int i) : O(1)
*	c[i] = Σj∈[0..i] a[j] b[i-j] を返す．
*	制約 : a[0..i], b[0..i] を指定済でなくてはならない．
*
* mint back() : O(1)
*	直前に決定された c[i] を返す．
*/
class Online_convolution {
	// 参考 : https://qiita.com/Kiri8128/items/1738d5403764a0e26b4c

	int n, t; // t : 次が何回目の呼び出しか
	vm as, bs, cs;
	vector<pim> his;

public:
	// 長さ n の数列同士の畳込みを行えるよう初期化する．
	Online_convolution(int n) : n(n), t(0), as(n), bs(n), cs(n) {
		// verify : https://atcoder.jp/contests/abc280/tasks/abc280_e
	}
	Online_convolution() : n(0), t(0) {}

	// t 回目に呼び出すときは，a=a[t], b=b[t] を与える．
	void set(mint a, mint b) {
		// verify : https://atcoder.jp/contests/abc280/tasks/abc280_e

		as[t] = a; bs[t] = b;

		int i1_max = lsb(t + 2), i2_max = i1_max;

		// 対角線上の正方形領域に対する処理を行う場合
		if (popcount(t + 2) == 1) { i1_max -= 2; i2_max -= 1; }

		// 2^i : 正方形の一辺の長さ（対角線より下）
		repi(i, 0, i1_max) {
			// cs_sub[0..j_max] まで計算する必要がある．
			int j_max = min((1 << (i + 1)) - 2, n - 1 - t);

			// len : 真に計算するべき正方形の一辺の長さ
			int len = min(1 << i, j_max + 1);

			// as[x_min..x_min+len) と bs[y_min..y_min+len) を畳み込む．
			int x_min = t + 1 - (1 << i);
			int y_min = (1 << i) - 1;

			vm as_sub, bs_sub;
			copy(as.begin() + x_min, as.begin() + (x_min + len), back_inserter(as_sub));
			copy(bs.begin() + y_min, bs.begin() + (y_min + len), back_inserter(bs_sub));

			vm cs_sub = convolution(as_sub, bs_sub);
			repi(j, 0, j_max) {
				cs[t + j] += cs_sub[j];
				his.emplace_back(t + j, cs_sub[j]);
			}
		}

		// 2^i : 正方形の一辺の長さ（対角線以上）
		repi(i, 0, i2_max) {
			// cs_sub[0..j_max] まで計算する必要がある．
			int j_max = min((1 << (i + 1)) - 2, n - 1 - t);

			// len : 真に計算するべき正方形の一辺の長さ
			int len = min(1 << i, j_max + 1);

			// as[x_min..x_min+len) と bs[y_min..y_min+len) を畳み込む．
			int x_min = (1 << i) - 1;
			int y_min = t + 1 - (1 << i);

			vm as_sub, bs_sub;
			copy(as.begin() + x_min, as.begin() + (x_min + len), back_inserter(as_sub));
			copy(bs.begin() + y_min, bs.begin() + (y_min + len), back_inserter(bs_sub));

			vm cs_sub = convolution(as_sub, bs_sub);
			repi(j, 0, j_max) {
				cs[t + j] += cs_sub[j];
				his.emplace_back(t + j, cs_sub[j]);
			}
		}

		t++;
	}

	// 直前の set() を取り消す．
	void reset() {
		t--;
		
		int i1_max = lsb(t + 2), i2_max = i1_max;

		if (popcount(t + 2) == 1) { i1_max -= 2; i2_max -= 1; }

		repi(i, 0, i1_max) {
			int j_max = min((1 << (i + 1)) - 2, n - 1 - t);

			repi(j, 0, j_max) {
				auto [pos, val] = his.back(); his.pop_back();
				cs[pos] -= val;
			}
		}

		repi(i, 0, i2_max) {
			int j_max = min((1 << (i + 1)) - 2, n - 1 - t);

			repi(j, 0, j_max) {
				auto [pos, val] = his.back(); his.pop_back();
				cs[pos] -= val;
			}
		}

		as[t] = 0; bs[t] = 0;
	}

	// c[i] を返す．
	mint const& operator[](int i) const {
		// verify : https://atcoder.jp/contests/abc280/tasks/abc280_e

		Assert(i < t);

		return cs[i];
	}

	// 直前に決定された c[i] を返す．
	mint back() const {
		// verify : https://judge.yosupo.jp/problem/log_of_formal_power_series

		return cs[t - 1];
	}

#ifdef _MSC_VER
	friend ostream& operator<<(ostream& os, const Online_convolution& c) {
		os << "a: " << c.as << endl;
		os << "b: " << c.bs << endl;
		os << "c: " << c.cs;
		return os;
	}
#endif
}; 


//【階乗など（法が大きな素数）】
/*
* Factorial_mint(int N) : O(n)
*	N まで計算可能として初期化する．
*
* mint fact(int n) : O(1)
*	n! を返す．
*
* mint fact_inv(int n) : O(1)
*	1/n! を返す（n が負なら 0 を返す）
*
* mint inv(int n) : O(1)
*	1/n を返す．
*
* mint perm(int n, int r) : O(1)
*	順列の数 nPr を返す．
*
* mint bin(int n, int r) : O(1)
*	二項係数 nCr を返す．
*
* mint bin_inv(int n, int r) : O(1)
*	二項係数の逆数 1/nCr を返す．
*
* mint mul(vi rs) : O(|rs|)
*	多項係数 nC[rs] を返す．（n = Σrs）
*
* mint hom(int n, int r) : O(1)
*	重複組合せの数 nHr = n+r-1Cr を返す（0H0 = 1 とする）
*
* mint neg_bin(int n, int r) : O(1)
*	負の二項係数 nCr = (-1)^r -n+r-1Cr を返す（n ≦ 0, r ≧ 0）
*/
class Factorial_mint {
	int n_max;

	// 階乗と階乗の逆数の値を保持するテーブル
	vm fac, fac_inv;

public:
	// n! までの階乗とその逆数を前計算しておく．O(n)
	Factorial_mint(int n) : n_max(n), fac(n + 1), fac_inv(n + 1) {
		// verify : https://atcoder.jp/contests/dwacon6th-prelims/tasks/dwacon6th_prelims_b

		fac[0] = 1;
		repi(i, 1, n) fac[i] = fac[i - 1] * i;

		fac_inv[n] = fac[n].inv();
		repir(i, n - 1, 0) fac_inv[i] = fac_inv[i + 1] * (i + 1);
	}
	Factorial_mint() : n_max(0) {} // ダミー

	// n! を返す．
	mint fact(int n) const {
		// verify : https://atcoder.jp/contests/dwacon6th-prelims/tasks/dwacon6th_prelims_b

		Assert(0 <= n && n <= n_max);
		return fac[n];
	}

	// 1/n! を返す（n が負なら 0 を返す）
	mint fact_inv(int n) const {
		// verify : https://atcoder.jp/contests/abc289/tasks/abc289_h

		Assert(n <= n_max);
		if (n < 0) return 0;
		return fac_inv[n];
	}

	// 1/n を返す．
	mint inv(int n) const {
		// verify : https://atcoder.jp/contests/exawizards2019/tasks/exawizards2019_d

		Assert(0 < n && n <= n_max);
		return fac[n - 1] * fac_inv[n];
	}

	// 順列の数 nPr を返す．
	mint perm(int n, int r) const {
		// verify : https://atcoder.jp/contests/abc172/tasks/abc172_e

		Assert(n <= n_max);

		if (r < 0 || n - r < 0) return 0;
		return fac[n] * fac_inv[n - r];
	}

	// 二項係数 nCr を返す．
	mint bin(int n, int r) const {
		// verify : https://judge.yosupo.jp/problem/binomial_coefficient_prime_mod

		Assert(n <= n_max);
		if (r < 0 || n - r < 0) return 0;
		return fac[n] * fac_inv[r] * fac_inv[n - r];
	}

	// 二項係数の逆数 1/nCr を返す．
	mint bin_inv(int n, int r) const {
		// verify : https://www.codechef.com/problems/RANDCOLORING

		Assert(n <= n_max);
		Assert(r >= 0 || n - r >= 0);
		return fac_inv[n] * fac[r] * fac[n - r];
	}

	// 多項係数 nC[rs] を返す．
	mint mul(const vi& rs) const {
		// verify : https://yukicoder.me/problems/no/2141

		if (*min_element(all(rs)) < 0) return 0;
		int n = accumulate(all(rs), 0);
		Assert(n <= n_max);

		mint res = fac[n];
		repe(r, rs) res *= fac_inv[r];

		return res;
	}

	// 重複組合せの数 nHr = n+r-1Cr を返す（0H0 = 1 とする）
	mint hom(int n, int r) {
		// verify : https://mojacoder.app/users/riantkb/problems/toj_ex_2

		if (n == 0) return (int)(r == 0);
		Assert(n + r - 1 <= n_max);
		if (r < 0 || n - 1 < 0) return 0;
		return fac[n + r - 1] * fac_inv[r] * fac_inv[n - 1];
	}

	// 負の二項係数 nCr を返す（n ≦ 0, r ≧ 0）
	mint neg_bin(int n, int r) {
		// verify : https://atcoder.jp/contests/abc345/tasks/abc345_g

		if (n == 0) return (int)(r == 0);
		Assert(-n + r - 1 <= n_max);
		if (r < 0 || -n - 1 < 0) return 0;
		return (r & 1 ? -1 : 1) * fac[-n + r - 1] * fac_inv[r] * fac_inv[-n - 1];
	}
};
Factorial_mint fm((int)2e5 + 10);


//【オンライン合成（二項式，mod 998244353）】
/*
* Online_composition(int n, mint g1, mint g2, Factorial_mint* fm) : O(n)
*	g(z) = g1 z + g2 z^2 とし，f(g(z)) を [z^n] まで計算できるよう初期化する．
*	制約 : fm は n! まで計算可能
*
* set(mint a) : ならし O((log n)^2)
*	t 回目に呼び出すときは，a = [z^t]f(z) を与える．
*
* mint [](int i) : O(1)
*	[z^i] f(g(z)) を返す．
*	制約 : a[0..i] を指定済でなくてはならない．
*
* mint back() : O(1)
*	直前に決定された f(g(z)) の係数を返す．
*/
class Online_composition {
	int n, t; // t : 次が何回目の呼び出しか
	vm as; 
	vm g1_pow, g2_pow; vvm g_pow;
	vvm fen; // f(g(z)) の係数列を分けて格納しておくフェニック木（1-indexed）
	vm cs;
	vector<pim> his;
	Factorial_mint* fm;

public:
	// g(z) = g1 z + g2 z^2 とし，f(g(z)) を [z^n] まで計算できるよう初期化する．
	Online_composition(int n_, mint g1, mint g2, Factorial_mint* fm)
		: n(1 << (msb(n_) + 1)), t(0), as(n), g1_pow(n), g2_pow(n), fen(n + 1), cs(n), fm(fm) {
		int K = msb(n);

		g1_pow[0] = 1;
		g2_pow[0] = 1;
		repi(i, 1, n - 1) {
			g1_pow[i] = g1_pow[i - 1] * g1;
			g2_pow[i] = g2_pow[i - 1] * g2;
		}

		g_pow.resize(K);
		g_pow[0] = vm{ 0, g1, g2 };
		repi(k, 1, K - 1) {
			g_pow[k] = convolution(g_pow[k - 1], g_pow[k - 1]);
			if (sz(g_pow[k]) > n) g_pow[k].resize(n);
		}
	}
	Online_composition() : n(0), t(0), fm(nullptr) {}

	// t 回目に呼び出すときは，a = [z^t]f(z) を与える．
	void set(mint a) {
		as[t] = a;

		cs[t] += a * g1_pow[t];

		int i = t + 1;
		fen[i] = vm{ a };

		int K = lsb(i);
		rep(k, K) {
			fen[i] = convolution(fen[i], g_pow[k]);
			if (sz(fen[i]) > n) fen[i].resize(n);

			int i2 = i - (1 << k);
			rep(j, sz(fen[i2])) fen[i][j] += fen[i2][j];
		}

		if (i != n) {
			int w = 1 << K;
			int l = i - w;

			// fen[i] g(z)^l からの寄与を cs[t+1..t+w] に撒く．
			//	fen[i] は z^[0..2(w-1)] の範囲の係数を持っているので，
			//	g(z)^l は z^[t+1-2(w-1)..t+w] の範囲の係数だけあれば十分である．
			int W = 1 << (msb((t + w) - (t + 1 - 2 * (w - 1)) + 1 - 1) + 1);
			mint W_inv = mint(W).inv();

			vm fe(fen[i]);
			fe.resize(W);

			vm gl(W);
			repi(j, t + 1 - 2 * (w - 1), t + w) {
				int e2 = j - l;
				if (e2 < 0) continue;
				int e1 = l - e2;
				if (e1 < 0) continue;

				// ここで [z^j]g(z)^l が O(1) で求まらないといけないので二項式でもないと厳しそう．
				gl[j - (t + 1 - 2 * (w - 1))] = g1_pow[e1] * g2_pow[e2] * fm->bin(l, e1);
			}

			internal::butterfly(fe);
			internal::butterfly(gl);
			rep(i, W) fe[i] *= gl[i];
			internal::butterfly_inv(fe);

			rep(j, w) {
				mint val = fe[2 * (w - 1) + j] * W_inv;
				cs[t + 1 + j] += val;
				his.emplace_back(t + 1 + j, val);
			}
		}

		t++;
	}

	// 直前の set() を取り消す．
	void reset() {
		t--;
		
		int i = t + 1;
		int K = lsb(i);
		if (i != n) {
			int w = 1 << K;
			
			rep(j, w) {
				auto [pos, val] = his.back(); his.pop_back();
				cs[pos] -= val;
			}
		}

		fen[i].clear();

		cs[t] -= as[t] * g1_pow[t];

		as[t] = 0;
	}

	// [z^i] f(g(z)) を返す．（制約 : a[0..i] を指定済でなくてはならない．）
	mint operator[](int i) const {
		Assert(i < t);
				
		return cs[i];
	}

	// 直前に決定された f(g(z)) の係数を返す．
	mint back() const {
		return cs[t - 1];
	}

#ifdef _MSC_VER
	friend ostream& operator<<(ostream& os, const Online_composition& O) {
		os << "f: " << O.as << endl;
		os << "g: " << O.g_pow[0] << endl;
		os << "h: " << O.cs << endl;
		return os;
	}
#endif
}; 


// O(n (log n)^2) だが n=200000 m=1000000000 で 5584 ms．reset() を使わないようにすれば間に合いそう．
mint TLE3(int n, int m) {
//	dump("n, m:", n, m);

	vm gm(n + 2);
	gm[0] = 0;
	gm[1] = 1;
	gm[2] = m;

	Online_convolution lhs(n + 4);
	lhs.set(gm[0], gm[0] + 1);
	lhs.set(gm[1], gm[1]);
	lhs.set(gm[2], gm[2]);

	Online_composition rhs(n + 4, 1, 1, &fm);
	rhs.set(gm[0]);
	rhs.set(gm[1]);
	rhs.set(gm[2]);

//	dump(lhs); dump(rhs);

	repi(i, 3, n + 1) {
		dump("---------- i:", i, "-----------");
		lhs.set(0, 0);
		lhs.set(0, 0);
		rhs.set(0);
		rhs.set(0);
		dump(lhs); dump(rhs);

		gm[i] = (lhs[i + 1] - rhs[i + 1]) * fm.inv(i - 2);
		dump("gm[i]:", gm[i]);

		lhs.reset();
		lhs.reset();
		rhs.reset();
		rhs.reset();
		dump(lhs); dump(rhs);

		lhs.set(gm[i], gm[i]);
		rhs.set(gm[i]);
		dump(lhs); dump(rhs);
	}

	return gm[n + 1];
}


mint solve(int n, int m) {
//	dump("n, m:", n, m);

	vm gm(n + 2);
	gm[0] = 0;
	gm[1] = 1;
	gm[2] = m;

	Online_convolution lhs(n + 4);
	lhs.set(gm[0], gm[0] + 1);
	lhs.set(gm[1], gm[1]);
	lhs.set(gm[2], gm[2]);

	Online_composition rhs(n + 4, 1, 1, &fm);
	rhs.set(gm[0]);
	rhs.set(gm[1]);
	rhs.set(gm[2]);

//	dump(lhs); dump(rhs);

	repi(i, 3, n + 1) {
		dump("---------- i:", i, "-----------");
		lhs.set(0, 0);
		lhs.set(0, 0);
		rhs.set(0);
		rhs.set(0);
		dump(lhs); dump(rhs);

		gm[i] = (lhs[i + 1] - rhs[i + 1]) * fm.inv(i - 2);
		dump("gm[i]:", gm[i]);

		lhs.reset();
		lhs.reset();
		rhs.reset();
		rhs.reset();
		dump(lhs); dump(rhs);

		lhs.set(gm[i], gm[i]);
		rhs.set(gm[i]);
		dump(lhs); dump(rhs);
	}

	return gm[n + 1];
}


int main() {
//	input_from_file("input.txt");
//	output_to_file("output.txt");

//	zikken();

	int n, m;
	cin >> n >> m;

	cout << solve(n, m) << endl; dump("-----");

	dump(TLE(n, m));
}