結果

問題 No.2936 Sum of Square of Mex
ユーザー ecotteaecottea
提出日時 2024-10-13 02:19:19
言語 C++17
(gcc 12.3.0 + boost 1.83.0)
結果
MLE  
実行時間 -
コード長 41,281 bytes
コンパイル時間 9,779 ms
コンパイル使用メモリ 354,888 KB
実行使用メモリ 814,740 KB
最終ジャッジ日時 2024-10-13 02:19:35
合計ジャッジ時間 10,502 ms
ジャッジサーバーID
(参考情報)
judge5 / judge4
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 5 ms
6,820 KB
testcase_01 AC 6 ms
6,816 KB
testcase_02 AC 12 ms
6,816 KB
testcase_03 MLE -
testcase_04 -- -
testcase_05 -- -
testcase_06 -- -
testcase_07 -- -
testcase_08 -- -
testcase_09 -- -
testcase_10 -- -
testcase_11 -- -
testcase_12 -- -
testcase_13 -- -
testcase_14 -- -
testcase_15 -- -
testcase_16 -- -
testcase_17 -- -
testcase_18 -- -
testcase_19 -- -
testcase_20 -- -
testcase_21 -- -
testcase_22 -- -
testcase_23 -- -
testcase_24 -- -
testcase_25 -- -
testcase_26 -- -
testcase_27 -- -
testcase_28 -- -
権限があれば一括ダウンロードができます

ソースコード

diff #

// QCFium 法
#pragma GCC target("avx2")
#pragma GCC optimize("O3")
#pragma GCC optimize("unroll-loops")


#ifndef HIDDEN_IN_VS // 折りたたみ用

// 警告の抑制
#define _CRT_SECURE_NO_WARNINGS

// ライブラリの読み込み
#include <bits/stdc++.h>
using namespace std;

// 型名の短縮
using ll = long long; using ull = unsigned long long; // -2^63 ~ 2^63 = 9e18(int は -2^31 ~ 2^31 = 2e9)
using pii = pair<int, int>;	using pll = pair<ll, ll>;	using pil = pair<int, ll>;	using pli = pair<ll, int>;
using vi = vector<int>;		using vvi = vector<vi>;		using vvvi = vector<vvi>;	using vvvvi = vector<vvvi>;
using vl = vector<ll>;		using vvl = vector<vl>;		using vvvl = vector<vvl>;	using vvvvl = vector<vvvl>;
using vb = vector<bool>;	using vvb = vector<vb>;		using vvvb = vector<vvb>;
using vc = vector<char>;	using vvc = vector<vc>;		using vvvc = vector<vvc>;
using vd = vector<double>;	using vvd = vector<vd>;		using vvvd = vector<vvd>;
template <class T> using priority_queue_rev = priority_queue<T, vector<T>, greater<T>>;
using Graph = vvi;

// 定数の定義
const double PI = acos(-1);
int DX[4] = { 1, 0, -1, 0 }; // 4 近傍(下,右,上,左)
int DY[4] = { 0, 1, 0, -1 };
int INF = 1001001001; ll INFL = 4004004003094073385LL; // (int)INFL = INF, (int)(-INFL) = -INF;

// 入出力高速化
struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp;

// 汎用マクロの定義
#define all(a) (a).begin(), (a).end()
#define sz(x) ((int)(x).size())
#define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), (x)))
#define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), (x)))
#define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");}
#define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順
#define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順
#define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順
#define repe(v, a) for(const auto& v : (a)) // a の全要素(変更不可能)
#define repea(v, a) for(auto& v : (a)) // a の全要素(変更可能)
#define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索(昇順)
#define repis(i, set) for(int i = lsb(set), bset##i = set; i < 32; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素(昇順)
#define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て(昇順)
#define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去
#define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了
#define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 半開矩形内判定

// 汎用関数の定義
template <class T> inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; }
template <class T> inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新(更新されたら true を返す)
template <class T> inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新(更新されたら true を返す)
template <class T> inline T getb(T set, int i) { return (set >> i) & T(1); }
template <class T> inline T smod(T n, T m) { n %= m; if (n < 0) n += m; return n; } // 非負mod

// 演算子オーバーロード
template <class T, class U> inline istream& operator>>(istream& is, pair<T, U>& p) { is >> p.first >> p.second; return is; }
template <class T> inline istream& operator>>(istream& is, vector<T>& v) { repea(x, v) is >> x; return is; }
template <class T> inline vector<T>& operator--(vector<T>& v) { repea(x, v) --x; return v; }
template <class T> inline vector<T>& operator++(vector<T>& v) { repea(x, v) ++x; return v; }

#endif // 折りたたみ用


#if __has_include(<atcoder/all>)
#include <atcoder/all>
using namespace atcoder;

#ifdef _MSC_VER
#include "localACL.hpp"
#endif

using mint = modint998244353;
//using mint = static_modint<1000000007>;
//using mint = modint; // mint::set_mod(m);

namespace atcoder {
	inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; }
	inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; }
}
using vm = vector<mint>; using vvm = vector<vm>; using vvvm = vector<vvm>; using vvvvm = vector<vvvm>; using pim = pair<int, mint>;
#endif


#ifdef _MSC_VER // 手元環境(Visual Studio)
#include "local.hpp"
#else // 提出用(gcc)
inline int popcount(int n) { return __builtin_popcount(n); }
inline int popcount(ll n) { return __builtin_popcountll(n); }
inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : 32; }
inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : 64; }
template <size_t N> inline int lsb(const bitset<N>& b) { return b._Find_first(); }
inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; }
inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; }
#define dump(...)
#define dumpel(...)
#define dump_list(v)
#define dump_mat(v)
#define input_from_file(f)
#define output_to_file(f)
#define Assert(b) { if (!(b)) { vc MLE(1<<30); EXIT(MLE.back()); } } // RE の代わりに MLE を出す
#endif


//【形式的冪級数】
/*
* MFPS() : O(1)
*	零多項式 f = 0 で初期化する.
*
* MFPS(mint c0) : O(1)
*	定数多項式 f = c0 で初期化する.
*
* MFPS(mint c0, int n) : O(n)
*	n 次未満の項をもつ定数多項式 f = c0 で初期化する.
*
* MFPS(vm c) : O(n)
*	f(z) = c[0] + c[1] z + ... + c[n - 1] z^(n-1) で初期化する.
*
* set_conv(vm(*CONV)(const vm&, const vm&)) : O(1)
*	畳込み用の関数を CONV に設定する.
*
* c + f, f + c : O(1)	f + g : O(n)
* f - c : O(1)			c - f, f - g, -f : O(n)
* c * f, f * c : O(n)	f * g : O(n log n)		f * g_sp : O(n |g|)
* f / c : O(n)			f / g : O(n log n)		f / g_sp : O(n |g|)
*	形式的冪級数としての和,差,積,商の結果を返す.
*	g_sp はスパース多項式であり,{次数, 係数} の次数昇順の組の vector で表す.
*	制約 : 商では g(0) != 0
*
* MFPS f.inv(int d) : O(n log n)
*	1 / f mod z^d を返す.
*	制約 : f(0) != 0
*
* MFPS f.quotient(MFPS g) : O(n log n)
* MFPS f.reminder(MFPS g) : O(n log n)
* pair<MFPS, MFPS> f.quotient_remainder(MFPS g) : O(n log n)
*	多項式としての f を g で割った商,余り,商と余りの組を返す.
*	制約 : g の最高次の係数は 0 でない
*
* int f.deg(), int f.size() : O(1)
*	多項式 f の次数[項数]を返す.
*
* MFPS::monomial(int d, mint c = 1) : O(d)
*	単項式 c z^d を返す.
*
* mint f.assign(mint c) : O(n)
*	多項式 f の不定元 z に c を代入した値を返す.
*
* f.resize(int d) : O(1)
*	mod z^d をとる.
*
* f.resize() : O(n)
*	不要な高次の項を削る.
*
* f >> d, f << d : O(n)
*	係数列を d だけ右[左]シフトした多項式を返す.
*  (右シフトは z^d の乗算,左シフトは z^d で割った商と等価)
*
* f.push_back(c) : O(1)
*	最高次の係数として c を追加する.
*/
struct MFPS {
	using SMFPS = vector<pim>;

	int n; // 係数の個数(次数 + 1)
	vm c; // 係数列
	inline static vm(*CONV)(const vm&, const vm&) = convolution; // 畳込み用の関数

	// コンストラクタ(0,定数,係数列で初期化)
	MFPS() : n(0) {}
	MFPS(mint c0) : n(1), c({ c0 }) {}
	MFPS(int c0) : n(1), c({ mint(c0) }) {}
	MFPS(mint c0, int d) : n(d), c(n) { c[0] = c0; }
	MFPS(int c0, int d) : n(d), c(n) { c[0] = c0; }
	MFPS(const vm& c_) : n(sz(c_)), c(c_) {}
	MFPS(const vi& c_) : n(sz(c_)), c(n) { rep(i, n) c[i] = c_[i]; }

	// 代入
	MFPS(const MFPS& f) = default;
	MFPS& operator=(const MFPS& f) = default;
	MFPS& operator=(const mint& c0) { n = 1; c = { c0 }; return *this; }

	void push_back(mint cn) { c.emplace_back(cn); ++n; }
	void pop_back() { c.pop_back(); --n; }
	[[nodiscard]] mint back() { return c.back(); }

	// 比較
	[[nodiscard]] bool operator==(const MFPS& g) const { return c == g.c; }
	[[nodiscard]] bool operator!=(const MFPS& g) const { return c != g.c; }

	// アクセス
	inline mint const& operator[](int i) const { return c[i]; }
	inline mint& operator[](int i) { return c[i]; }

	// 次数
	[[nodiscard]] int deg() const { return n - 1; }
	[[nodiscard]] int size() const { return n; }

	static void set_conv(vm(*CONV_)(const vm&, const vm&)) {
		// verify : https://atcoder.jp/contests/tdpc/tasks/tdpc_fibonacci

		CONV = CONV_;
	}

	// 加算
	MFPS& operator+=(const MFPS& g) {
		if (n >= g.n) rep(i, g.n) c[i] += g.c[i];
		else {
			rep(i, n) c[i] += g.c[i];
			repi(i, n, g.n - 1)	c.push_back(g.c[i]);
			n = g.n;
		}
		return *this;
	}
	[[nodiscard]] MFPS operator+(const MFPS& g) const { return MFPS(*this) += g; }

	// 定数加算
	MFPS& operator+=(const mint& sc) {
		if (n == 0) { n = 1; c = { sc }; }
		else { c[0] += sc; }
		return *this;
	}
	[[nodiscard]] MFPS operator+(const mint& sc) const { return MFPS(*this) += sc; }
	[[nodiscard]] friend MFPS operator+(const mint& sc, const MFPS& f) { return f + sc; }
	MFPS& operator+=(const int& sc) { *this += mint(sc); return *this; }
	[[nodiscard]] MFPS operator+(const int& sc) const { return MFPS(*this) += sc; }
	[[nodiscard]] friend MFPS operator+(const int& sc, const MFPS& f) { return f + sc; }

	// 減算
	MFPS& operator-=(const MFPS& g) {
		if (n >= g.n) rep(i, g.n) c[i] -= g.c[i];
		else {
			rep(i, n) c[i] -= g.c[i];
			repi(i, n, g.n - 1) c.push_back(-g.c[i]);
			n = g.n;
		}
		return *this;
	}
	[[nodiscard]] MFPS operator-(const MFPS& g) const { return MFPS(*this) -= g; }

	// 定数減算
	MFPS& operator-=(const mint& sc) { *this += -sc; return *this; }
	[[nodiscard]] MFPS operator-(const mint& sc) const { return MFPS(*this) -= sc; }
	[[nodiscard]] friend MFPS operator-(const mint& sc, const MFPS& f) { return -(f - sc); }
	MFPS& operator-=(const int& sc) { *this += -sc; return *this; }
	[[nodiscard]] MFPS operator-(const int& sc) const { return MFPS(*this) -= sc; }
	[[nodiscard]] friend MFPS operator-(const int& sc, const MFPS& f) { return -(f - sc); }

	// 加法逆元
	[[nodiscard]] MFPS operator-() const { return MFPS(*this) *= -1; }

	// 定数倍
	MFPS& operator*=(const mint& sc) { rep(i, n) c[i] *= sc; return *this; }
	[[nodiscard]] MFPS operator*(const mint& sc) const { return MFPS(*this) *= sc; }
	[[nodiscard]] friend MFPS operator*(const mint& sc, const MFPS& f) { return f * sc; }
	MFPS& operator*=(const int& sc) { *this *= mint(sc); return *this; }
	[[nodiscard]] MFPS operator*(const int& sc) const { return MFPS(*this) *= sc; }
	[[nodiscard]] friend MFPS operator*(const int& sc, const MFPS& f) { return f * sc; }

	// 右からの定数除算
	MFPS& operator/=(const mint& sc) { *this *= sc.inv(); return *this; }
	[[nodiscard]] MFPS operator/(const mint& sc) const { return MFPS(*this) /= sc; }
	MFPS& operator/=(const int& sc) { *this /= mint(sc); return *this; }
	[[nodiscard]] MFPS operator/(const int& sc) const { return MFPS(*this) /= sc; }

	// 積
	MFPS& operator*=(const MFPS& g) { c = CONV(c, g.c); n = sz(c); return *this; }
	[[nodiscard]] MFPS operator*(const MFPS& g) const { return MFPS(*this) *= g; }

	// 除算
	[[nodiscard]] MFPS inv(int d) const {
		// 参考:https://nyaannyaan.github.io/library/fps/formal-power-series.hpp
		// verify : https://judge.yosupo.jp/problem/inv_of_formal_power_series

		//【方法】
		// 1 / f mod z^d を求めることは,
		//		f g = 1 (mod z^d)
		// なる g を求めることである.
		// この d の部分を 1, 2, 4, ..., 2^i と倍々にして求めていく.
		//
		// d = 1 のときについては
		//		g = 1 / f[0] (mod z^1)
		// である.
		//
		// 次に,
		//		g = h (mod z^k)
		// が求まっているとして
		//		g mod z^(2 k)
		// を求める.最初の式を変形していくことで
		//		g - h = 0 (mod z^k)
		//		⇒ (g - h)^2 = 0 (mod z^(2 k))
		//		⇔ g^2 - 2 g h + h^2 = 0 (mod z^(2 k))
		//		⇒ f g^2 - 2 f g h + f h^2 = 0 (mod z^(2 k))
		//		⇔ g - 2 h + f h^2 = 0 (mod z^(2 k))  (f g = 1 (mod z^d) より)
		//		⇔ g = (2 - f h) h (mod z^(2 k))
		// を得る.
		//
		// この手順を d ≦ 2^i となる i まで繰り返し,d 次以上の項を削除すればよい.

		Assert(!c.empty());
		Assert(c[0] != 0);

		MFPS g(c[0].inv());
		for (int k = 1; k < d; k <<= 1) {
			int len = max(min(2 * k, d), 1);
			MFPS tmp(0, len);
			rep(i, min(len, n)) tmp[i] = -c[i];	// -f
			tmp *= g;							// -f h
			tmp.resize(len);
			tmp[0] += 2;						// 2 - f h
			g *= tmp;							// (2 - f h) h
			g.resize(len);
		}

		return g;
	}
	MFPS& operator/=(const MFPS& g) { return *this *= g.inv(max(n, g.n)); }
	[[nodiscard]] MFPS operator/(const MFPS& g) const { return MFPS(*this) /= g; }

	// 余り付き除算
	[[nodiscard]] MFPS quotient(const MFPS& g) const {
		// 参考 : https://nyaannyaan.github.io/library/fps/formal-power-series.hpp
		// verify : https://judge.yosupo.jp/problem/division_of_polynomials

		//【方法】
		// f(x) = g(x) q(x) + r(x) となる q(x) を求める.
		// f の次数は n-1, g の次数は m-1 とする.(n ≧ m)
		// 従って q の次数は n-m,r の次数は m-2 となる.
		// 
		// f^R で f の係数列を逆順にした多項式を表す.すなわち
		//		f^R(x) := f(1/x) x^(n-1)
		// である.他の多項式も同様とする.
		//
		// 最初の式で x → 1/x と置き換えると,
		//		f(1/x) = g(1/x) q(1/x) + r(1/x)
		//		⇔ f(1/x) x^(n-1) = g(1/x) q(1/x) x^(n-1) + r(1/x) x^(n-1)
		//		⇔ f(1/x) x^(n-1) = g(1/x) x^(m-1) q(1/x) x^(n-m) + r(1/x) x^(m-2) x^(n-m+1)
		//		⇔ f^R(x) = g^R(x) q^R(x) + r^R(x) x^(n-m+1)
		//		⇒ f^R(x) = g^R(x) q^R(x) (mod x^(n-m+1))
		// 	    ⇒ q^R(x) = f^R(x) / g^R(x)  (mod x^(n-m+1))
		// を得る.
		// 	   
		// これで q を mod x^(n-m+1) で正しく求めることができることになるが,
		// q の次数は n-m であったから,q 自身を正しく求めることができた.

		if (n < g.n) return MFPS();
		return ((this->rev() / g.rev()).resize(n - g.n + 1)).rev();
	}
	[[nodiscard]] MFPS reminder(const MFPS& g) const {
		// verify : https://judge.yosupo.jp/problem/division_of_polynomials

		return (*this - this->quotient(g) * g).resize();
	}
	[[nodiscard]] pair<MFPS, MFPS> quotient_remainder(const MFPS& g) const {
		// verify : https://judge.yosupo.jp/problem/division_of_polynomials

		pair<MFPS, MFPS> res;
		res.first = this->quotient(g);
		res.second = (*this - res.first * g).resize();
		return res;
	}

	// スパース積
	MFPS& operator*=(const SMFPS& g) {
		// g の定数項だけ例外処理
		auto it0 = g.begin();
		mint g0 = 0;
		if (it0->first == 0) {
			g0 = it0->second;
			it0++;
		}

		// 後ろからインライン配る DP
		repir(i, n - 1, 0) {
			// 上位項に係数倍して配っていく.
			for (auto it = it0; it != g.end(); it++) {
				auto [j, gj] = *it;

				if (i + j >= n) break;

				c[i + j] += c[i] * gj;
			}

			// 定数項は最後に配るか消去しないといけない.
			c[i] *= g0;
		}

		return *this;
	}
	[[nodiscard]] MFPS operator*(const SMFPS& g) const { return MFPS(*this) *= g; }

	// スパース商
	MFPS& operator/=(const SMFPS& g) {
		// g の定数項だけ例外処理
		auto it0 = g.begin();
		Assert(it0->first == 0 && it0->second != 0);
		mint g0_inv = it0->second.inv();
		it0++;

		// 前からインライン配る DP(後ろに累積効果あり)
		rep(i, n) {

			// 定数項は最初に配らないといけない.
			c[i] *= g0_inv;

			// 上位項に係数倍して配っていく.
			for (auto it = it0; it != g.end(); it++) {
				auto [j, gj] = *it;

				if (i + j >= n) break;

				c[i + j] -= c[i] * gj;
			}
		}

		return *this;
	}
	[[nodiscard]] MFPS operator/(const SMFPS& g) const { return MFPS(*this) /= g; }

	// 係数反転
	[[nodiscard]] MFPS rev() const { MFPS h = *this; reverse(all(h.c)); return h; }

	// 単項式
	[[nodiscard]] static MFPS monomial(int d, mint coef = 1) {
		MFPS mono(0, d + 1);
		mono[d] = coef;
		return mono;
	}

	// 不要な高次項の除去
	MFPS& resize() {
		// 最高次の係数が非 0 になるまで削る.
		while (n > 0 && c[n - 1] == 0) {
			c.pop_back();
			n--;
		}
		return *this;
	}

	// x^d 以上の項を除去する.
	MFPS& resize(int d) {
		n = d;
		c.resize(d);
		return *this;
	}

	// 不定元への代入
	[[nodiscard]] mint assign(const mint& x) const {
		mint val = 0;
		repir(i, n - 1, 0) val = val * x + c[i];
		return val;
	}

	// 係数のシフト
	MFPS& operator>>=(int d) {
		n += d;
		c.insert(c.begin(), d, 0);
		return *this;
	}
	MFPS& operator<<=(int d) {
		n -= d;
		if (n <= 0) { c.clear(); n = 0; }
		else c.erase(c.begin(), c.begin() + d);
		return *this;
	}
	[[nodiscard]] MFPS operator>>(int d) const { return MFPS(*this) >>= d; }
	[[nodiscard]] MFPS operator<<(int d) const { return MFPS(*this) <<= d; }

#ifdef _MSC_VER
	friend ostream& operator<<(ostream& os, const MFPS& f) {
		if (f.n == 0) os << 0;
		else {
			rep(i, f.n) {
				os << f[i] << "z^" << i;
				if (i < f.n - 1) os << " + ";
			}
		}
		return os;
	}
#endif
};


//【階乗など(法が大きな素数)】
/*
* Factorial_mint(int N) : O(n)
*	N まで計算可能として初期化する.
*
* mint fact(int n) : O(1)
*	n! を返す.
*
* mint fact_inv(int n) : O(1)
*	1/n! を返す(n が負なら 0 を返す)
*
* mint inv(int n) : O(1)
*	1/n を返す.
*
* mint perm(int n, int r) : O(1)
*	順列の数 nPr を返す.
*
* mint bin(int n, int r) : O(1)
*	二項係数 nCr を返す.
*
* mint bin_inv(int n, int r) : O(1)
*	二項係数の逆数 1/nCr を返す.
*
* mint mul(vi rs) : O(|rs|)
*	多項係数 nC[rs] を返す.(n = Σrs)
*
* mint hom(int n, int r) : O(1)
*	重複組合せの数 nHr = n+r-1Cr を返す(0H0 = 1 とする)
*
* mint neg_bin(int n, int r) : O(1)
*	負の二項係数 nCr = (-1)^r -n+r-1Cr を返す(n ≦ 0, r ≧ 0)
*/
class Factorial_mint {
	int n_max;

	// 階乗と階乗の逆数の値を保持するテーブル
	vm fac, fac_inv;

public:
	// n! までの階乗とその逆数を前計算しておく.O(n)
	Factorial_mint(int n) : n_max(n), fac(n + 1), fac_inv(n + 1) {
		// verify : https://atcoder.jp/contests/dwacon6th-prelims/tasks/dwacon6th_prelims_b

		fac[0] = 1;
		repi(i, 1, n) fac[i] = fac[i - 1] * i;

		fac_inv[n] = fac[n].inv();
		repir(i, n - 1, 0) fac_inv[i] = fac_inv[i + 1] * (i + 1);
	}
	Factorial_mint() : n_max(0) {} // ダミー

	// n! を返す.
	mint fact(int n) const {
		// verify : https://atcoder.jp/contests/dwacon6th-prelims/tasks/dwacon6th_prelims_b

		Assert(0 <= n && n <= n_max);
		return fac[n];
	}

	// 1/n! を返す(n が負なら 0 を返す)
	mint fact_inv(int n) const {
		// verify : https://atcoder.jp/contests/abc289/tasks/abc289_h

		Assert(n <= n_max);
		if (n < 0) return 0;
		return fac_inv[n];
	}

	// 1/n を返す.
	mint inv(int n) const {
		// verify : https://atcoder.jp/contests/exawizards2019/tasks/exawizards2019_d

		Assert(0 < n && n <= n_max);
		return fac[n - 1] * fac_inv[n];
	}

	// 順列の数 nPr を返す.
	mint perm(int n, int r) const {
		// verify : https://atcoder.jp/contests/abc172/tasks/abc172_e

		Assert(n <= n_max);

		if (r < 0 || n - r < 0) return 0;
		return fac[n] * fac_inv[n - r];
	}

	// 二項係数 nCr を返す.
	mint bin(int n, int r) const {
		// verify : https://judge.yosupo.jp/problem/binomial_coefficient_prime_mod

		Assert(n <= n_max);
		if (r < 0 || n - r < 0) return 0;
		return fac[n] * fac_inv[r] * fac_inv[n - r];
	}

	// 二項係数の逆数 1/nCr を返す.
	mint bin_inv(int n, int r) const {
		// verify : https://www.codechef.com/problems/RANDCOLORING

		Assert(n <= n_max);
		Assert(r >= 0 && n - r >= 0);
		return fac_inv[n] * fac[r] * fac[n - r];
	}

	// 多項係数 nC[rs] を返す.
	mint mul(const vi& rs) const {
		// verify : https://yukicoder.me/problems/no/2141

		if (*min_element(all(rs)) < 0) return 0;
		int n = accumulate(all(rs), 0);
		Assert(n <= n_max);

		mint res = fac[n];
		repe(r, rs) res *= fac_inv[r];

		return res;
	}

	// 重複組合せの数 nHr = n+r-1Cr を返す(0H0 = 1 とする)
	mint hom(int n, int r) {
		// verify : https://mojacoder.app/users/riantkb/problems/toj_ex_2

		if (n == 0) return (int)(r == 0);
		Assert(n + r - 1 <= n_max);
		if (r < 0 || n - 1 < 0) return 0;
		return fac[n + r - 1] * fac_inv[r] * fac_inv[n - 1];
	}

	// 負の二項係数 nCr を返す(n ≦ 0, r ≧ 0)
	mint neg_bin(int n, int r) {
		// verify : https://atcoder.jp/contests/abc345/tasks/abc345_g

		if (n == 0) return (int)(r == 0);
		Assert(-n + r - 1 <= n_max);
		if (r < 0 || -n - 1 < 0) return 0;
		return (r & 1 ? -1 : 1) * fac[-n + r - 1] * fac_inv[r] * fac_inv[-n - 1];
	}
};
Factorial_mint fm((int)2e5 + 10);


//【二次元畳込み(mod 998244353)】O((ha + hb) (wa + wb) (log(ha + hb) + log(wa + wb)))
/*
* a[0..ha)[0..wa) と b[0..hb)[0..wb) の二次元畳込みを返す.
*/
vvm convolution_2D(vvm a, vvm b) {
	// verify : https://atcoder.jp/contests/abc345/tasks/abc345_g

	int ha = sz(a), wa = sz(a[0]);
	int hb = sz(b), wb = sz(b[0]);

	// 縦方向,横方向ともに素朴に畳み込む.
	if ((ll)ha * wa * hb * wb <= 100000LL) {
		vvm c(ha + hb - 1, vm(wa + wb - 1));
		rep(ia, ha) rep(ib, hb) rep(ja, wa) rep(jb, wb) {
			c[ia + ib][ja + jb] += a[ia][ja] * b[ib][jb];
		}

		return c;
	}

	// 列方向には素朴に畳込み,行方向には NTT で畳み込む.
	if ((ll)ha * hb <= 800LL) {
		// 幅を 2 冪に拡張しておく.
		int W = 1 << (msb(wa + wb - 2) + 1);
		rep(i, ha) a[i].resize(W);
		rep(i, hb) b[i].resize(W);

		// 行方向の NTT
		rep(i, ha) internal::butterfly(a[i]);
		rep(i, hb) internal::butterfly(b[i]);

		vvm c(ha + hb - 1, vm(wa + wb - 1)); vm tmp(W);
		rep(ia, ha) rep(ib, hb) {
			// 各点積
			rep(j, W) tmp[j] = a[ia][j] * b[ib][j];

			// 行方向の INTT
			internal::butterfly_inv(tmp);

			rep(j, wa + wb - 1) c[ia + ib][j] += tmp[j];
		}

		// 定数倍の調整
		mint inv = mint(W).inv();
		rep(i, ha + hb - 1) rep(j, wa + wb - 1) c[i][j] *= inv;

		return c;
	}

	// 行方向には素朴に畳込み,列方向には NTT で畳み込む.
	if ((ll)wa * wb <= 800LL) {
		// 高さを 2 冪に拡張しつつ転置する.
		int H = 1 << (msb(ha + hb - 2) + 1);
		vvm aT(wa, vm(H)), bT(wb, vm(H));
		rep(i, ha) rep(j, wa) aT[j][i] = a[i][j];
		rep(i, hb) rep(j, wb) bT[j][i] = b[i][j];

		// 列方向の NTT
		rep(j, wa) internal::butterfly(aT[j]);
		rep(j, wb) internal::butterfly(bT[j]);

		vvm c(ha + hb - 1, vm(wa + wb - 1)); vm tmp(H);
		rep(ja, wa) rep(jb, wb) {
			// 各点積
			rep(i, H) tmp[i] = aT[ja][i] * bT[jb][i];

			// 列方向の INTT
			internal::butterfly_inv(tmp);

			rep(i, ha + hb - 1) c[i][ja + jb] += tmp[i];
		}

		// 定数倍の調整
		mint inv = mint(H).inv();
		rep(i, ha + hb - 1) rep(j, wa + wb - 1) c[i][j] *= inv;

		return c;
	}

	// 両方向とも NTT で畳み込む.

	// 高さと幅を 2 冪に拡張しておく.
	int H = 1 << (msb(ha + hb - 2) + 1);
	int W = 1 << (msb(wa + wb - 2) + 1);
	a.resize(H); b.resize(H);
	rep(i, H) { a[i].resize(W); b[i].resize(W); }

	// 行方向の NTT
	rep(i, H) { internal::butterfly(a[i]); internal::butterfly(b[i]); }

	// 転置
	vvm aT(W, vm(H)), bT(W, vm(H));
	rep(i, H) rep(j, W) { aT[j][i] = a[i][j]; bT[j][i] = b[i][j]; }

	// 列方向の NTT
	rep(j, W) { internal::butterfly(aT[j]); internal::butterfly(bT[j]); }

	// 各点積
	rep(j, W) rep(i, H) aT[j][i] *= bT[j][i];

	// 列方向の INTT
	rep(j, W) internal::butterfly_inv(aT[j]);

	// 転置
	rep(i, H) rep(j, W) a[i][j] = aT[j][i];

	// 行方向の INTT
	rep(i, H) internal::butterfly_inv(a[i]);

	// 不要な部分の削除
	a.resize(ha + hb - 1);
	rep(i, ha + hb - 1) a[i].resize(wa + wb - 1);

	// 定数倍の調整
	mint inv = mint(H * W).inv();
	rep(i, ha + hb - 1) rep(j, wa + wb - 1) a[i][j] *= inv;

	return a;
}


//【二変数展開係数】O(n m^2 (log n + log m) log N) ?
/*
*	f(z,w) = Σi∈[0..n) Σj∈[0..m) f[i][j] z^i w^j
*	g(z,w) = Σi∈[0..n) Σj∈[0..m) g[i][j] z^i w^j
* と定め,[z^N] [w^[0..M]] f(z,w) / g(z,w) を返す.
*
* 制約 : [z^0]g(z,w) = 1
*
* 利用:【二次元畳込み(mod 998244353)】
*/
vm bostan_mori(vvm f, vvm g, int N, int M) {
	// 参考 : https://noshi91.hatenablog.com/entry/2024/03/16/224034
	// verify : https://judge.yosupo.jp/problem/compositional_inverse_of_formal_power_series_large

	//【方法】
	// 1 変数のときのボスタン-森法と全く同じ.

	// f(z,w) = 0 のときは 0 を返す.
	if (sz(f) == 0) return vm(M + 1);

	while (N > 0) {
		// f2(z,w) = f(z,w) g(-z,w), g2(z,w) = g(z,w) g(-z,w) を求める.
		vvm f2, g2 = g;
		rep(i, sz(g2)) if (i & 1) rep(j, sz(g2[i])) g2[i][j] *= -1;
		f2 = convolution_2D(f, g2);
		g2 = convolution_2D(g, g2);

		// f3(z,w) = E(z,w) or O(z,w), g3(z,w) = e(z,w) を求める.
		f.clear(); g.clear();
		if (N & 1) rep(i, min<ll>(sz(f2) / 2, N / 2 + 1)) f.push_back(f2[2 * i + 1]);
		else rep(i, min<ll>((sz(f2) + 1) / 2, N / 2 + 1)) f.push_back(f2[2 * i]);
		rep(i, min<ll>((sz(g2) + 1) / 2, N / 2 + 1)) g.push_back(g2[2 * i]);

		rep(i, sz(f)) if (sz(f[i]) > M + 1) f[i].resize(M + 1);
		rep(i, sz(g)) if (sz(g[i]) > M + 1) g[i].resize(M + 1);

		// N を半分にして次のステップに進む.
		N /= 2;
	}

	// N = 0 になったら [z^0]g(z,w) = 1 なので [z^0]f(z,w) を返せば良い.
	f[0].resize(M + 1);
	return f[0];
}


//【累乗の係数列挙】O(N (log N)^2)
/*
*	a(z) = Σi∈[0..n] a[i] z^i
*	b(z) = Σi∈[1..n] b[i] z^i
* と定め,各 i∈[0..N] についての [z^N] a(z) b(z)^i のリストを返す.
*
* 利用:【二変数展開係数】
*/
vm coefficients_of_power(const vm& a, const vm& b, int N) {
	// 参考 : https://noshi91.hatenablog.com/entry/2024/03/16/224034
	// verify : https://judge.yosupo.jp/problem/compositional_inverse_of_formal_power_series_large

	//【方法】
	// 求めたいものは
	//		[w^[0..N]] Σj∈[0..∞) ([z^N] a(z) b(z)^j) w^j
	//		= [z^N] [w^[0..N]] a(z) Σj∈[0..∞) (b(z) w)^j
	//		= [z^N] [w^[0..N]] a(z) / (1 - b(z)w)
	// と書き直せるので,2 変数ボスタン-森法で求められる.

	int na = sz(a), nb = sz(b);
	if (na == 0 || nb == 0) return vm(0, N + 1);

	Assert(b[0] == 0);

	vvm f(na, vm(1));
	rep(i, na) f[i][0] = a[i];

	vvm g(nb, vm(2));
	g[0][0] = 1;
	repi(i, 1, nb - 1) g[i][1] = -b[i];

	return bostan_mori(f, g, N, N);
}


mint TLE(int n, int m) {
	vm a(n + 1); mint pow_m1 = 1;
	repi(i, 0, n) {
		a[i] = fm.fact_inv(i) * pow_m1;
		pow_m1 *= m + 1;
	}
//	dump(a);

	MFPS f(0, n + 1), g(0, n + 1);
	repi(i, 0, n) f[i] = g[i] = fm.fact_inv(i);
	f[0] = 0;
	f /= g;
	f.resize(n + 1);
//	dump(f);

	vm c = coefficients_of_power(a, f.c, n);
//	repi(i, 0, n) c[i] *= fm.fact(n);
//	dump(c);

	c.push_back(0);
	if (m + 2 < sz(c)) c[m + 2] = 0;
//	dump(c);

	mint res = 0;
	repi(i, 0, min(m + 1, n)) {
		res += (c[i] - c[i + 1]) * i * i;
	}
	res *= fm.fact(n);

	return res;
}


//【行列】
/*
* Matrix<T>(int n, int m) : O(n m)
*	n×m 零行列で初期化する.
*
* Matrix<T>(int n) : O(n^2)
*	n×n 単位行列で初期化する.
*
* Matrix<T>(vvT a) : O(n m)
*	二次元配列 a[0..n)[0..m) の要素で初期化する.
*
* bool empty() : O(1)
*	行列が空かを返す.
*
* A + B : O(n m)
*	n×m 行列 A, B の和を返す.+= も使用可.
*
* A - B : O(n m)
*	n×m 行列 A, B の差を返す.-= も使用可.
*
* c * A / A * c : O(n m)
*	n×m 行列 A とスカラー c のスカラー積を返す.*= も使用可.
*
* A * x : O(n m)
*	n×m 行列 A と n 次元列ベクトル x の積を返す.
*
* x * A : O(n m)(やや遅い)
*	m 次元行ベクトル x と n×m 行列 A の積を返す.
*
* A * B : O(n m l)
*	n×m 行列 A と m×l 行列 B の積を返す.
*
* Mat pow(ll d) : O(n^3 log d)
*	自身を d 乗した行列を返す.
*/
template <class T>
struct Matrix {
	int n, m; // 行列のサイズ(n 行 m 列)
	vector<vector<T>> v; // 行列の成分

	// n×m 零行列で初期化する.
	Matrix(int n, int m) : n(n), m(m), v(n, vector<T>(m)) {}

	// n×n 単位行列で初期化する.
	Matrix(int n) : n(n), m(n), v(n, vector<T>(n)) { rep(i, n) v[i][i] = T(1); }

	// 二次元配列 a[0..n)[0..m) の要素で初期化する.
	Matrix(const vector<vector<T>>& a) : n(sz(a)), m(sz(a[0])), v(a) {}
	Matrix() : n(0), m(0) {}

	// 代入
	Matrix(const Matrix&) = default;
	Matrix& operator=(const Matrix&) = default;

	// アクセス
	inline vector<T> const& operator[](int i) const { return v[i]; }
	inline vector<T>& operator[](int i) {
		// verify : https://judge.yosupo.jp/problem/matrix_product

		// inline を付けて [] でアクセスするとなぜか v[] への直接アクセスより速くなった.
		return v[i];
	}

	// 入力
	friend istream& operator>>(istream& is, Matrix& a) {
		rep(i, a.n) rep(j, a.m) is >> a.v[i][j];
		return is;
	}

	// 行の追加
	void push_back(const vector<T>& a) {
		Assert(sz(a) == m);
		v.push_back(a);
		n++;
	}

	// 行の削除
	void pop_back() {
		Assert(n > 0);
		v.pop_back();
		n--;
	}
	void resize(int n_) {
		v.resize(n_);
		n = n_;
	}

	// 空か
	bool empty() const { return min(n, m) == 0; }

	// 比較
	bool operator==(const Matrix& b) const { return n == b.n && m == b.m && v == b.v; }
	bool operator!=(const Matrix& b) const { return !(*this == b); }

	// 加算,減算,スカラー倍
	Matrix& operator+=(const Matrix& b) {
		rep(i, n) rep(j, m) v[i][j] += b[i][j];
		return *this;
	}
	Matrix& operator-=(const Matrix& b) {
		rep(i, n) rep(j, m) v[i][j] -= b[i][j];
		return *this;
	}
	Matrix& operator*=(const T& c) {
		rep(i, n) rep(j, m) v[i][j] *= c;
		return *this;
	}
	Matrix operator+(const Matrix& b) const { return Matrix(*this) += b; }
	Matrix operator-(const Matrix& b) const { return Matrix(*this) -= b; }
	Matrix operator*(const T& c) const { return Matrix(*this) *= c; }
	friend Matrix operator*(const T& c, const Matrix<T>& a) { return a * c; }
	Matrix operator-() const { return Matrix(*this) *= T(-1); }

	// 行列ベクトル積 : O(m n)
	vector<T> operator*(const vector<T>& x) const {
		vector<T> y(n);
		rep(i, n) rep(j, m)	y[i] += v[i][j] * x[j];
		return y;
	}

	// ベクトル行列積 : O(m n)
	friend vector<T> operator*(const vector<T>& x, const Matrix& a) {
		vector<T> y(a.m);
		rep(i, a.n) rep(j, a.m) y[j] += x[i] * a[i][j];
		return y;
	}

	// 積:O(n^3)
	Matrix operator*(const Matrix& b) const {
		// verify : https://judge.yosupo.jp/problem/matrix_product

		Matrix res(n, b.m);
		rep(i, res.n) rep(k, m) rep(j, res.m) res[i][j] += v[i][k] * b[k][j];
		return res;
	}
	Matrix& operator*=(const Matrix& b) { *this = *this * b; return *this; }

	// 累乗:O(n^3 log d)
	Matrix pow(ll d) const {
		// verify : https://judge.yosupo.jp/problem/pow_of_matrix

		Matrix res(n), pow2 = *this;
		while (d > 0) {
			if (d & 1) res *= pow2;
			pow2 *= pow2;
			d >>= 1;
		}
		return res;
	}

#ifdef _MSC_VER
	friend ostream& operator<<(ostream& os, const Matrix& a) {
		rep(i, a.n) {
			os << "[";
			rep(j, a.m) os << a[i][j] << " ]"[j == a.m - 1];
			if (i < a.n - 1) os << "\n";
		}
		return os;
	}
#endif
};


//【線形方程式】O(n m min(n, m))
/*
* 与えられた n×m 行列 A と n 次元ベクトル b に対し,
* 線形方程式 A x = b の特殊解 x0(m 次元ベクトル)を返す(なければ空リスト)
* また同次形 A x = 0 の解空間の基底(m 次元ベクトル)のリストを xs に格納する.
*/
template <class T>
vector<T> gauss_jordan_elimination(const Matrix<T>& A, const vector<T>& b, vector<vector<T>>* xs = nullptr) {
	// verify : https://judge.yosupo.jp/problem/system_of_linear_equations

	int n = A.n, m = A.m;

	// v : 拡大係数行列 (A | b)
	vector<vector<T>> v(n, vector<T>(m + 1));
	rep(i, n) rep(j, m) v[i][j] = A[i][j];
	rep(i, n) v[i][m] = b[i];

	// pivots[i] : 第 i 行のピボットが第何列にあるか
	vi pivots;

	// 注目位置を v[i][j] とする.
	int i = 0, j = 0;

	while (i < n && j <= m) {
		// 注目列の下方の行から非 0 成分を見つける.
		int i2 = i;
		while (i2 < n && v[i2][j] == T(0)) i2++;

		// 見つからなかったら注目位置を右に移す.
		if (i2 == n) { j++; continue; }

		// 見つかったら第 i 行とその行を入れ替える.
		if (i != i2) swap(v[i], v[i2]);

		// v[i][j] をピボットに選択する.
		pivots.push_back(j);

		// v[i][j] が 1 になるよう第 i 行全体を v[i][j] で割る.
		T vij_inv = T(1) / v[i][j];
		repi(j2, j, m) v[i][j2] *= vij_inv;

		// 第 i 行以外の第 j 列の成分が全て 0 になるよう第 i 行を定数倍して減じる.
		rep(i2, n) {
			if (v[i2][j] == T(0) || i2 == i) continue;

			T mul = v[i2][j];
			repi(j2, j, m) v[i2][j2] -= v[i][j2] * mul;
		}

		// 注目位置を右下に移す.
		i++; j++;
	}

	// 最後に見つかったピボットの位置が第 m 列ならば解なし.
	if (!pivots.empty() && pivots.back() == m) return vector<T>();

	// A x = b の特殊解 x0 の構成(任意定数は全て 0 にする)
	vector<T> x0(m);
	int rnk = sz(pivots);
	rep(i, rnk) x0[pivots[i]] = v[i][m];

	// 同次形 A x = 0 の一般解 {x} の基底の構成(任意定数を 1-hot にする)
	if (xs != nullptr) {
		xs->clear();

		int i = 0;
		rep(j, m) {
			if (i < rnk && j == pivots[i]) {
				i++;
				continue;
			}

			vector<T> x(m);
			x[j] = T(1);
			rep(i2, i) x[pivots[i2]] = -v[i2][j];
			xs->emplace_back(move(x));
		}
	}

	return x0;
}


//【変数係数線形漸化式の発見】O(n L^2 D^2 + N (L D + log(mod)))
/*
* 係数多項式の次数が D 次未満の L 項間漸化式
*	Σi∈[0..L) Σj∈[0..D) c(i,j) (m+i)^j a[m+i] = 0
* の存在を仮定して a[0..n) を延長し a[0..N] にする(失敗したら false を返す)
*
* 制約 : n ≧ L(D+1)-1(ランク落ちしてるとこれでも足りないかも)
*
* 利用:【行列】,【線形方程式】
*/
template <class DUMMY = int>
bool p_recursive(int N, vm& a, int L, int D, vm* coef = nullptr) {
	// verify : https://atcoder.jp/contests/abc222/tasks/abc222_h

	int n = sz(a);

	// 既に十分な長さがある場合はそのままで良い.
	if (N <= n - 1) {
		a.resize(N + 1);
		return true;
	}

	// 式が足りないといつでも非自明解をもってしまって意味がない.
	if (n < L * (D + 1) - 1) return false;

	// 行列方程式 A x = 0 を解いて一般解の基底 xs を求める.
	Matrix<mint> A(n - L + 1, L * D);
	repi(n0, 0, n - L) {
		rep(i, L) rep(j, D) {
			A[n0][i * D + j] = mint(n0 + i).pow(j) * a[n0 + i];
		}
	}
	vvm xs;
	gauss_jordan_elimination(A, vm(n - L + 1), &xs);

	// 自明解 x = 0 しか存在しない場合は失敗.
	if (xs.empty()) return false;

	a.resize(N + 1);

	// 得られた非自明解 xs.back() から漸化式を復元し,それに基づき a[0..n) を延長する.
	auto& x = xs.back();
	repi(n0, n - L + 1, N - L + 1) {
		mint num = 0;
		rep(i, L - 1) {
			mint pow_n0i = 1;
			rep(j, D) {
				num += x[i * D + j] * pow_n0i * a[n0 + i];
				pow_n0i *= n0 + i;
			}
		}

		mint dnm = 0;
		mint pow_n0L = 1;
		rep(j, D) {
			dnm += x[(L - 1) * D + j] * pow_n0L;
			pow_n0L *= n0 + L - 1;
		}

		// num + dnm * a[n0 + L - 1] = 0
		a[n0 + L - 1] = -num / dnm;
	}

	if (coef) *coef = move(x);

	return true;
}


void WA() {
	int n, m;
	cin >> n >> m;

	int n0 = n;
	chmin(n, 10000);

	Factorial_mint fm(n + 10);

	vm a(n + 1); mint pow_m1 = 1;
	repi(i, 0, n) {
		a[i] = fm.fact_inv(i) * pow_m1;
		pow_m1 *= m + 1;
	}
//	dump(a);

	MFPS f(0, n + 1), g(0, n + 1);
	repi(i, 0, n) f[i] = g[i] = fm.fact_inv(i);
	f[0] = 0;
	f /= g;
	f.resize(n + 1);
//	dump(f);

	vm c = coefficients_of_power(a, f.c, n);
	repi(i, 0, n) c[i] *= fm.fact(n);
//	dump(c);

	n = n0;

	bool ok = p_recursive(n, c, 20, 20);
	if (!ok) EXIT("FAIL");

	c.push_back(0);
	if (m + 2 < sz(c)) c[m + 2] = 0;
//	dump(c);

	mint res = 0;
	repi(i, 0, min(m + 1, n)) {
		res += (c[i] - c[i + 1]) * i * i;
	}
//	res *= fm.fact(n);

	EXIT(res);
}


// n > m のときまずい
void WA2() {
	int n, m;
	cin >> n >> m;

//	dump(TLE(n, m)); dump("-------");

	int L = 1000;

	vm a(L);
	repi(i, 1, L) {
		a[i - 1] = TLE(i, m);
	}
	dump(a);

	bool ok = p_recursive(n, a, 10, 10);
	dump(ok);
	Assert(ok);

	EXIT(a[n - 1]);
}


mint solve_sub(int n, int m) {
	vm a(n + 2); mint pow_m1 = 1;
	repi(i, 0, n + 1) {
		a[i] = fm.fact_inv(i) * pow_m1;
		pow_m1 *= m + 1;
	}
//	dump(a);

	MFPS f(0, n + 2), g(0, n + 2);
	repi(i, 0, n + 1) f[i] = g[i] = fm.fact_inv(i);
	f[0] = 0;
	f /= g;
	f.resize(n + 2);
//	dump(f);

	vm c = coefficients_of_power(a, f.c, n);
//	repi(i, 0, n) c[i] *= fm.fact(n);
//	dump(c);

	c.push_back(0);
//	if (m + 2 < sz(c)) c[m + 2] = 0; // あえて抜く
//	dump(c);

	mint res = 0;
	repi(i, 0, min(m + 1, n)) {
		res += (c[i] - c[i + 1]) * i * i;
	}
	res *= fm.fact(n);

	return res;
}


//【対数関数】O(n log n)
/*
* log f(z) mod z^d を返す.
*
* 制約 : [z^0]f(z) = 1,fm は d! まで計算可能
*/
MFPS log_fps(const MFPS& f, int d, const Factorial_mint& fm) {
	// 参考 : https://qiita.com/hotman78/items/f0e6d2265badd84d429a
	// verify : https://judge.yosupo.jp/problem/log_of_formal_power_series

	//【方法】
	// g(z) = log f(z) とおく.両辺を z で微分して
	//		g'(z) = f'(z) / f(z)
	// を得るので,
	//		g(z) = ∫ f'(z) / f(z) dz
	// として計算すればよい.

	int n = sz(f);

	MFPS g(0, max(n - 1, 1));
	repi(i, 1, n - 1) g[i - 1] = f[i] * i;			// f'(z)
	g *= f.inv(d - 1);								// f'(z) / f(z)
	g.resize(d);
	repir(i, d - 1, 1) g[i] = g[i - 1] * fm.inv(i);	// ∫ f'(z) / f(z) dz
	g[0] = 0;

	return g;
}


//【指数関数】O(n log n)
/*
* exp f(z) mod z^d を返す.
*
* 制約 : [z^0]f(z) = 0,fm は d! まで計算可能
*
* 利用:【対数関数】
*/
MFPS exp_fps(const MFPS& f, int d, const Factorial_mint& fm) {
	// 参考 : https://qiita.com/hotman78/items/f0e6d2265badd84d429a
	// verify : https://judge.yosupo.jp/problem/exp_of_formal_power_series

	//【方法】
	// g(z) = exp f(z) とおき,方程式
	//		log g(z) = f(z)
	// に対してニュートン法を用いる.
	// 
	// f(0) = 0 なので,mod z^1 では
	//		log(1) ≡ f(z) mod z^1
	// が成り立つ.
	//
	// mod z^k で
	//		log h(z) ≡ f(z) mod z^k
	// が成り立っていると仮定すると,ニュートン法より
	//		g = h - (log h - f) / (log h)'
	//   ⇔ g = h (f + 1 - log h)
	// と置くと
	//		log g(z) ≡ f(z) mod z^(2 k)
	// が成り立つ.
	//
	// これを繰り返せば所望の g が求まる.

	// ニュートン法で log g = f なる g を見つける.
	MFPS g(1);
	for (int k = 1; k < d; k <<= 1) {
		int len = max(min(2 * k, d), 1);
		auto tmp = log_fps(g, len, fm);							// log h
		rep(i, len) tmp[i] = (i < sz(f) ? f[i] : 0) - tmp[i];	// f - log h
		tmp[0] += 1;											// f + 1 - log h
		g *= tmp;												// h (f + 1 - log h)
		g.resize(len);
	}

	return g;
}


//【累乗】O(n log n)
/*
* f(z)^k mod z^d を返す.(0^0 = 1 とする)
*
* 制約 : k ≧ 0,fm は d! まで計算可能
*
* 利用:【指数関数】,【対数関数】
*/
MFPS pow_fps(const MFPS& f, ll k, int d, const Factorial_mint& fm) {
	// 参考 : https://qiita.com/hotman78/items/f0e6d2265badd84d429a
	// verify : https://judge.yosupo.jp/problem/pow_of_formal_power_series

	int n = sz(f);

	// k = 0 なら f^k = 1 である.
	if (k == 0) return MFPS(1, d);

	// i0 : 最低次の項の次数
	int i0 = 0;
	while (i0 < n && f[i0] == 0) i0++;

	// f = 0 なら f^k = 0 である.
	if (i0 == n) return MFPS(0, d);

	// 最低次の項の係数を記録する.
	mint c0 = f[i0];

	// 定数項が 1 になるようシフトかつ定数除算した多項式を得る.
	MFPS fs = (f << i0) / c0;

	// 最終的に k * i0 次以上の項しか残らないことに注意し,0 になるケースを処理する.
	if (i0 >= (d + k - 1) / k) return MFPS(0, d);
	int ds = (int)(d - k * i0);

	// f^k = exp(k log f(x)) を用いて f^k を計算する.
	MFPS gs = exp_fps(mint(k) * log_fps(fs, ds, fm), ds, fm);

	// シフトと定数除算した分を元に戻す.
	MFPS g = (gs * c0.pow(k)) >> (int)(k * i0);

	return g;
}


int main() {
	input_from_file("input.txt");
//	output_to_file("output.txt");

	int n, m;
	cin >> n >> m;

//	dump(TLE(n, m)); dump("-------");
//	dump(solve_sub(n, m)); dump("-------");

	int L = 20;	
	
	vm a(L);
	repi(i, 1, L) {
		a[i - 1] = solve_sub(i, m);
	}
//	dump(a);

	bool ok = p_recursive(n, a, 4, 3);
	dump(ok);
	Assert(ok);

	mint res = a[n - 1];
//	dump(res);

	if (m < n - 1) {		
		MFPS a(0, n + 2); mint pow_m1 = 1;
		repi(i, 0, n + 1) {
			a[i] = fm.fact_inv(i) * pow_m1;
			pow_m1 *= m + 1;
		}

		MFPS f(0, n + 2), g(0, n + 2);
		repi(i, 0, n + 1) f[i] = g[i] = fm.fact_inv(i);
		f[0] = 0;
		f /= g;
		f.resize(n + 2);

		f = pow_fps(f, m + 2, n + 1, fm);
		f *= a;

		res += f[n] * fm.fact(n) * (m + 1) * (m + 1);
	}

	EXIT(res);
}
0