// #define _GLIBCXX_DEBUG // #pragma GCC optimize("O2,unroll-loops") #include using namespace std; #define rep(i, n) for (int i = 0; i < int(n); i++) #define per(i, n) for (int i = (n)-1; 0 <= i; i--) #define rep2(i, l, r) for (int i = (l); i < int(r); i++) #define per2(i, l, r) for (int i = (r)-1; int(l) <= i; i--) #define each(e, v) for (auto &e : v) #define MM << " " << #define pb push_back #define eb emplace_back #define all(x) begin(x), end(x) #define rall(x) rbegin(x), rend(x) #define sz(x) (int)x.size() template void print(const vector &v, T x = 0) { int n = v.size(); for (int i = 0; i < n; i++) cout << v[i] + x << (i == n - 1 ? '\n' : ' '); if (v.empty()) cout << '\n'; } using ll = long long; using pii = pair; using pll = pair; template bool chmax(T &x, const T &y) { return (x < y) ? (x = y, true) : false; } template bool chmin(T &x, const T &y) { return (x > y) ? (x = y, true) : false; } template using minheap = std::priority_queue, std::greater>; template using maxheap = std::priority_queue; template int lb(const vector &v, T x) { return lower_bound(begin(v), end(v), x) - begin(v); } template int ub(const vector &v, T x) { return upper_bound(begin(v), end(v), x) - begin(v); } template void rearrange(vector &v) { sort(begin(v), end(v)); v.erase(unique(begin(v), end(v)), end(v)); } // __int128_t gcd(__int128_t a, __int128_t b) { // if (a == 0) // return b; // if (b == 0) // return a; // __int128_t cnt = a % b; // while (cnt != 0) { // a = b; // b = cnt; // cnt = a % b; // } // return b; // } struct Union_Find_Tree { vector data; const int n; int cnt; Union_Find_Tree(int n) : data(n, -1), n(n), cnt(n) {} int root(int x) { if (data[x] < 0) return x; return data[x] = root(data[x]); } int operator[](int i) { return root(i); } bool unite(int x, int y) { x = root(x), y = root(y); if (x == y) return false; // if (data[x] > data[y]) swap(x, y); data[x] += data[y], data[y] = x; cnt--; return true; } int size(int x) { return -data[root(x)]; } int count() { return cnt; }; bool same(int x, int y) { return root(x) == root(y); } void clear() { cnt = n; fill(begin(data), end(data), -1); } }; // template // struct Mod_Int { // int x; // Mod_Int() : x(0) {} // Mod_Int(long long y) : x(y >= 0 ? y % mod : (mod - (-y) % mod) % mod) {} // static int get_mod() { return mod; } // Mod_Int &operator+=(const Mod_Int &p) { // if ((x += p.x) >= mod) x -= mod; // return *this; // } // Mod_Int &operator-=(const Mod_Int &p) { // if ((x += mod - p.x) >= mod) x -= mod; // return *this; // } // Mod_Int &operator*=(const Mod_Int &p) { // x = (int)(1LL * x * p.x % mod); // return *this; // } // Mod_Int &operator/=(const Mod_Int &p) { // *this *= p.inverse(); // return *this; // } // Mod_Int &operator++() { return *this += Mod_Int(1); } // Mod_Int operator++(int) { // Mod_Int tmp = *this; // ++*this; // return tmp; // } // Mod_Int &operator--() { return *this -= Mod_Int(1); } // Mod_Int operator--(int) { // Mod_Int tmp = *this; // --*this; // return tmp; // } // Mod_Int operator-() const { return Mod_Int(-x); } // Mod_Int operator+(const Mod_Int &p) const { return Mod_Int(*this) += p; } // Mod_Int operator-(const Mod_Int &p) const { return Mod_Int(*this) -= p; } // Mod_Int operator*(const Mod_Int &p) const { return Mod_Int(*this) *= p; } // Mod_Int operator/(const Mod_Int &p) const { return Mod_Int(*this) /= p; } // bool operator==(const Mod_Int &p) const { return x == p.x; } // bool operator!=(const Mod_Int &p) const { return x != p.x; } // Mod_Int inverse() const { // assert(*this != Mod_Int(0)); // return pow(mod - 2); // } // Mod_Int pow(long long k) const { // Mod_Int now = *this, ret = 1; // for (; k > 0; k >>= 1, now *= now) { // if (k & 1) ret *= now; // } // return ret; // } // friend ostream &operator<<(ostream &os, const Mod_Int &p) { // return os << p.x; // } // friend istream &operator>>(istream &is, Mod_Int &p) { // long long a; // is >> a; // p = Mod_Int(a); // return is; // } // }; ll mpow(ll x, ll n, ll mod) { ll ans = 1; x %= mod; while (n != 0) { if (n & 1) ans = ans * x % mod; x = x * x % mod; n = n >> 1; } ans %= mod; return ans; } template T modinv(T a, const T &m) { T b = m, u = 1, v = 0; while (b > 0) { T t = a / b; swap(a -= t * b, b); swap(u -= t * v, v); } return u >= 0 ? u % m : (m - (-u) % m) % m; } ll divide_int(ll a, ll b) { if (b < 0) a = -a, b = -b; return (a >= 0 ? a / b : (a - b + 1) / b); } // const int MOD = 1000000007; const int MOD = 998244353; // ----- library ------- // 階段状のグリッドにおける最短経路数え上げ // 計算量 O((n+m)log(n+m)log n) (m = max h_i) // 概要 // 階段状のマス目がある。下の辺の各マスに値が書き込まれている。これを初期値として経路数え上げの dp をしたとき、右の辺の各マスには何が書き込まれるか? // この問題は分割統治を用いることで解くことができる。 // 参考:https://twitter.com/noshi91/status/1640315787528519680 // verified with // https://codeforces.com/gym/102220 using namespace std; // 組み合わせ // 計算量 前計算:O(n)、二項係数:O(1)、逆数:O(1)、第 2 種スターリング数:O(k log(n))、ベル数:O(min(n,k)log(n)) // 第 2 種スターリング数:n 個の区別できる玉を、k 個の区別しない箱に、各箱に 1 個以上玉が入るように入れる場合の数 // ベル数:n 個の区別できる玉を、k 個の区別しない箱に入れる場合の数 // 概要 // 前計算:i = 0,1,...,n について i! とその逆元を求める。 // 二項係数:nCk = n!/((n-k)!*k!), nPk = n!/(n-k)!, nHk = (n+k-1)Ck // 逆数:1/k = (k-1)!/k! // 第 2 種スターリング数:包除原理 // ベル数:第 2 種スターリング数の和 // verified with // https://judge.yosupo.jp/problem/binomial_coefficient_prime_mod // http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_5_B&lang=ja // http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_5_D&lang=ja // http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_5_E&lang=ja // http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_5_G&lang=ja // http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_5_I&lang=ja using namespace std; template struct Combination { static vector _fac, _ifac; Combination() {} static void init(int n) { _fac.resize(n + 1), _ifac.resize(n + 1); _fac[0] = 1; for (int i = 1; i <= n; i++) _fac[i] = _fac[i - 1] * i; _ifac[n] = _fac[n].inverse(); for (int i = n; i >= 1; i--) _ifac[i - 1] = _ifac[i] * i; } static T fac(int k) { return _fac[k]; } static T ifac(int k) { return _ifac[k]; } static T inv(int k) { return fac(k - 1) * ifac(k); } static T P(int n, int k) { if (k < 0 || n < k) return 0; return fac(n) * ifac(n - k); } static T C(int n, int k) { if (k < 0 || n < k) return 0; return fac(n) * ifac(n - k) * ifac(k); } // n 個の区別できる箱に、k 個の区別できない玉を入れる場合の数 static T H(int n, int k) { if (n < 0 || k < 0) return 0; return k == 0 ? 1 : C(n + k - 1, k); } // n 個の区別できる玉を、k 個の区別しない箱に、各箱に 1 個以上玉が入るように入れる場合の数 static T second_stirling_number(int n, int k) { T ret = 0; for (int i = 0; i <= k; i++) { T tmp = C(k, i) * T(i).pow(n); ret += ((k - i) & 1) ? -tmp : tmp; } return ret * ifac(k); } // n 個の区別できる玉を、k 個の区別しない箱に入れる場合の数 static T bell_number(int n, int k) { if (n == 0) return 1; k = min(k, n); vector pref(k + 1); pref[0] = 1; for (int i = 1; i <= k; i++) { if (i & 1) { pref[i] = pref[i - 1] - ifac(i); } else { pref[i] = pref[i - 1] + ifac(i); } } T ret = 0; for (int i = 1; i <= k; i++) ret += T(i).pow(n) * ifac(i) * pref[k - i]; return ret; } }; template vector Combination::_fac = vector(); template vector Combination::_ifac = vector(); // 数論変換 (高速剰余変換) (mod は x*(2^y)+1 で表されるもの (n+m<=2^y)) // 計算量 O((n+m)log(n+m)) // 概要 // mod を pとして、p = x*2^y+1 と表したとき、2^y >= n+m-1 が成立すれば FFT が行える。 // r を P の原子根とすれば、体 Z/pZ での 1 の 2^k 乗根は r^(x*2^(y-k)) として得られる。 // 代表的な (p,r) の組として (998244353,3) がある。 // verified with // https://atcoder.jp/contests/practice2/tasks/practice2_f // https://judge.yosupo.jp/problem/convolution_mod using namespace std; // mod-int 構造体 (mod は素数) // 計算量 加減乗算:O(1)、除算:O(log(mod))、k 乗:O(log(k)) // 累乗:ダブリング // 逆元:a と m が互いに素なとき、フェルマーの小定理より a^(m-1) ≡ 1(mod m) なので、a の逆元は a^(m-2) // verified with // http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=DPL_5_A&lang=ja using namespace std; template struct Mod_Int { int x; Mod_Int() : x(0) {} Mod_Int(long long y) : x(y >= 0 ? y % mod : (mod - (-y) % mod) % mod) {} static int get_mod() { return mod; } Mod_Int &operator+=(const Mod_Int &p) { if ((x += p.x) >= mod) x -= mod; return *this; } Mod_Int &operator-=(const Mod_Int &p) { if ((x += mod - p.x) >= mod) x -= mod; return *this; } Mod_Int &operator*=(const Mod_Int &p) { x = (int)(1LL * x * p.x % mod); return *this; } Mod_Int &operator/=(const Mod_Int &p) { *this *= p.inverse(); return *this; } Mod_Int &operator++() { return *this += Mod_Int(1); } Mod_Int operator++(int) { Mod_Int tmp = *this; ++*this; return tmp; } Mod_Int &operator--() { return *this -= Mod_Int(1); } Mod_Int operator--(int) { Mod_Int tmp = *this; --*this; return tmp; } Mod_Int operator-() const { return Mod_Int(-x); } Mod_Int operator+(const Mod_Int &p) const { return Mod_Int(*this) += p; } Mod_Int operator-(const Mod_Int &p) const { return Mod_Int(*this) -= p; } Mod_Int operator*(const Mod_Int &p) const { return Mod_Int(*this) *= p; } Mod_Int operator/(const Mod_Int &p) const { return Mod_Int(*this) /= p; } bool operator==(const Mod_Int &p) const { return x == p.x; } bool operator!=(const Mod_Int &p) const { return x != p.x; } Mod_Int inverse() const { assert(*this != Mod_Int(0)); return pow(mod - 2); } Mod_Int pow(long long k) const { Mod_Int now = *this, ret = 1; for (; k > 0; k >>= 1, now *= now) { if (k & 1) ret *= now; } return ret; } friend ostream &operator<<(ostream &os, const Mod_Int &p) { return os << p.x; } friend istream &operator>>(istream &is, Mod_Int &p) { long long a; is >> a; p = Mod_Int(a); return is; } }; template struct Number_Theoretic_Transform { static int max_base; static T root; static vector r, ir; Number_Theoretic_Transform() {} static void init() { if (!r.empty()) return; int mod = T::get_mod(); int tmp = mod - 1; root = 2; while (root.pow(tmp >> 1) == 1) root++; max_base = 0; while (tmp % 2 == 0) tmp >>= 1, max_base++; r.resize(max_base), ir.resize(max_base); for (int i = 0; i < max_base; i++) { r[i] = -root.pow((mod - 1) >> (i + 2)); // r[i] := 1 の 2^(i+2) 乗根 ir[i] = r[i].inverse(); // ir[i] := 1/r[i] } } static void ntt(vector &a) { init(); int n = a.size(); assert((n & (n - 1)) == 0); assert(n <= (1 << max_base)); for (int k = n; k >>= 1;) { T w = 1; for (int s = 0, t = 0; s < n; s += 2 * k) { for (int i = s, j = s + k; i < s + k; i++, j++) { T x = a[i], y = w * a[j]; a[i] = x + y, a[j] = x - y; } w *= r[__builtin_ctz(++t)]; } } } static void intt(vector &a) { init(); int n = a.size(); assert((n & (n - 1)) == 0); assert(n <= (1 << max_base)); for (int k = 1; k < n; k <<= 1) { T w = 1; for (int s = 0, t = 0; s < n; s += 2 * k) { for (int i = s, j = s + k; i < s + k; i++, j++) { T x = a[i], y = a[j]; a[i] = x + y, a[j] = w * (x - y); } w *= ir[__builtin_ctz(++t)]; } } T inv = T(n).inverse(); for (auto &e : a) e *= inv; } static vector convolve(vector a, vector b) { if (a.empty() || b.empty()) return {}; if (min(a.size(), b.size()) < 40) { int n = a.size(), m = b.size(); vector c(n + m - 1, 0); for (int i = 0; i < n; i++) { for (int j = 0; j < m; j++) c[i + j] += a[i] * b[j]; } return c; } int k = (int)a.size() + (int)b.size() - 1, n = 1; while (n < k) n <<= 1; a.resize(n), b.resize(n); ntt(a), ntt(b); for (int i = 0; i < n; i++) a[i] *= b[i]; intt(a), a.resize(k); return a; } }; template int Number_Theoretic_Transform::max_base = 0; template T Number_Theoretic_Transform::root = T(); template vector Number_Theoretic_Transform::r = vector(); template vector Number_Theoretic_Transform::ir = vector(); // 左側から i 列目は h_i 個のマスからなる階段状のグリッドを考える。また、i 列目の一番下には a_i が書かれている。 // この状態からグリッド上で右または上のみに移動する経路数え上げ dp を行ったときに、一番右の列に書かれる数字を (下から順に) 求める。 template vector step_grid_path_count(vector h, const vector &a) { using NTT_ = Number_Theoretic_Transform; using comb_ = Combination; int n = h.size(); assert((int)a.size() == n); if (n == 0) return {}; if (n == 1) return vector(h[0], a[0]); for (int i = n - 2; i >= 0; i--) h[i] = min(h[i], h[i + 1]); assert(h[0] >= 0); if (h[0] == 0) { int l = 0; while (l < n && h[l] == 0) l++; return step_grid_path_count(vector(begin(h) + l, end(h)), vector(begin(a) + l, end(a))); } int m = n / 2; auto b = step_grid_path_count(vector(begin(h), begin(h) + m), vector(begin(a), begin(a) + m)); int x = n - m, y = h[m - 1], z = 1; while (z < x + y - 1) z <<= 1; vector c(x, 0), d(y, 0); vector gg(z, 0); for (int i = 0; i < x + y - 1; i++) gg[i] = comb_::fac(i); NTT_::ntt(gg); // a->c { vector f(x, 0), g(x, 0); for (int i = 0; i < x; i++) f[i] = a[m + i]; for (int i = 0; i < x; i++) g[i] = comb_::C(y - 1 + i, i); f = NTT_::convolve(f, g); for (int i = 0; i < x; i++) c[i] += f[i]; } // b->d { vector f(y, 0), g(y, 0); for (int i = 0; i < y; i++) f[i] = b[i]; for (int i = 0; i < y; i++) g[i] = comb_::C(x - 1 + i, i); f = NTT_::convolve(f, g); for (int i = 0; i < y; i++) d[i] += f[i]; } // a->d { vector f(z, 0), g(z, 0); for (int i = 0; i < x; i++) f[i] = a[m + i] * comb_::ifac(x - 1 - i); NTT_::ntt(f); for (int i = 0; i < z; i++) f[i] *= gg[i]; NTT_::intt(f); for (int i = 0; i < y; i++) d[i] += f[x - 1 + i] * comb_::ifac(i); } // b->c { vector f(z, 0), g(z, 0); for (int i = 0; i < y; i++) f[i] = b[i] * comb_::ifac(y - 1 - i); NTT_::ntt(f); for (int i = 0; i < z; i++) f[i] *= gg[i]; NTT_::intt(f); for (int i = 0; i < x; i++) c[i] += f[y - 1 + i] * comb_::ifac(i); } vector ret(h[n - 1]); for (int i = 0; i < y; i++) ret[i] = d[i]; vector h_up(x); for (int i = 0; i < x; i++) h_up[i] = h[m + i] - y; auto d_up = step_grid_path_count(h_up, c); for (int i = 0; i < (int)d_up.size(); i++) ret[y + i] = d_up[i]; return ret; }; using mint = Mod_Int; // ----- library ------- int main() { ios::sync_with_stdio(false); std::cin.tie(nullptr); cout << fixed << setprecision(15); Combination::init(1e6); int n; cin >> n; vector a(n); rep(i, n) cin >> a[i]; vector h(n); iota(all(h), 1); cout << step_grid_path_count(h, a)[n - 1] << endl; }