#1148158 (C++23) No.696 square1001 and Permutation 5

提出ソース
結果

問題	No.696 square1001 and Permutation 5
コンテスト
ユーザー	miscalc
提出日時	2026-02-13 14:56:23
言語	C++23 (gcc 15.2.0 + boost 1.90.0) コンパイル: `g++-15 -O2 -lm -std=c++23 -Wuninitialized -DONLINE_JUDGE -o a.out _filename_` 実行: `./a.out`
結果	TLE
実行時間	-
コード長	33,670 bytes
記録記録タグの例: 初AC ショートコード純ショートコード純主流ショートコード最速実行時間
コンパイル時間	5,584 ms
コンパイル使用メモリ	379,772 KB
実行使用メモリ	22,244 KB
最終ジャッジ日時	2026-02-13 14:56:51
合計ジャッジ時間	28,036 ms
ジャッジサーバーID （参考情報）	judge3 / judge4
このコードへのチャレンジ
（要ログイン）
ファイルパターン	結果
sample	-- * 2
other	TLE * 1 -- * 11
権限があれば一括ダウンロードができます
ソースコード

raw source code
#define SINGLE_TESTCASE
#define FAST_CIO
#define INF 4'000'000'000'000'000'037LL
#define EPS 1e-11
#include <bits/stdc++.h>
using namespace std;
namespace {
using ll = long long;
using uint = unsigned int;
using ull = unsigned long long;
using pll = pair<ll, ll>;
#define vc vector
template <class T>
using vvc = vc<vc<T>>;
using vpll = vc<pll>;
using vstr = vc<string>;
#ifdef __SIZEOF_INT128__
using i128 = __int128_t;
using u128 = __uint128_t;
i128 stoi128(const string &s)
{
  i128 res = 0;
  if (s.front() == '-')
  {
    for (int i = 1; i < (int)s.size(); i++)
      res = 10 * res + s[i] - '0';
    res = -res;
  }
  else
  {
    for (auto &&c : s)
      res = 10 * res + c - '0';
  }
  return res;
}
string i128tos(i128 x)
{
  if (x == 0) return "0";
  string sign = "", res = "";
  if (x < 0)
    x = -x, sign = "-";
  while (x > 0)
  {
    res += '0' + x % 10;
    x /= 10;
  }
  reverse(res.begin(), res.end());
  return sign + res;
}
istream &operator>>(istream &is, i128 &a)
{
  string s;
  is >> s;
  a = stoi128(s);
  return is;
}
ostream &operator<<(ostream &os, const i128 &a)
{
  os << i128tos(a);
  return os;
}
#endif
#define cauto const auto
#define overload4(_1, _2, _3, _4, name, ...) name
#define rep1(i, n) for (ll i = 0, nnnnn = ll(n); i < nnnnn; i++)
#define rep2(i, l, r) for (ll i = ll(l), rrrrr = ll(r); i < rrrrr; i++)
#define rep3(i, l, r, d) for (ll i = ll(l), rrrrr = ll(r), ddddd = ll(d); ddddd > 0 ? i < rrrrr : i > rrrrr; i += d)
#define rep(...) overload4(__VA_ARGS__, rep3, rep2, rep1)(__VA_ARGS__)
#define repi1(i, n) for (int i = 0, nnnnn = int(n); i < nnnnn; i++)
#define repi2(i, l, r) for (int i = int(l), rrrrr = int(r); i < rrrrr; i++)
#define repi3(i, l, r, d) for (int i = int(l), rrrrr = int(r), ddddd = int(d); ddddd > 0 ? i < rrrrr : i > rrrrr; i += d)
#define repi(...) overload4(__VA_ARGS__, repi3, repi2, repi1)(__VA_ARGS__)
#define fe(...) for (auto __VA_ARGS__)
#define fec(...) for (cauto &__VA_ARGS__)
#define fem(...) for (auto &__VA_ARGS__)
template <class T, class U>
inline bool chmin(T &a, U b) { return a > b ? a = b, true : false; }
template <class T = ll, class U, class V>
inline constexpr T divfloor(U a, V b) { return T(a) / T(b) - (T(a) % T(b) && (T(a) ^ T(b)) < 0); }
template <class T = ll, class U, class V>
inline constexpr T divceil(U a, V b) { return T(a) / T(b) + (T(a) % T(b) && (T(a) ^ T(b)) >= 0); }
template <class T = ll, class U, class V>
inline constexpr T safemod(U a, V b) { return T(a) - T(b) * divfloor<T>(a, b); }
template <class T = ll, class U, class V>
constexpr T ipow(U a, V b)
{
  assert(b >= 0);
  if (b == 0)
    return 1;
  if (a == 0 || a == 1)
    return a;
  if (a < 0 && a == -1)
    return b & 1 ? -1 : 1;
  T res = 1, tmp = a;
  while (true)
  {
    if (b & 1)
      res *= tmp;
    b >>= 1;
    if (b == 0)
      break;
    tmp *= tmp;
  }
  return res;
}
template <class T = ll, class A, class B, class M>
T mul_limited(A a, B b, M m)
{
  assert(a >= 0 && b >= 0 && m >= 0);
  if (b == 0)
    return 0;
  return T(a) > T(m) / T(b) ? T(m) : T(a) * T(b);
}
template <class T = ll, class A, class B>
T mul_limited(A a, B b) { return mul_limited<T>(a, b, INF); }
template <class T = ll, class A, class B, class M>
T pow_limited(A a, B b, M m)
{
  assert(a >= 0 && b >= 0 && m >= 0);
  if (a <= 1 || b == 0)
    return min(ipow<T>(a, b), T(m));
  T res = 1, tmp = a;
  while (true)
  {
    if (b & 1)
    {
      if (res > T(m) / tmp)
        return m;
      res *= tmp;
    }
    b >>= 1;
    if (b == 0)
      break;
    if (tmp > T(m) / tmp)
      return m;
    tmp *= tmp;
  }
  return res;
}
template <class T = ll, class A, class B>
T pow_limited(A a, B b) { return pow_limited<T>(a, b, INF); }
#define ALL(a) (a).begin(), (a).end()
template <class T = ll, class V>
inline T SZ(const V &x) { return x.size(); }
#define eb emplace_back
#define LMD(x, fx) ([&](auto x) { return fx; })
#define GEN_VEC(n, i, fi) (gen_vec(n, LMD(i, fi)))
template <class T, size_t d, size_t i = 0, class V>
auto dvec(const V (&sz)[d], const T &init)
{
  if constexpr (i < d)
    return vc(sz[i], dvec<T, d, i + 1>(sz, init));
  else
    return init;
}
template <class T, class U>
vc<T> permuted(const vc<T> &a, const vc<U> &p)
{
  const int n = p.size();
  vc<T> res(n);
  repi(i, n)
  {
    assert(0 <= p[i] && p[i] < U(a.size()));
    res[i] = a[p[i]];
  }
  return res;
}
template <class T, class U, class... Ts>
vc<T> permuted(const vc<T> &p, const vc<U> &q, const vc<Ts> &...rs)
{
  return permuted(permuted(p, q), rs...);
}
#if __cplusplus < 202002L
#else
#endif
template <class V>
void unique(V &v) { v.erase(std::unique(ALL(v)), v.end()); }
template <class V, class U>
void rotate(V &v, U k)
{ 
  const U n = v.size();
  k = (k % n + n) % n;
  std::rotate(v.begin(), v.begin() + k, v.end());
}
template <class T>
vvc<T> top(const vvc<T> &a)
{
  if (a.empty())
    return {};
  const int n = a.size(), m = a[0].size();
  vvc<T> b(m, vc<T>(n));
  repi(i, n)
  {
    assert(SZ<int>(a[i]) == m);
    repi(j, m) b[j][i] = a[i][j];
  }
  return b;
}
vstr top(const vstr &a)
{
  vvc<char> a_(a.size());
  repi(i, SZ<int>(a)) a_[i] = {ALL(a[i])};
  vvc<char> b_ = top(a_);
  vstr b(b_.size());
  repi(i, SZ<int>(b)) b[i] = {ALL(b_[i])};
  return b;
}
const vpll DRULgrid = {{1, 0}, {0, 1}, {-1, 0}, {0, -1}};
const vpll DRULplane = {{0, -1}, {1, 0}, {0, 1}, {-1, 0}};
template <class T>
struct is_random_access_iterator
{
  static constexpr bool value = is_same_v<
    typename iterator_traits<T>::iterator_category,
    random_access_iterator_tag
  >;
};
template <class T>
constexpr bool is_random_access_iterator_v = is_random_access_iterator<T>::value;
#if __cplusplus < 202002L
namespace internal
{
};
#define DEFAULT_COMP less<>
#else
#define DEFAULT_COMP ranges::less
#endif
#if __cplusplus < 202002L
#else
inline constexpr ll bit_width(ll x) { return std::bit_width((ull)x); }
inline constexpr ll bit_floor(ll x) { return std::bit_floor((ull)x); }
inline constexpr ll bit_ceil(ll x) { return std::bit_ceil((ull)x); }
inline constexpr ll countr_zero(ll x) { assert(x != 0); return std::countr_zero((ull)x); }
inline constexpr ll popcount(ll x) { return std::popcount((ull)x); }
inline constexpr bool has_single_bit(ll x) { return std::has_single_bit((ull)x); }
#endif
#define dump(...)
#define local(...)
#define oj(...) __VA_ARGS__
#define local_oj(a, b) (b)
template <class T, class U>
istream &operator>>(istream &is, pair<T, U> &p)
{
  is >> p.first >> p.second;
  return is;
}
template <class... Ts>
istream &operator>>(istream &is, tuple<Ts...> &t)
{
  apply([&](auto &...a)
        { (is >> ... >> a); }, t);
  return is;
}
template <class T, size_t n>
istream &operator>>(istream &is, array<T, n> &a)
{
  for (size_t i = 0; i < n; i++)
    is >> a[i];
  return is;
}
template <class T>
istream &operator>>(istream &is, vc<T> &a)
{
  const size_t n = a.size();
  for (size_t i = 0; i < n; i++)
    is >> a[i];
  return is;
}
namespace internal
{
template <class... Ts>
void CIN(Ts &...a) { (cin >> ... >> a); }
template <class... Ts>
void READnodump(Ts &...a) { CIN(a...); }
template <class T>
void READVECnodump(int n, vc<T> &v)
{
  v.resize(n);
  READnodump(v);
}
template <class T, class... Ts>
void READVECnodump(int n, vc<T> &v, vc<Ts> &...vs)
{ READVECnodump(n, v), READVECnodump(n, vs...); }
template <class T>
void READVEC2nodump(int n, int m, vvc<T> &v)
{
  v.assign(n, vc<T>(m));
  READnodump(v);
}
template <class T, class... Ts>
void READVEC2nodump(int n, int m, vvc<T> &v, vvc<Ts> &...vs)
{ READVEC2nodump(n, m, v), READVEC2nodump(n, m, vs...); }
template <class T>
void READJAGnodump(int n, vvc<T> &v)
{
  v.resize(n);
  repi(i, n)
  {
    int k;
    READnodump(k);
    READVECnodump(k, v[i]);
  }
}
template <class T, class... Ts>
void READJAGnodump(int n, vvc<T> &v, vvc<Ts> &...vs)
{ READJAGnodump(n, v), READJAGnodump(n, vs...); }
}; // namespace internal
#define READ(...) internal::READnodump(__VA_ARGS__); dump(__VA_ARGS__)
#define IN(T, ...) T __VA_ARGS__; READ(__VA_ARGS__)
#define CHAR(...) IN(char, __VA_ARGS__)
#define INT(...) IN(int, __VA_ARGS__)
#define LL(...) IN(ll, __VA_ARGS__)
#define STR(...) IN(string, __VA_ARGS__)
#define ARR(T, n, ...) array<T, n> __VA_ARGS__; READ(__VA_ARGS__)
#define READVEC(...) internal::READVECnodump(__VA_ARGS__); dump(__VA_ARGS__)
#define READVEC2(...) internal::READVEC2nodump(__VA_ARGS__); dump(__VA_ARGS__)
#define VEC(T, n, ...) vc<T> __VA_ARGS__; READVEC(n, __VA_ARGS__)
#define VEC2(T, n, m, ...) vvc<T> __VA_ARGS__; READVEC2(n, m, __VA_ARGS__)
#define READJAG(...) internal::READJAGnodump(__VA_ARGS__); dump(__VA_ARGS__)
#define JAG(T, n, ...) vvc<T> __VA_ARGS__; READJAG(n, __VA_ARGS__)
#define ENDL '\n'
template <class T, class U>
ostream &operator<<(ostream &os, const pair<T, U> &p)
{
  os << p.first << ' ' << p.second;
  return os;
}
namespace internal
{
template <size_t N = 0, typename T>
void cout_tuple(ostream &os, const T &t) {
  if constexpr (N < std::tuple_size<T>::value) {
    if constexpr (N > 0) { os << ' '; }
    const auto x = std::get<N>(t);
    os << x;
    cout_tuple<N + 1>(os, t);
  }
}
}; // namespace internal
template <class... Ts>
ostream &operator<<(ostream &os, const tuple<Ts...> &t)
{
  internal::cout_tuple(os, t);
  return os;
}
template <class T, size_t n>
ostream &operator<<(ostream &os, const array<T, n> &a)
{
  for (size_t i = 0; i < n; i++)
  {
    if (i)
      os << ' ';
    os << a[i];
  }
  return os;
}
template <class T>
ostream &operator<<(ostream &os, const vc<T> &v)
{
  const size_t n = v.size();
  for (size_t i = 0; i < n; i++)
  {
    if (i)
      os << ' ';
    os << v[i];
  }
  return os;
}
namespace internal
{
template <class T>
void COUTP() { cout << ENDL; }
template <class T>
void COUTP(const T &a) { cout << a << ENDL; }
template <class T, class... Ts>
void COUTP(const T &a, const Ts &...b)
{
  cout << a;
  (cout << ... << (cout << ' ', b));
  cout << ENDL;
}
}; // namespace internal
#define WRITE internal::COUTW
#define PRINT internal::COUTP
#define PRINTEXIT(...) do { PRINT(__VA_ARGS__); exit(0); } while (false)
#define PRINTRETURN(...) do { PRINT(__VA_ARGS__); return; } while (false)
#define PRINTVEXIT(...) do { PRINTV(__VA_ARGS__); exit(0); } while (false)
#define PRINTVRETURN(...) do { PRINTV(__VA_ARGS__); return; } while (false)
template <class T, class U, class P>
pair<T, U> operator+=(pair<T, U> &a, const P &b)
{
  a.first += b.first;
  a.second += b.second;
  return a;
}
template <class T, class U, class P>
pair<T, U> operator+(pair<T, U> &a, const P &b) { return a += b; }
template <class T, size_t n, class A>
array<T, n> operator+=(array<T, n> &a, const A &b)
{
  for (size_t i = 0; i < n; i++)
    a[i] += b[i];
  return a;
}
template <class T, size_t n, class A>
array<T, n> operator+(array<T, n> &a, const A &b) { return a += b; }
namespace internal
{
template <size_t... I, class A, class B>
auto tuple_add_impl(A &a, const B &b, const index_sequence<I...>)
{
  ((get<I>(a) += get<I>(b)), ...);
  return a;
}
}; // namespace internal
template <class... Ts, class Tp>
tuple<Ts...> operator+=(tuple<Ts...> &a, const Tp &b)
{ return internal::tuple_add_impl(a, b, make_index_sequence<tuple_size_v<tuple<Ts...>>>{}); }
template <class... Ts, class Tp>
tuple<Ts...> operator+(tuple<Ts...> &a, const Tp &b) { return a += b; }
template <class T, class Add>
void offset(vc<T> &v, const Add &add) { for (auto &vi : v) vi += add; }
template <class T, class Add>
void offset(vvc<T> &v, const Add &add) { for (auto &vi : v) for (auto &vij : vi) vij += add; }
template <class T, const size_t m>
array<vc<T>, m> top(const vc<array<T, m>> &vt)
{
  const size_t n = vt.size();
  array<vc<T>, m> tv;
  tv.fill(vc<T>(n));
  for (size_t i = 0; i < n; i++)
    for (size_t j = 0; j < m; j++)
      tv[j][i] = vt[i][j];
  return tv;
}
template <class T, const size_t m>
vc<array<T, m>> top(const array<vc<T>, m> &tv)
{
  if (tv.empty()) return {};
  const size_t n = tv[0].size();
  vc<array<T, m>> vt(n);
  for (size_t j = 0; j < m; j++)
  {
    assert(tv[j].size() == n);
    for (size_t i = 0; i < n; i++)
      vt[i][j] = tv[j][i];
  }
  return vt;
}
template <class T, class U>
pair<vc<T>, vc<U>> top(const vc<pair<T, U>> &vt)
{
  const size_t n = vt.size();
  pair<vc<T>, vc<U>> tv;
  tv.first.resize(n), tv.second.resize(n);
  for (size_t i = 0; i < n; i++)
    tie(tv.first[i], tv.second[i]) = vt[i];
  return tv;
}
template <class T, class U>
vc<pair<T, U>> top(const pair<vc<T>, vc<U>> &tv)
{
  const size_t n = tv.first.size();
  assert(n == tv.second.size());
  vc<pair<T, U>> vt(n);
  for (size_t i = 0; i < n; i++)
    vt[i] = make_pair(tv.first[i], tv.second[i]);
  return vt;
}
namespace internal
{
template <size_t... I, class V, class Tp>
auto vt_to_tv_impl(V &tv, const Tp &t, index_sequence<I...>, size_t index)
{ ((get<I>(tv)[index] = get<I>(t)), ...); }
template <size_t... I, class Tp>
auto tv_to_vt_impl(const Tp &tv, index_sequence<I...>, size_t index)
{ return make_tuple(get<I>(tv)[index]...); }
};
template <class... Ts>
auto top(const vc<tuple<Ts...>> &vt)
{
  const size_t n = vt.size();
  tuple<vc<Ts>...> tv;
  apply([&](auto &...v)
        { ((v.resize(n)), ...); }, tv);
  for (size_t i = 0; i < n; i++)
    internal::vt_to_tv_impl(tv, vt[i], make_index_sequence<tuple_size_v<decltype(tv)>>{}, i);
  return tv;
}
template <class... Ts>
auto top(const tuple<vc<Ts>...> &tv)
{
  size_t n = get<0>(tv).size();
  apply([&](auto &...v)
        { ((assert(v.size() == n)), ...); }, tv);
  vc<tuple<Ts...>> vt(n);
  for (size_t i = 0; i < n; i++)
    vt[i] = internal::tv_to_vt_impl(tv, index_sequence_for<Ts...>{}, i);
  return vt;
}
mt19937_64 mt;
namespace internal
{
constexpr ll powmod32_constexpr(ll x, ll n, int m)
{
  if (m == 1)
    return 0;
  uint _m = (uint)m;
  ull r = 1;
  ull y = safemod(x, m);
  while (n)
  {
    if (n & 1)
      r = (r * y) % _m;
    y = (y * y) % _m;
    n >>= 1;
  }
  return r;
}
constexpr bool isprime32_constexpr(int n)
{
  if (n <= 1)
    return false;
  if (n == 2 || n == 7 || n == 61)
    return true;
  if (n % 2 == 0)
    return false;
  ll d = n - 1;
  while (d % 2 == 0)
    d /= 2;
  constexpr ll bases[3] = {2, 7, 61};
  for (ll a : bases)
  {
    ll t = d;
    ll y = powmod32_constexpr(a, t, n);
    while (t != n - 1 && y != 1 && y != n - 1)
    {
      y = y * y % n;
      t <<= 1;
    }
    if (y != n - 1 && t % 2 == 0)
      return false;
  }
  return true;
}
template <int n>
constexpr bool isprime32 = isprime32_constexpr(n);
struct barrett32
{
  uint m;
  ull im;
  explicit barrett32(uint m) : m(m), im((ull)(-1) / m + 1) {}
  uint umod() const { return m; }
  uint mul(uint a, uint b) const
  {
    ull z = a;
    z *= b;
    ull x = (ull)((u128(z)*im) >> 64);
    ull y = x * m;
    return (uint)(z - y + (z < y ? m : 0));
  }
};
}
namespace internal
{
#define REF static_cast<mint &>(*this)
#define CREF static_cast<const mint &>(*this)
#define VAL *static_cast<const mint *>(this)
template <class mint>
struct modint_base
{
  mint &operator+=(const mint &rhs)
  {
    mint &self = REF;
    self._v += rhs._v;
    if (self._v >= self.umod())
      self._v -= self.umod();
    return self;
  }
  mint &operator-=(const mint &rhs)
  {
    mint &self = REF;
    self._v -= rhs._v;
    if (self._v >= self.umod())
      self._v += self.umod();
    return self;
  }
  mint &operator/=(const mint &rhs)
  {
    mint &self = REF;
    return self = self * rhs.inv();
  }
  mint &operator++()
  {
    mint &self = REF;
    self._v++;
    if (self._v == self.umod())
      self._v = 0;
    return self;
  }
  mint &operator--()
  {
    mint &self = REF;
    if (self._v == 0)
      self._v = self.umod();
    self._v--;
    return self;
  }
  mint operator++(int)
  {
    mint res = VAL;
    ++REF;
    return res;
  }
  mint operator--(int)
  {
    mint res = VAL;
    --REF;
    return res;
  }
  mint operator+() const { return VAL; }
  mint operator-() const { return mint() - VAL; }
  mint pow(ll n) const
  {
    assert(n >= 0);
    mint x = VAL, r = 1;
    while (n)
    {
      if (n & 1)
        r *= x;
      x *= x;
      n >>= 1;
    }
    return r;
  }
  friend mint operator+(const mint &lhs, const mint &rhs)
  { return mint(lhs) += rhs; }
  friend mint operator-(const mint &lhs, const mint &rhs)
  { return mint(lhs) -= rhs; }
  friend mint operator*(const mint &lhs, const mint &rhs)
  { return mint(lhs) *= rhs; }
  friend mint operator/(const mint &lhs, const mint &rhs)
  { return mint(lhs) /= rhs; }
  friend bool operator==(const mint &lhs, const mint &rhs)
  { return mint(lhs).eq(rhs); }
  friend bool operator!=(const mint &lhs, const mint &rhs)
  { return mint(lhs).neq(rhs); }
private:
  bool eq(const mint &rhs) { return REF._v == rhs._v; }
  bool neq(const mint &rhs) { return REF._v != rhs._v; }
};
}
template <typename T, std::enable_if_t<std::is_base_of_v<internal::modint_base<T>, T>, int> = 0>
istream &operator>>(istream &is, T &x)
{
  ll a;
  is >> a;
  x = a;
  return is;
}
template <typename T, std::enable_if_t<std::is_base_of_v<internal::modint_base<T>, T>, int> = 0>
ostream &operator<<(ostream &os, const T &x)
{
  os << x.val();
  return os;
}
template <class T = ll>
constexpr tuple<T, T, T> extgcd(T a, T b)
{
  if (a == 0 && b == 0)
    return {0, 0, 0};
  T x1 = 1, y1 = 0, z1 = a;
  T x2 = 0, y2 = 1, z2 = b;
  while (z2 != 0)
  {
    T q = z1 / z2;
    tie(x1, x2) = make_pair(x2, x1 - q * x2);
    tie(y1, y2) = make_pair(y2, y1 - q * y2);
    tie(z1, z2) = make_pair(z2, z1 - q * z2);
  }
  if (z1 < 0)
    x1 = -x1, y1 = -y1, z1 = -z1;
  return {z1, x1, y1};
}
template <int m>
struct static_modint : internal::modint_base<static_modint<m>>
{
  using mint = static_modint;
private:
  friend struct internal::modint_base<static_modint<m>>;
  uint _v;
  static constexpr uint umod() { return m; }
  static constexpr bool prime = internal::isprime32<m>;
public:
  static constexpr int mod() { return m; }
  static mint raw(int v)
  {
    mint x;
    x._v = v;
    return x;
  }
  static_modint() : _v(0) {}
  template <class T, typename = enable_if_t<is_integral<T>::value>>
  static_modint(T v)
  {
    if constexpr (is_signed_v<T>)
    {
      ll x = (ll)(v % (ll)(umod()));
      if (x < 0)
        x += umod();
      _v = (uint)x;
    }
    else
    {
      _v = (uint)(v % umod());
    }
  }
  int val() const { return (int)_v; }
  mint& operator*=(const mint &rhs)
  {
    ull z = _v;
    z *= rhs._v;
    _v = (uint)(z % umod());
    return *this;
  }
  mint inv() const
  {
    if (prime)
    {
      assert(_v != 0);
      return CREF.pow(umod() - 2);
    }
    else
    {
      auto [g, x, y] = extgcd<int>(_v, m);
      assert(g == 1);
      return x;
    }
  }
};
template <int id>
struct dynamic_modint : internal::modint_base<dynamic_modint<id>>
{
  using mint = dynamic_modint;
private:
  friend struct internal::modint_base<dynamic_modint<id>>;
  uint _v;
  static internal::barrett32 bt;
  static uint umod() { return bt.umod(); }
public:
  static int mod() { return (int)(bt.umod()); }
  static mint raw(int v)
  {
    mint x;
    x._v = v;
    return x;
  }
  dynamic_modint() : _v(0) {}
  template <class T, typename = enable_if_t<is_integral<T>::value>>
  dynamic_modint(T v)
  {
    if constexpr (is_signed_v<T>)
    {
      ll x = (ll)(v % (ll)(umod()));
      if (x < 0)
        x += umod();
      _v = (uint)x;
    }
    else
    {
      _v = (uint)(v % umod());
    }
  }
  int val() const { return (int)_v; }
  mint& operator*=(const mint &rhs)
  {
    _v = bt.mul(_v, rhs._v);
    return *this;
  }
  mint inv() const
  {
    auto [g, x, y] = extgcd<int>(_v, mod());
    assert(g == 1);
    return x;
  }
};
template <int id>
internal::barrett32 dynamic_modint<id>::bt(998244353);
using modint998244353 = static_modint<998244353>;
template <class T>
struct is_static_modint : false_type {};
template <int m>
struct is_static_modint<static_modint<m>> : true_type {};
template <class T>
inline constexpr bool is_static_modint_v = is_static_modint<T>::value;
template <class T>
struct is_dynamic_modint : false_type {};
template <int id>
struct is_dynamic_modint<dynamic_modint<id>> : true_type {};
template <class T>
inline constexpr bool is_dynamic_modint_v = is_dynamic_modint<T>::value;
template <class T>
inline constexpr bool is_modint_v = is_static_modint_v<T> || is_dynamic_modint_v<T>;
template <typename, typename = void>
struct has_mod : false_type {};
template <typename T>
struct has_mod<T, void_t<decltype(declval<T>().mod)>> : true_type {};
template <class mint>
struct PowerTable
{
private:
  decltype(mint::mod()) mod;
  mint base;
  vc<mint> pw;
public:
  PowerTable() {}
  PowerTable(const mint &base) : mod(mint::mod()), base(base), pw(1, 1) {}
  void reserve(int n)
  {
    if (mod != mint::mod())
    {
      mod = mint::mod();
      pw = {1};
    }
    int i = pw.size();
    if (n < i)
      return;
    pw.resize(n + 1);
    for (; i <= n; i++)
      pw[i] = pw[i - 1] * base;
  }
  mint pow(int n)
  {
    reserve(n);
    return pw[n];
  }
};
template <class T>
struct Binomial
{
private:
  static decltype(T::mod()) mod;
  static vc<T> fac_, finv_, inv_;
public:
  static void reserve(int n)
  {
    if (mod != T::mod())
    {
      mod = T::mod();
      fac_ = {1, 1}, finv_ = {1, 1}, inv_ = {0, 1};
    }
    int i = fac_.size();
    chmin(n, T::mod() - 1);
    if (n < i)
      return;
    fac_.resize(n + 1), finv_.resize(n + 1), inv_.resize(n + 1);
    for (; i <= n; i++)
    {
      fac_[i] = fac_[i - 1] * T::raw(i);
      inv_[i] = -inv_[T::mod() % i] * T::raw(T::mod() / i);
      finv_[i] = finv_[i - 1] * inv_[i];
    }
  }
  static T inv(T n)
  {
    assert(n != 0);
    reserve(n.val());
    return inv_[n.val()];
  }
};
template <class T> decltype(T::mod()) Binomial<T>::mod{};
template <class T> vc<T> Binomial<T>::fac_{};
template <class T> vc<T> Binomial<T>::finv_{};
template <class T> vc<T> Binomial<T>::inv_{};
using mint = modint998244353;
using bi = Binomial<mint>;
void init()
{
  oj(mt.seed(random_device()()));
}
template<class T>
struct FenwickTree
{
private:
  int N;
  vector<T> bit;
public:
  FenwickTree(int n = 0)
  {
    N = n;
    bit.assign(N + 1, 0);
  }
  T sum(int i) const
  {
    assert(0 <= i && i <= N);
    T s = 0;
    while (i > 0)
    {
      s += bit[i];
      i -= i & -i;
    }
    return s;
  }
  T sum(int l, int r) const
  {
    assert(l <= r);
    return sum(r) - sum(l);
  }
  T get(int i) const { return sum(i, i + 1); }
  void add(int i, T x)
  {
    assert(0 <= i && i < N);
    i++;
    while (i <= N)
    {
      bit[i] += x;
      i += i & -i;
    }
  }
};
template<class T = int>
struct FactorialSystem : vector<T>
{
  using vector<T>::vector;
  using vector<T>::operator=;
  using F = FactorialSystem;
  void carry()
  {
    if ((*this).empty())
      return;
    for (int i = 0; i < (int)(*this).size() - 1; i++)
    {
      (*this)[i + 1] += divfloor((*this)[i], i + 1);
      (*this)[i] = safemod((*this)[i], i + 1);
    }
    for (int i = (int)(*this).size() - 1; (*this)[i] > i; i++)
    {
      (*this).emplace_back(divfloor((*this)[i], i + 1));
      (*this)[i] = safemod((*this)[i], i + 1);
    }
  }
  void zero_suppress()
  {
    while (!(*this).empty() && (*this).back() == 0)
      (*this).pop_back();
  }
  bool operator==(const F &b) const
  {
    for (int i = max((*this).size(), b.size()) - 1; i >= 0; i--)
    {
      T ai = i < (int)(*this).size() ? (*this)[i] : 0;
      T bi = i < (int)b.size() ? b[i] : 0;
      if (ai != bi)
        return false;
    }
    return true;
  }
  bool operator<(const F &b) const
  {
    for (int i = max((*this).size(), b.size()) - 1; i >= 0; i--)
    {
      T ai = i < (int)(*this).size() ? (*this)[i] : 0;
      T bi = i < (int)b.size() ? b[i] : 0;
      if (ai < bi)
        return true;
      if (ai > bi)
        return false;
    }
    return false;
  }
  bool operator>(const F &b) const
  {
    for (int i = max((*this).size(), b.size()) - 1; i >= 0; i--)
    {
      T ai = i < (int)(*this).size() ? (*this)[i] : 0;
      T bi = i < (int)b.size() ? b[i] : 0;
      if (ai > bi)
        return true;
      if (ai < bi)
        return false;
    }
    return false;
  }
  bool operator!=(const F &b) const { return !((*this) == b); }
  bool operator<=(const F &b) const { return !((*this) > b); }
  bool operator>=(const F &b) const { return !((*this) < b); }
  F &operator+=(ll k)
  {
    if ((*this).empty())
      (*this).resize(1);
    (*this).front() += k;
    carry();
    return *this;
  }
  F operator+(ll k) const { return F(*this) += k; }
  F &operator-=(ll k) { return (*this) += (-k); }  // assert は面倒なのでつけてません
  F operator-(ll k) const { return F(*this) -= k; }
  F &operator+=(const F &b)
  {
    if ((*this).size() < b.size())
      (*this).resize(b.size());
    for (int i = 0; i < (int)b.size(); i++)
      (*this)[i] += b[i];
    carry();
    return *this;
  }
  F operator+(const F &b) const { return F(*this) += b; }
  F &operator-=(const F &b)
  {
    assert((*this) >= b);
    if ((*this).size() < b.size())
      (*this).resize(b.size());
    for (int i = 0; i < (int)b.size(); i++)
      (*this)[i] -= b[i];
    carry();
    return *this;
  }
  F operator-(const F &b) const { return F(*this) -= b; }
  F &operator*=(ll k)
  {
    for (T &a : (*this))
      a *= k;
    carry();
    return *this;
  }
  F operator*(ll k) const { return F(*this) *= k; }
  pair<F, ll> divmod(ll k) const
  {
    F a(*this), res((*this).size(), 0);
    for (int i = (int)a.size() - 1; i > 0; i--)
    {
      res[i] = a[i] / k;
      a[i - 1] += a[i] % k * i;
    }
    return make_pair(res, a.front());
  }
  F operator/(ll k) const { return (*this).divmod(k).first; }
  F &operator/=(ll k) { return (*this) = (*this) / k; }
  ll operator%(ll k) { return (*this).divmod(k).second; }
};
template<class T = int>
FactorialSystem<T> perm_to_fac(const vector<int> &P)
{
  int N = P.size();
  FenwickTree<int> fw(N);
  for (int i = 0; i < N; i++)
    fw.add(i, 1);
  FactorialSystem<T> fac(N);
  for (int i = 0; i < N; i++)
  {
    fac[N - 1 - i] = fw.sum(P[i]);
    fw.add(P[i], -1);
  }
  return fac;
}
#include <atcoder/convolution>
template<const int base = 10, const int digit = 6>
struct bigint
{
private:
  static constexpr int pw(const int &a, const int &b)
  {
    int res = 1;
    for (int i = 0; i < b; i++)
      res *= a;
    return res;
  }
  static constexpr int BASE = pw(base, digit);
  vector<ll> vec;
  bool is_nega = false;
  static constexpr int MOD1 = 1711276033, MOD2 = 1811939329;
  static constexpr int INV12 = atcoder::internal::inv_gcd(MOD1, MOD2).second;
  static constexpr ll MOD12 = (ll)MOD1 * (ll)MOD2;
  static constexpr ll mycrt(const ll &r1, const ll &r2)
  {
    ll t = safemod((r2 - r1) * INV12, MOD2);
    return r1 + t * MOD1;
  }
  static constexpr vector<ll> mycrt(const vector<ll> &vec1, const vector<ll> &vec2)
  {
    vector<ll> res(vec1.size());
    for (int i = 0; i < (int)vec1.size(); i++)
      res[i] = mycrt(vec1[i], vec2[i]);
    return res;
  }
  void zero_suppress()
  {
    while (!vec.empty() && vec.back() == 0)
      vec.pop_back();
  }
  void carry(int d = -1)
  {
    const int n = vec.size();
    if (n == 0)
      return;
    if (d < 0)
      d = n - 1;
    for (int i = 0; i < d; i++)
    {
      vec[i + 1] += divfloor(vec[i], BASE);
      vec[i] = safemod(vec[i], BASE);
    }
    for (int i = d; !(0 <= vec[i] && vec[i] < BASE); i++)
    {
      vec.emplace_back(divfloor(vec[i], BASE));
      vec[i] = safemod(vec[i], BASE);
    }
  }
  bigint &operator<<=(size_t k)
  {
    vec.insert(vec.begin(), k, 0);
    return *this;
  }
  bigint &operator>>=(size_t k)
  {
    vec.erase(vec.begin(), vec.begin() + min(vec.size(), k));
    return *this;
  }
  bigint operator<<(size_t k) const { return bigint(*this) <<= k; }
  bigint operator>>(size_t k) const { return bigint(*this) >>= k; }
public:
  bigint() {}
  bigint(string s)
  {
    if (!s.empty() && s[0] == '-')
    {
      is_nega = true;
      s.erase(s.begin());
    }
    else
      is_nega = false;
    vec.resize(divceil((int)s.size(), digit));
    for (int i = 0; i < (int)vec.size(); i++)
    {
      int r = (int)s.size() - i * digit;
      int l = max(0, r - digit);
      string t = s.substr(l, r - l);
      if (!t.empty())
        vec[i] = stoi(t, 0, base);
    }
    zero_suppress();
  }
  template<typename T>
  bigint(const T &x, typename enable_if<is_integral<T>::value>::type* = 0)
  { *this = bigint(std::to_string(x)); }
  string to_string() const
  {
    const int n = vec.size();
    if (n == 0)
      return "0";
    string s = is_nega ? "-" : "";
    auto my_to_string = [&](int x) -> string
    {
      if (base == 10)
        return std::to_string(x);
      string res = "";
      while (x > 0)
      {
        int d = x % base;
        res += d >= 10 ? d - 10 + 'A' : d + '0';
        x /= base;
      }
      reverse(res.begin(), res.end());
      return res;
    };
    s += my_to_string(vec.back());
    for (int i = (int)vec.size() - 2; i >= 0; i--)
    {
      string t = my_to_string(vec[i]);
      s += string(digit - (int)t.size(), '0') + t;
    }
    return s;
  }
  auto operator<=>(const bigint &b) const
  {
    if (is_nega ^ b.is_nega)
      return is_nega ? -1 : 1;
    if (vec.size() != b.vec.size())
      return ((vec.size() < b.vec.size()) ^ is_nega) ? -1 : 1;
    for (int i = (int)vec.size() - 1; i >= 0; i--)
    {
      if (vec[i] != b.vec[i])
        return ((vec[i] < b.vec[i]) ^ is_nega) ? -1 : 1;
    }
    return 0;
  }
  bool operator==(const bigint &b) const { return (*this).vec == b.vec && (*this).is_nega == b.is_nega; }
  bigint operator-() const
  {
    bigint res(*this);
    res.is_nega ^= 1;
    return res;
  }
  bigint abs() const
  {
    bigint res(*this);
    res.is_nega = false;
    return res;
  }
  bigint &operator+=(const bigint &b)
  {
    if (is_nega ^ b.is_nega)
      return (*this) -= (-b);
    if (vec.size() < b.vec.size())
      vec.resize(b.vec.size());
    for (int i = 0; i < (int)b.vec.size(); i++)
      vec[i] += b.vec[i];
    carry();
    return *this;
  }
  bigint &operator-=(const bigint &b)
  {
    if (is_nega ^ b.is_nega)
      return (*this) += (-b);
    if (vec.size() < b.vec.size())
      vec.resize(b.vec.size());
    bool rev = abs() < b.abs();
    for (int i = 0; i < (int)b.vec.size(); i++)
      vec[i] = rev ? b.vec[i] - vec[i] : vec[i] - b.vec[i];
    carry();
    zero_suppress();
    is_nega ^= rev;
    return *this;
  }
  bigint &operator*=(const bigint &b)
  {
    vector<ll> vec1 = atcoder::convolution<MOD1>(vec, b.vec);
    vector<ll> vec2 = atcoder::convolution<MOD2>(vec, b.vec);
    vec = mycrt(vec1, vec2);
    carry();
    zero_suppress();
    is_nega ^= b.is_nega;
    return *this;
  }
  bigint operator+(const bigint &b) const { return bigint(*this) += b; }
  bigint operator-(const bigint &b) const { return bigint(*this) -= b; }
  bigint operator*(const bigint &b) const { return bigint(*this) *= b; }
  bigint inv(int d) const
  {
    assert(!vec.empty());
    bigint a(abs()), b;
    {
      int l = 0, r = BASE + 1;
      while (r - l > 1)
      {
        int m = l + (r - l) / 2;
        bigint c = a * m;
        if (c.vec.size() > a.vec.size())
          r = m;
        else
          l = m;
      }
      b = l;
    }
    bigint c, c2;
    const bigint TWO(2);
    for (int k = 1;; k = min(2 * k, d))
    {
      c = a * b;
      if ((int)b.vec.size() >= d + 1
      && (int)c.vec.size() == (int)a.vec.size() + (int)b.vec.size() - 1)
      {
        c2 = c + a;
        if (c2.vec.size() == a.vec.size() + b.vec.size())
        {
          if (c2 == bigint(1) << ((int)c2.vec.size() - 1))
            b += 1;
          break;
        }
      }
      b *= (TWO << ((int)a.vec.size() + (int)b.vec.size() - 1)) - c;
      if ((int)b.vec.size() >= k + 1)
        b >>= ((int)b.vec.size() - k - 1);
    }
    b >>= 1;
    if (is_nega)
      b = -b;
    return b;
  }
  bigint operator/(const bigint &b) const
  {
    assert(!b.vec.empty());
    bigint a = abs();
    if (a < b)
      return bigint(0);
    bigint ib = b.abs().inv((int)a.vec.size());
    bigint c = (a * ib) >> ((int)a.vec.size() + (int)b.vec.size() - 1);
    if (a >= b.abs() * (c + 1))
      c += 1;
    c.is_nega = is_nega ^ b.is_nega;
    return c;
  }
  pair<bigint, bigint> divmod(const bigint &b) const
  {
    bigint q = *this / b;
    bigint r = *this - q * b;
    return make_pair(q, r);
  }
  bigint operator%(const bigint &b) const { return divmod(b).second; }
  bigint &operator/=(const bigint &b) { return *this = *this / b; }
  bigint &operator%=(const bigint &b) { return *this = *this % b; }
};
template<const int base, const int digit>
istream &operator>>(istream &is, bigint<base, digit> &a)
{
  string s;
  is >> s;
  a = bigint<base, digit>(s);
  return is;
}
template<const int base, const int digit>
ostream &operator<<(ostream &os, const bigint<base, digit> &a)
{
  os << a.to_string();
  return os;
}
void main2()
{
  LL(N);
  VEC(int, N, P);
  offset(P, -1);
  auto fac = perm_to_fac(P);
  dump(fac);
  bigint ans = 0;
  rep(i, SZ(fac) - 1, 0, -1) ans = (ans + fac[i]) * i;
  PRINT(ans + 1);
}
void test()
{
}
template <auto init, auto main2, auto test>
struct Main
{
  Main()
  {
    cauto CERR = [](string val, string color)
    {
      string s = "\033[" + color + "m" + val + "\033[m";
      /* コードテストで確認する際にコメントアウトを外す
      cerr << val;
      //*/
    };
    CERR("\n[FAST_CIO]\n\n", "32");
    cin.tie(0);
    ios::sync_with_stdio(false);
    cout << fixed << setprecision(20);
    init();
    CERR("\n[SINGLE_TESTCASE]\n\n", "36");
    main2();
  }
};
Main<init, main2, test> main_dummy;
}
int main() {}
yukicoder

結果

ソースコード