結果

問題 No.2788 4-33 Hard
ユーザー ecotteaecottea
提出日時 2024-06-16 00:46:36
言語 C++17
(gcc 13.3.0 + boost 1.87.0)
結果
TLE  
実行時間 -
コード長 8,714 bytes
コンパイル時間 7,307 ms
コンパイル使用メモリ 319,676 KB
実行使用メモリ 13,888 KB
最終ジャッジ日時 2024-06-16 00:46:48
合計ジャッジ時間 12,250 ms
ジャッジサーバーID
(参考情報)
judge3 / judge5
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 173 ms
10,396 KB
testcase_01 AC 180 ms
5,248 KB
testcase_02 AC 190 ms
5,376 KB
testcase_03 TLE -
testcase_04 -- -
testcase_05 -- -
testcase_06 -- -
testcase_07 -- -
testcase_08 -- -
testcase_09 -- -
testcase_10 -- -
testcase_11 -- -
testcase_12 -- -
testcase_13 -- -
testcase_14 -- -
testcase_15 -- -
testcase_16 -- -
testcase_17 -- -
testcase_18 -- -
testcase_19 -- -
testcase_20 -- -
testcase_21 -- -
testcase_22 -- -
testcase_23 -- -
testcase_24 -- -
testcase_25 -- -
testcase_26 -- -
testcase_27 -- -
testcase_28 -- -
testcase_29 -- -
testcase_30 -- -
testcase_31 -- -
testcase_32 -- -
testcase_33 -- -
testcase_34 -- -
testcase_35 -- -
testcase_36 -- -
testcase_37 -- -
testcase_38 -- -
testcase_39 -- -
testcase_40 -- -
testcase_41 -- -
testcase_42 -- -
testcase_43 -- -
testcase_44 -- -
testcase_45 -- -
testcase_46 -- -
testcase_47 -- -
testcase_48 -- -
testcase_49 -- -
testcase_50 -- -
testcase_51 -- -
testcase_52 -- -
testcase_53 -- -
testcase_54 -- -
testcase_55 -- -
権限があれば一括ダウンロードができます

ソースコード

diff #

// QCFium 法
#pragma GCC target("avx2")
#pragma GCC optimize("O3")
#pragma GCC optimize("unroll-loops")


#ifndef HIDDEN_IN_VS // 折りたたみ用

// 警告の抑制
#define _CRT_SECURE_NO_WARNINGS

// ライブラリの読み込み
#include <bits/stdc++.h>
using namespace std;

// 型名の短縮
using ll = long long; using ull = unsigned long long; // -2^63 ~ 2^63 = 9 * 10^18(int は -2^31 ~ 2^31 = 2 * 10^9)
using pii = pair<int, int>;	using pll = pair<ll, ll>;	using pil = pair<int, ll>;	using pli = pair<ll, int>;
using vi = vector<int>;		using vvi = vector<vi>;		using vvvi = vector<vvi>;	using vvvvi = vector<vvvi>;
using vl = vector<ll>;		using vvl = vector<vl>;		using vvvl = vector<vvl>;	using vvvvl = vector<vvvl>;
using vb = vector<bool>;	using vvb = vector<vb>;		using vvvb = vector<vvb>;
using vc = vector<char>;	using vvc = vector<vc>;		using vvvc = vector<vvc>;
using vd = vector<double>;	using vvd = vector<vd>;		using vvvd = vector<vvd>;
template <class T> using priority_queue_rev = priority_queue<T, vector<T>, greater<T>>;
using Graph = vvi;

// 定数の定義
const double PI = acos(-1);
int DX[4] = {1, 0, -1, 0}; // 4 近傍(下,右,上,左)
int DY[4] = {0, 1, 0, -1};
int INF = 1001001001; ll INFL = 4004004003094073385LL; // (int)INFL = INF, (int)(-INFL) = -INF;

// 入出力高速化
struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp;

// 汎用マクロの定義
#define all(a) (a).begin(), (a).end()
#define sz(x) ((int)(x).size())
#define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), x))
#define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), x))
#define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");}
#define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順
#define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順
#define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順
#define repe(v, a) for(const auto& v : (a)) // a の全要素(変更不可能)
#define repea(v, a) for(auto& v : (a)) // a の全要素(変更可能)
#define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索(昇順)
#define repis(i, set) for(int i = lsb(set), bset##i = set; i >= 0; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素(昇順)
#define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て(昇順)
#define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去
#define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了
#define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 半開矩形内判定

// 汎用関数の定義
template <class T> inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; }
template <class T> inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新(更新されたら true を返す)
template <class T> inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新(更新されたら true を返す)
template <class T> inline T getb(T set, int i) { return (set >> i) & T(1); }
template <class T> inline T smod(T n, T m) { n %= m; if (n < 0) n += m; return n; } // 非負mod

// 演算子オーバーロード
template <class T, class U> inline istream& operator>>(istream& is, pair<T, U>& p) { is >> p.first >> p.second; return is; }
template <class T> inline istream& operator>>(istream& is, vector<T>& v) { repea(x, v) is >> x; return is; }
template <class T> inline vector<T>& operator--(vector<T>& v) { repea(x, v) --x; return v; }
template <class T> inline vector<T>& operator++(vector<T>& v) { repea(x, v) ++x; return v; }

#endif // 折りたたみ用


#if __has_include(<atcoder/all>)
#include <atcoder/all>
using namespace atcoder;

#ifdef _MSC_VER
#include "localACL.hpp"
#endif

//using mint = modint1000000007;
using mint = modint998244353;
//using mint = modint; // mint::set_mod(m);

namespace atcoder {
	inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; }
	inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; }
}
using vm = vector<mint>; using vvm = vector<vm>; using vvvm = vector<vvm>; using vvvvm = vector<vvvm>; using pim = pair<int, mint>;
#endif


#ifdef _MSC_VER // 手元環境(Visual Studio)
#include "local.hpp"
#else // 提出用(gcc)
inline int popcount(int n) { return __builtin_popcount(n); }
inline int popcount(ll n) { return __builtin_popcountll(n); }
inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : -1; }
inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : -1; }
template <size_t N> inline int lsb(const bitset<N>& b) { return b._Find_first(); }
inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; }
inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; }
#define dump(...)
#define dumpel(v)
#define dump_list(v)
#define dump_mat(v)
#define input_from_file(f)
#define output_to_file(f)
#define Assert(b) { if (!(b)) { vc MLE(1<<30); EXIT(MLE.back()); } } // RE の代わりに MLE を出す
#endif


//【多次元畳込み(切り詰め,mod 998244353)】O(D n log n)
/*
* n = Πns[0..D) とおき,a[0..n), b[0..n) を添字が ns 進表記(ns[0] が最下位)で与えられたものと解釈し,
* a, b の多次元畳込み(切り詰め)を行った結果を返す.
*/
vm multivariate_convolution(const vm& a, const vm& b, const vi& ns) {
	// 参考 : https://nyaannyaan.github.io/library/ntt/multivariate-multiplication.hpp
	// verify : https://judge.yosupo.jp/problem/multivariate_convolution

	//【方法】
	// 添字 x に対して rank(x) を
	//		rank(x) = Σi∈[d..D) floor(x / Πns[0..d))
	// と定めると,ns 進表記(ただし ns[D-1]=∞ とする)したときの x+y の繰り上がり回数は
	//		rank(x+y) - (rank(x) + rank(y)) ∈ [0..D)
	// と表される.
	//
	// よって列方向に rank mod D(狭変域),行方向に添字(広変域)をもった二次元畳込みを行い,
	// rank(x+y) - (rank(x) + rank(y)) ≡ 0 (mod d) となる項だけを拾い集めれば良い.

	//【備考】
	// ns が全て 2 なら【非交和畳込み】であり,そちらを利用する方が速い.

	// n : 要素数, D : 次元
	int n = sz(a), D = sz(ns);

	// acc[i] = Πns[0..i)
	vi acc(D + 1);
	acc[0] = 1;
	rep(d, D) acc[d + 1] = acc[d] * ns[d];
	Assert(n == acc[D]);

	if (D == 0) return vm{ a[0] * b[0] };

	// rank[i] = Σd∈[1..D) floor(i / Πns[0..d))
	vi rank(n);
	rep(i, n) {
		repi(d, 1, D - 1) rank[i] += i / acc[d];
		rank[i] %= D;
	}

	// 列の長さを 2 冪に拡張しつつ,rank(i) mod D で要素を振り分ける.
	int N = 1 << (msb(acc[D] - 1) + 2);
	vvm as(D, vm(N)), bs(D, vm(N));
	rep(i, n) {
		as[rank[i]][i] = a[i];
		bs[rank[i]][i] = b[i];
	}

	// 行方向の NTT
	rep(d, D) {
		internal::butterfly(as[d]);
		internal::butterfly(bs[d]);
	}

	vm c(n); vm tmp(N);

	// 列方向には素朴に畳み込む.
	rep(da, D) rep(db, D) {
		// 各点積
		rep(i, N) tmp[i] = as[da][i] * bs[db][i];

		// 行方向の INTT
		internal::butterfly_inv(tmp);

		// i ≧ n は最上位で繰り上がりが生じていることに対応するので無視する.
		rep(i, n) if ((rank[i] - da - db) % D == 0) c[i] += tmp[i];
	}

	// 定数倍の調整
	mint inv = mint(N).inv();
	rep(i, n) c[i] *= inv;

	return c;
}


int main() {
//	input_from_file("input.txt");
//	output_to_file("output.txt");
	
	auto start = chrono::system_clock::now();
	
	int T = 8 + 1, A = 4 + 1, B = 33 + 1;
	
	vvl O(A, vl(B));
	vvl X(A, vl(B));
	cin >> O >> X;

	vi ns{ B, A, T };

	vm dp(T * A * B);
	dp[(0 * A + 0) * B + 0] = 1;

	rep(a, A) rep(b, B) {
		vm pow2(T * A * B);
		pow2[(0 * A + 0) * B + 0] = 1;
		pow2[(1 * A + a) * B + b] = 1;

		vm res(T * A * B);
		res[(0 * A + 0) * B + 0] = 1;

		ll n = O[a][b];
		while (n > 0) {
			if (n & 1) res = multivariate_convolution(res, pow2, ns);
			pow2 = multivariate_convolution(pow2, pow2, ns);
			n /= 2;
		}
		
		dp = multivariate_convolution(dp, res, ns);
//		dump(a, b); dump(dp); exit(0);
	}
	dump(dp);

	mint res = 0;
	rep(a, A) {
		int a2 = 4 - a;
		res += dp[(8 * A + a2) * B + 33] * X[a][0];
	}

	cout << res << endl;

	auto now = chrono::system_clock::now();
	auto msec = chrono::duration_cast<chrono::milliseconds>(now - start).count();
	cerr << endl << msec << " msec" << endl;
}
0