結果

問題 No.840 ほむほむほむら
ユーザー QCFiumQCFium
提出日時 2019-06-27 16:43:31
言語 C++14
(gcc 13.2.0 + boost 1.83.0)
結果
AC  
実行時間 56 ms / 4,000 ms
コード長 2,223 bytes
コンパイル時間 2,572 ms
コンパイル使用メモリ 185,596 KB
実行使用メモリ 4,384 KB
最終ジャッジ日時 2023-09-10 10:37:39
合計ジャッジ時間 4,804 ms
ジャッジサーバーID
(参考情報)
judge12 / judge14
このコードへのチャレンジ(β)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 2 ms
4,376 KB
testcase_01 AC 1 ms
4,380 KB
testcase_02 AC 3 ms
4,380 KB
testcase_03 AC 9 ms
4,380 KB
testcase_04 AC 2 ms
4,384 KB
testcase_05 AC 2 ms
4,376 KB
testcase_06 AC 2 ms
4,380 KB
testcase_07 AC 4 ms
4,380 KB
testcase_08 AC 14 ms
4,380 KB
testcase_09 AC 2 ms
4,376 KB
testcase_10 AC 1 ms
4,380 KB
testcase_11 AC 2 ms
4,376 KB
testcase_12 AC 5 ms
4,380 KB
testcase_13 AC 34 ms
4,380 KB
testcase_14 AC 6 ms
4,380 KB
testcase_15 AC 2 ms
4,376 KB
testcase_16 AC 2 ms
4,376 KB
testcase_17 AC 9 ms
4,380 KB
testcase_18 AC 56 ms
4,376 KB
testcase_19 AC 56 ms
4,380 KB
testcase_20 AC 1 ms
4,380 KB
testcase_21 AC 1 ms
4,380 KB
testcase_22 AC 2 ms
4,384 KB
testcase_23 AC 56 ms
4,376 KB
testcase_24 AC 2 ms
4,376 KB
testcase_25 AC 1 ms
4,376 KB
testcase_26 AC 2 ms
4,376 KB
testcase_27 AC 47 ms
4,380 KB
権限があれば一括ダウンロードができます

ソースコード

diff #

#pragma GCC target("avx2")
#pragma GCC optimize("O3")
#pragma GCC optimize("unroll-loops")
#include <bits/stdc++.h>
#define MOD 998244353

int ri() {
	int n;
	scanf("%d", &n);
	return n;
}
int main() {
	int n = ri();
	int k = ri();
	int kk = k * k;
	int kkk = k * k * k;
	int a[kkk][kkk];
	memset(a, 0, sizeof(a));
	for (int i = 0; i < k*k*k; i++) {
		int x = i / kk;
		int y = i / k % k;
		int z = i % k;
		a[i][x * kk + y * k + (z + 1) % k]++;
		a[i][x * kk + (y + z) % k * k + z]++;
		a[i][(x + y) % k * kk + y * k + z]++;
	}
	std::vector<int> res(kkk, 0);
	std::vector<int> tmp(kkk);
	res[0] = 1;
	int kkk_1 = (kkk&0x7FFFFFF0);
	int kkk_f = (kkk&0xF);
	while (n) {
		if (n & 1) {
			tmp.assign(kkk, 0);
			for (int i = 0; i < kkk; i++)
				for (int j = 0; j < kkk; j++) {
					tmp[j] += (int64_t) res[i] * a[i][j] % MOD;
					if (tmp[j] >= MOD) tmp[j] -= MOD;
				}
			std::swap(tmp, res);
		}
		int b[kkk][kkk];
		memset(b, 0, sizeof(b));
		for (int i = 0; i < kkk; i++) {
			for (int j = 0; j < kkk; j++) {
				uint64_t sum = 0;
				for (int l = 0; l < kkk_1; l += 0x10) {
					sum += (uint64_t) a[i][l] * a[l][j];
					sum += (uint64_t) a[i][l + 1] * a[l + 1][j];
					sum += (uint64_t) a[i][l + 2] * a[l + 2][j];
					sum += (uint64_t) a[i][l + 3] * a[l + 3][j];
					sum += (uint64_t) a[i][l + 4] * a[l + 4][j];
					sum += (uint64_t) a[i][l + 5] * a[l + 5][j];
					sum += (uint64_t) a[i][l + 6] * a[l + 6][j];
					sum += (uint64_t) a[i][l + 7] * a[l + 7][j];
					sum += (uint64_t) a[i][l + 8] * a[l + 8][j];
					sum += (uint64_t) a[i][l + 9] * a[l + 9][j];
					sum += (uint64_t) a[i][l + 10] * a[l + 10][j];
					sum += (uint64_t) a[i][l + 11] * a[l + 11][j];
					sum += (uint64_t) a[i][l + 12] * a[l + 12][j];
					sum += (uint64_t) a[i][l + 13] * a[l + 13][j];
					sum += (uint64_t) a[i][l + 14] * a[l + 14][j];
					sum += (uint64_t) a[i][l + 15] * a[l + 15][j];
					sum %= MOD;
				}
				for (int l = 0; l < kkk_f; l++) {
					sum += (uint64_t) a[i][kkk_1 + l] * a[kkk_1 + l][j];
				}
				b[i][j] = sum % MOD;
			}
		}
		memcpy(a, b, sizeof(a));
		n /= 2;
	}
	int ans = 0;
	for (int i = 0; i < kk; i++) {
		ans += res[i];
		if (ans >= MOD) ans -= MOD;
	}
	std::cout << ans << std::endl;
	return 0;
}
0