結果

問題 No.3046 yukicoderの過去問
ユーザー QCFiumQCFium
提出日時 2022-08-14 12:17:13
言語 C++14
(gcc 12.3.0 + boost 1.83.0)
結果
AC  
実行時間 469 ms / 2,000 ms
コード長 1,188 bytes
コンパイル時間 3,648 ms
コンパイル使用メモリ 273,868 KB
実行使用メモリ 6,676 KB
最終ジャッジ日時 2024-04-08 11:36:48
合計ジャッジ時間 8,706 ms
ジャッジサーバーID
(参考情報)
judge15 / judge13
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 385 ms
6,676 KB
testcase_01 AC 383 ms
6,676 KB
testcase_02 AC 383 ms
6,676 KB
testcase_03 AC 384 ms
6,676 KB
testcase_04 AC 385 ms
6,676 KB
testcase_05 AC 385 ms
6,676 KB
testcase_06 AC 469 ms
6,676 KB
testcase_07 AC 465 ms
6,676 KB
testcase_08 AC 469 ms
6,676 KB
権限があれば一括ダウンロードができます

ソースコード

diff #

#pragma GCC target("avx2")
#pragma GCC optimize("O3,unroll-loops")
#include <bits/stdc++.h>
#include <immintrin.h>

#define N 100016
#define MOD 1000000007

int ri() {
	int n;
	scanf("%d", &n);
	return n;
}

using vec_t = __m256i;

__attribute__((aligned(32))) uint64_t table[N], dp[N];

void calc0() {
	dp[0] = 1;
	
#	define BLOCK 8
	for (int i = 0; i < N; i += BLOCK) {
		for (int j = i; j < i + BLOCK; j++) {
			dp[j] %= MOD;
			for (int k = j + 1; k < i + BLOCK; k++) dp[k] += dp[j] & table[k - j];
		}
#		define DEF_A(x) vec_t a##x = _mm256_set1_epi64x(dp[i + x])
		DEF_A(0); DEF_A(1); DEF_A(2); DEF_A(3);
		DEF_A(4); DEF_A(5); DEF_A(6); DEF_A(7);
		
		int j = 0;
		for (; j < N - i - 8 - 8; j += 4) {
			vec_t added = _mm256_load_si256((vec_t *) (dp + i + BLOCK + j));
#			define ADD(x) added = _mm256_add_epi64(added, _mm256_and_si256(a##x, _mm256_loadu_si256((vec_t *) (table + j + (8 - x)))))
			ADD(7); ADD(6); ADD(5); ADD(4);
			ADD(3); ADD(2); ADD(1); ADD(0);
			_mm256_storeu_si256((vec_t *) (dp + i + BLOCK + j), added);
		}
	}
}

int main() {
	int k = ri();
	int n = ri();
	for (int i = 0; i < n; i++) table[ri()] = -1;
	calc0();
	printf("%d\n", (int) dp[k]);
	return 0;
}
0