結果
問題 | No.3046 yukicoderの過去問 |
ユーザー | QCFium |
提出日時 | 2022-08-14 12:17:13 |
言語 | C++14 (gcc 12.3.0 + boost 1.83.0) |
結果 |
AC
|
実行時間 | 421 ms / 2,000 ms |
コード長 | 1,188 bytes |
コンパイル時間 | 3,213 ms |
コンパイル使用メモリ | 273,552 KB |
実行使用メモリ | 5,248 KB |
最終ジャッジ日時 | 2024-10-01 05:29:48 |
合計ジャッジ時間 | 7,566 ms |
ジャッジサーバーID (参考情報) |
judge4 / judge3 |
(要ログイン)
テストケース
テストケース表示入力 | 結果 | 実行時間 実行使用メモリ |
---|---|---|
testcase_00 | AC | 336 ms
5,248 KB |
testcase_01 | AC | 334 ms
5,248 KB |
testcase_02 | AC | 337 ms
5,248 KB |
testcase_03 | AC | 336 ms
5,248 KB |
testcase_04 | AC | 334 ms
5,248 KB |
testcase_05 | AC | 334 ms
5,248 KB |
testcase_06 | AC | 421 ms
5,248 KB |
testcase_07 | AC | 406 ms
5,248 KB |
testcase_08 | AC | 415 ms
5,248 KB |
ソースコード
#pragma GCC target("avx2") #pragma GCC optimize("O3,unroll-loops") #include <bits/stdc++.h> #include <immintrin.h> #define N 100016 #define MOD 1000000007 int ri() { int n; scanf("%d", &n); return n; } using vec_t = __m256i; __attribute__((aligned(32))) uint64_t table[N], dp[N]; void calc0() { dp[0] = 1; # define BLOCK 8 for (int i = 0; i < N; i += BLOCK) { for (int j = i; j < i + BLOCK; j++) { dp[j] %= MOD; for (int k = j + 1; k < i + BLOCK; k++) dp[k] += dp[j] & table[k - j]; } # define DEF_A(x) vec_t a##x = _mm256_set1_epi64x(dp[i + x]) DEF_A(0); DEF_A(1); DEF_A(2); DEF_A(3); DEF_A(4); DEF_A(5); DEF_A(6); DEF_A(7); int j = 0; for (; j < N - i - 8 - 8; j += 4) { vec_t added = _mm256_load_si256((vec_t *) (dp + i + BLOCK + j)); # define ADD(x) added = _mm256_add_epi64(added, _mm256_and_si256(a##x, _mm256_loadu_si256((vec_t *) (table + j + (8 - x))))) ADD(7); ADD(6); ADD(5); ADD(4); ADD(3); ADD(2); ADD(1); ADD(0); _mm256_storeu_si256((vec_t *) (dp + i + BLOCK + j), added); } } } int main() { int k = ri(); int n = ri(); for (int i = 0; i < n; i++) table[ri()] = -1; calc0(); printf("%d\n", (int) dp[k]); return 0; }