#pragma GCC target("avx2") #pragma GCC optimize("O3,unroll-loops") #include #include #define N 100016 #define MOD 1000000007 int ri() { int n; scanf("%d", &n); return n; } using vec_t = __m256i; __attribute__((aligned(32))) uint64_t table[N], dp[N]; void calc0() { dp[0] = 1; # define BLOCK 8 for (int i = 0; i < N; i += BLOCK) { for (int j = i; j < i + BLOCK; j++) { dp[j] %= MOD; for (int k = j + 1; k < i + BLOCK; k++) dp[k] += dp[j] & table[k - j]; } # define DEF_A(x) vec_t a##x = _mm256_set1_epi64x(dp[i + x]) DEF_A(0); DEF_A(1); DEF_A(2); DEF_A(3); DEF_A(4); DEF_A(5); DEF_A(6); DEF_A(7); int j = 0; for (; j < N - i - 8 - 8; j += 4) { vec_t added = _mm256_load_si256((vec_t *) (dp + i + BLOCK + j)); # define ADD(x) added = _mm256_add_epi64(added, _mm256_and_si256(a##x, _mm256_loadu_si256((vec_t *) (table + j + (8 - x))))) ADD(7); ADD(6); ADD(5); ADD(4); ADD(3); ADD(2); ADD(1); ADD(0); _mm256_storeu_si256((vec_t *) (dp + i + BLOCK + j), added); } } } int main() { int k = ri(); int n = ri(); for (int i = 0; i < n; i++) table[ri()] = -1; calc0(); printf("%d\n", (int) dp[k]); return 0; }