#include #include #include #include #include #include #include #include #include #include #include #include #include #include #define vll vector #define vvvl vector #define vvl vector> #define VV(a, b, c, d) vector>(a, vector(b, c)) #define VVV(a, b, c, d) vector(a, vvl(b, vll (c, d))); #define re(c, b) for(ll c=0;c #include namespace internal{ template using is_integral = typename std::is_integral; template using is_signed_int = typename std::conditional::value && std::is_signed::value, std::true_type, std::false_type>::type; template using is_unsigned_int = typename std::conditional::value && std::is_unsigned::value, std::true_type, std::false_type>::type; template using to_unsigned = typename std::conditional::value, std::make_unsigned, std::common_type>::type; template using is_signed_int_t = std::enable_if_t::value>; template using is_unsigned_int_t = std::enable_if_t::value>; template using to_unsigned_t = typename to_unsigned::type; // constexpr long long safe_mod(long long x, long long m) { x %= m; if (x < 0) x += m; return x; } struct barrett { unsigned int _m; unsigned long long im; barrett(unsigned int m) : _m(m), im((unsigned long long)(-1) / m + 1) {} unsigned int umod() const { return _m; } unsigned int mul(unsigned int a, unsigned int b) const { unsigned long long z = a; z *= b; unsigned long long x = (unsigned long long)(((unsigned __int128)(z)*im) >> 64); unsigned int v = (unsigned int)(z - x * _m); if (_m <= v) v += _m; return v; } }; constexpr long long pow_mod_constexpr(long long x, long long n, int m) { if (m == 1) return 0; unsigned int _m = (unsigned int)(m); unsigned long long r = 1; unsigned long long y = safe_mod(x, m); while (n) { if (n & 1) r = (r * y) % _m; y = (y * y) % _m; n >>= 1; } return r; } constexpr bool is_prime_constexpr(int n) { if (n <= 1) return false; if (n == 2 || n == 7 || n == 61) return true; if (n % 2 == 0) return false; long long d = n - 1; while (d % 2 == 0) d /= 2; constexpr long long bases[3] = {2, 7, 61}; for (long long a : bases) { long long t = d; long long y = pow_mod_constexpr(a, t, n); while (t != n - 1 && y != 1 && y != n - 1) { y = y * y % n; t <<= 1; } if (y != n - 1 && t % 2 == 0) { return false; } } return true; } template constexpr bool is_prime = is_prime_constexpr(n); constexpr std::pair inv_gcd(long long a, long long b) { a = safe_mod(a, b); if (a == 0) return {b, 0}; long long s = b, t = a; long long m0 = 0, m1 = 1; while (t) { long long u = s / t; s -= t * u; m0 -= m1 * u; auto tmp = s; s = t; t = tmp; tmp = m0; m0 = m1; m1 = tmp; } if (m0 < 0) m0 += b / s; return {s, m0}; } constexpr int primitive_root_constexpr(int m) { if (m == 2) return 1; if (m == 167772161) return 3; if (m == 469762049) return 3; if (m == 754974721) return 11; if (m == 998244353) return 3; int divs[20] = {}; divs[0] = 2; int cnt = 1; int x = (m - 1) / 2; while (x % 2 == 0) x /= 2; for (int i = 3; (long long)(i)*i <= x; i += 2) { if (x % i == 0) { divs[cnt++] = i; while (x % i == 0) { x /= i; } } } if (x > 1) divs[cnt++] = x; for (int g = 2;; g++) { bool ok = true; for (int i = 0; i < cnt; i++) { if (pow_mod_constexpr(g, (m - 1) / divs[i], m) == 1) { ok = false; break; } } if (ok) return g; } } template constexpr int primitive_root = primitive_root_constexpr(m); // int ceil_pow2(int n) { int x = 0; while ((1U << x) < (unsigned int)(n)) x++; return x; } int bsf(unsigned int n) { return __builtin_ctz(n); } // struct modint_base {}; struct static_modint_base : modint_base {}; template using is_modint = std::is_base_of; template using is_modint_t = std::enable_if_t::value>; template * = nullptr> struct static_modint : internal::static_modint_base { using mint = static_modint; public: static constexpr int mod() { return m; } static mint raw(int v) { mint x; x._v = v; return x; } static_modint() : _v(0) {} template * = nullptr> static_modint(T v) { long long x = (long long)(v % (long long)(umod())); if (x < 0) x += umod(); _v = (unsigned int)(x); } template * = nullptr> static_modint(T v) { _v = (unsigned int)(v % umod()); } static_modint(bool v) { _v = ((unsigned int)(v) % umod()); } unsigned int val() const { return _v; } mint& operator++() { _v++; if (_v == umod()) _v = 0; return *this; } mint& operator--() { if (_v == 0) _v = umod(); _v--; return *this; } mint operator++(int) { mint result = *this; ++*this; return result; } mint operator--(int) { mint result = *this; --*this; return result; } mint& operator+=(const mint& rhs) { _v += rhs._v; if (_v >= umod()) _v -= umod(); return *this; } mint& operator-=(const mint& rhs) { _v -= rhs._v; if (_v >= umod()) _v += umod(); return *this; } mint& operator*=(const mint& rhs) { unsigned long long z = _v; z *= rhs._v; _v = (unsigned int)(z % umod()); return *this; } mint& operator/=(const mint& rhs) { return *this = *this * rhs.inv(); } mint operator+() const { return *this; } mint operator-() const { return mint() - *this; } mint pow(long long n) const { assert(0 <= n); mint x = *this, r = 1; while (n) { if (n & 1) r *= x; x *= x; n >>= 1; } return r; } mint inv() const { if (prime) { assert(_v); return pow(umod() - 2); } else { auto eg = internal::inv_gcd(_v, m); assert(eg.first == 1); return eg.second; } } friend mint operator+(const mint& lhs, const mint& rhs) { return mint(lhs) += rhs; } friend mint operator-(const mint& lhs, const mint& rhs) { return mint(lhs) -= rhs; } friend mint operator*(const mint& lhs, const mint& rhs) { return mint(lhs) *= rhs; } friend mint operator/(const mint& lhs, const mint& rhs) { return mint(lhs) /= rhs; } friend bool operator==(const mint& lhs, const mint& rhs) { return lhs._v == rhs._v; } friend bool operator!=(const mint& lhs, const mint& rhs) { return lhs._v != rhs._v; } private: unsigned int _v; static constexpr unsigned int umod() { return m; } static constexpr bool prime = internal::is_prime; }; template struct dynamic_modint : internal::modint_base { using mint = dynamic_modint; public: static int mod() { return (int)(bt.umod()); } static void set_mod(int m) { assert(1 <= m); bt = internal::barrett(m); } static mint raw(int v) { mint x; x._v = v; return x; } dynamic_modint() : _v(0) {} template * = nullptr> dynamic_modint(T v) { long long x = (long long)(v % (long long)(mod())); if (x < 0) x += mod(); _v = (unsigned int)(x); } template * = nullptr> dynamic_modint(T v) { _v = (unsigned int)(v % mod()); } dynamic_modint(bool v) { _v = ((unsigned int)(v) % mod()); } unsigned int val() const { return _v; } mint& operator++() { _v++; if (_v == umod()) _v = 0; return *this; } mint& operator--() { if (_v == 0) _v = umod(); _v--; return *this; } mint operator++(int) { mint result = *this; ++*this; return result; } mint operator--(int) { mint result = *this; --*this; return result; } mint& operator+=(const mint& rhs) { _v += rhs._v; if (_v >= umod()) _v -= umod(); return *this; } mint& operator-=(const mint& rhs) { _v += mod() - rhs._v; if (_v >= umod()) _v -= umod(); return *this; } mint& operator*=(const mint& rhs) { _v = bt.mul(_v, rhs._v); return *this; } mint& operator/=(const mint& rhs) { return *this = *this * rhs.inv(); } mint operator+() const { return *this; } mint operator-() const { return mint() - *this; } mint pow(long long n) const { assert(0 <= n); mint x = *this, r = 1; while (n) { if (n & 1) r *= x; x *= x; n >>= 1; } return r; } mint inv() const { auto eg = internal::inv_gcd(_v, mod()); assert(eg.first == 1); return eg.second; } friend mint operator+(const mint& lhs, const mint& rhs) { return mint(lhs) += rhs; } friend mint operator-(const mint& lhs, const mint& rhs) { return mint(lhs) -= rhs; } friend mint operator*(const mint& lhs, const mint& rhs) { return mint(lhs) *= rhs; } friend mint operator/(const mint& lhs, const mint& rhs) { return mint(lhs) /= rhs; } friend bool operator==(const mint& lhs, const mint& rhs) { return lhs._v == rhs._v; } friend bool operator!=(const mint& lhs, const mint& rhs) { return lhs._v != rhs._v; } private: unsigned int _v; static internal::barrett bt; static unsigned int umod() { return bt.umod(); } }; template internal::barrett dynamic_modint::bt = 998244353; //using modint998244353 = static_modint<998244353>; //using modint1000000007 = static_modint<1000000007>; //using modint = dynamic_modint<-1>; template using is_static_modint = std::is_base_of; template using is_static_modint_t = std::enable_if_t::value>; template struct is_dynamic_modint : public std::false_type {}; template struct is_dynamic_modint> : public std::true_type {}; template using is_dynamic_modint_t = std::enable_if_t::value>; // template * = nullptr> void butterfly(std::vector& a) { static constexpr int g = internal::primitive_root; int n = int(a.size()); int h = internal::ceil_pow2(n); static bool first = true; static mint sum_e[30]; // sum_e[i] = ies[0] * ... * ies[i - 1] * es[i] if (first) { first = false; mint es[30], ies[30]; // es[i]^(2^(2+i)) == 1 int cnt2 = bsf(mint::mod() - 1); mint e = mint(g).pow((mint::mod() - 1) >> cnt2), ie = e.inv(); for (int i = cnt2; i >= 2; i--) { // e^(2^i) == 1 es[i - 2] = e; ies[i - 2] = ie; e *= e; ie *= ie; } mint now = 1; for (int i = 0; i <= cnt2 - 2; i++) { sum_e[i] = es[i] * now; now *= ies[i]; } } for (int ph = 1; ph <= h; ph++) { int w = 1 << (ph - 1), p = 1 << (h - ph); mint now = 1; for (int s = 0; s < w; s++) { int offset = s << (h - ph + 1); for (int i = 0; i < p; i++) { auto l = a[i + offset]; auto r = a[i + offset + p] * now; a[i + offset] = l + r; a[i + offset + p] = l - r; } now *= sum_e[internal::bsf(~(unsigned int)(s))]; } } } template * = nullptr> void butterfly_inv(std::vector& a) { static constexpr int g = internal::primitive_root; int n = int(a.size()); int h = internal::ceil_pow2(n); static bool first = true; static mint sum_ie[30]; // sum_ie[i] = es[0] * ... * es[i - 1] * ies[i] if (first) { first = false; mint es[30], ies[30]; // es[i]^(2^(2+i)) == 1 int cnt2 = bsf(mint::mod() - 1); mint e = mint(g).pow((mint::mod() - 1) >> cnt2), ie = e.inv(); for (int i = cnt2; i >= 2; i--) { // e^(2^i) == 1 es[i - 2] = e; ies[i - 2] = ie; e *= e; ie *= ie; } mint now = 1; for (int i = 0; i <= cnt2 - 2; i++) { sum_ie[i] = ies[i] * now; now *= es[i]; } } for (int ph = h; ph >= 1; ph--) { int w = 1 << (ph - 1), p = 1 << (h - ph); mint inow = 1; for (int s = 0; s < w; s++) { int offset = s << (h - ph + 1); for (int i = 0; i < p; i++) { auto l = a[i + offset]; auto r = a[i + offset + p]; a[i + offset] = l + r; a[i + offset + p] = (unsigned long long)(mint::mod() + l.val() - r.val()) * inow.val(); } inow *= sum_ie[internal::bsf(~(unsigned int)(s))]; } } } template * = nullptr> std::vector _convolution(std::vector a, std::vector b) { int n = int(a.size()), m = int(b.size()); if (!n || !m) return {}; if (std::min(n, m) <= 60) { if (n < m) { std::swap(n, m); std::swap(a, b); } std::vector ans(n + m - 1); for (int i = 0; i < n; i++) { for (int j = 0; j < m; j++) { ans[i + j] += a[i] * b[j]; } } return ans; } int z = 1 << internal::ceil_pow2(n + m - 1); a.resize(z); internal::butterfly(a); b.resize(z); internal::butterfly(b); for (int i = 0; i < z; i++) { a[i] *= b[i]; } internal::butterfly_inv(a); a.resize(n + m - 1); mint iz = mint(z).inv(); for (int i = 0; i < n + m - 1; i++) a[i] *= iz; return a; } template ::value>* = nullptr> std::vector _convolution(const std::vector& a, const std::vector& b) { int n = int(a.size()), m = int(b.size()); if (!n || !m) return {}; using mint = internal::static_modint; std::vector a2(n), b2(m); for (int i = 0; i < n; i++) { a2[i] = mint(a[i]); } for (int i = 0; i < m; i++) { b2[i] = mint(b[i]); } auto c2 = _convolution(move(a2), move(b2)); std::vector c(n + m - 1); for (int i = 0; i < n + m - 1; i++) { c[i] = c2[i].val(); } return c; } std::vector convolution_ll(const std::vector& a, const std::vector& b) { int n = int(a.size()), m = int(b.size()); if (!n || !m) return {}; static constexpr unsigned long long MOD1 = 754974721; // 2^24 static constexpr unsigned long long MOD2 = 167772161; // 2^25 static constexpr unsigned long long MOD3 = 469762049; // 2^26 static constexpr unsigned long long M2M3 = MOD2 * MOD3; static constexpr unsigned long long M1M3 = MOD1 * MOD3; static constexpr unsigned long long M1M2 = MOD1 * MOD2; static constexpr unsigned long long M1M2M3 = MOD1 * MOD2 * MOD3; static constexpr unsigned long long i1 = internal::inv_gcd(MOD2 * MOD3, MOD1).second; static constexpr unsigned long long i2 = internal::inv_gcd(MOD1 * MOD3, MOD2).second; static constexpr unsigned long long i3 = internal::inv_gcd(MOD1 * MOD2, MOD3).second; auto c1 = internal::_convolution(a, b); auto c2 = internal::_convolution(a, b); auto c3 = internal::_convolution(a, b); std::vector c(n + m - 1); for (int i = 0; i < n + m - 1; i++) { unsigned long long x = 0; x += (c1[i] * i1) % MOD1 * M2M3; x += (c2[i] * i2) % MOD2 * M1M3; x += (c3[i] * i3) % MOD3 * M1M2; long long diff = c1[i] - internal::safe_mod((long long)(x), (long long)(MOD1)); if (diff < 0) diff += MOD1; static constexpr unsigned long long offset[5] = { 0, 0, M1M2M3, 2 * M1M2M3, 3 * M1M2M3}; x -= offset[diff % 5]; c[i] = x; } return c; } } ll mpow(ll a, ll b, ll MOD = -1){ ll ret = 1, num = a; while(b>0){ if(b%2) ret = (ret*num)%MOD; num = (num*num)%MOD; b /= 2; } return ret; } vector int32mod_conv(vector a, vector b, ll MOD, int MAXSIZE=-1){ if(MAXSIZE!=-1){ if(a.size()>MAXSIZE) a.resize(MAXSIZE); if(b.size()>MAXSIZE) b.resize(MAXSIZE); } if(MOD==998244353) return internal::_convolution<998244353, ll>(a, b); vector A = internal::_convolution<167772161>(a, b); vector B = internal::_convolution<469762049>(a, b); vector C = internal::_convolution<1224736769>(a, b); ll N = A.size(); vector ret(N); ll x = 167772161, y = 469762049, z = 1224736769; ll ix = mpow(x, y-2, y); ll ixy = mpow((x*y)%z, z-2, z); for(int i=0;iMAXSIZE) ret.resize(MAXSIZE); return ret; } //using modint998244353 = internal::static_modint<998244353>; //using modint1000000007 = internal::static_modint<1000000007>; //using modint = internal::dynamic_modint<-1>; template struct StaticModFPS: vector{ using vector::vector; using fps = StaticModFPS; StaticModFPS(vector v){ int n = v.size(); this->resize(n); for(int i=0;isize(); int m = vr.size(); if(n < m) this->resize(m); for(int i=0;i= MOD) (*this)[i] -= MOD; } return *this; } fps operator -= (const fps &vr){ int n = this->size(); int m = vr.size(); if(n < m) this->resize(m); for(int i=0;isize(); ll r = vr % MOD; if(r < 0) r += MOD; for(int i=0;i= MOD) (*this)[i] -= MOD; } return *this; } fps operator -= (const ll &vr){ int n = this->size(); ll r = vr % MOD; if(r<0) r += MOD; for(int i=0;isize(); ll r = vr % MOD; if(r<0) r += MOD; for(int i=0;isize(); for(int i=0;isize()); for(int i=0;isize(); for(int i=0;isize(), deg); return fps(this->begin(), this->begin() + n); } // https://en.wikipedia.org/wiki/Formal_power_series#Multiplicative_inverse // invertible in R[X] if and only if its constant coefficient a_{0} is invertible in R fps inv(int deg=-1){ assert((*this)[0]); int n = this->size(); if(deg==-1) deg = n; fps ret({mpow((*this)[0], MOD-2, MOD)}); for(int i=1;isize(); int m = vr.size(); if(n> mの場合, n, m共に小さい場合は愚直に計算したほうが早い // n < mの場合はn<-mとなるとして、 // n * m < 10^6 なら愚直 // n * m < 2*10^8　かつ n / m > 2000 template vector simpleMultipointEvaluation(const StaticModFPS &F, const vector &v){ int n = F.size(); int m = v.size(); vector ret(m, 0); for(int i=0;i vector MultipointEvaluation(StaticModFPS F, const vector &v){ typedef StaticModFPS fps; ll n = F.size(); ll m = v.size(); int add_coef = -1; if(MOD==998244353){ if(max(n, m)*m < 2000000LL || (max(n, m)*m<100000000LL&&n/m>2500LL)) { return simpleMultipointEvaluation(F, v); } }else{ if(max(n, m)*m < 15000000LL || (max(n, m)*m<100000000LL&&n/m>1000LL)) { return simpleMultipointEvaluation(F, v); } } if(n < m) { add_coef = m-1;//m-1次に1を足す F.resize(m); F[m-1] = 1; n = m; } int N = 1; while(N < m) N *= 2; vector tree(2*N-1, fps{1}); for(int i=0;i=0;i--){ tree[i] = tree[i*2+1] * tree[i*2+2]; } tree[0] = F.modulo(tree[0]); for(int i=1;i<2*N-1;i++){ int par = (i-1)/2; tree[i] = tree[par].modulo(tree[i]); } vector ret(m); for(int i=0;i ll adjacentInterpolation(vector x, const vector &y, ll p){ int n = x.size(); p = ((p%MOD) + MOD)%MOD; for(ll i=0;i StaticModFPS InterpolationbyDivideandConquer( const vector &fx, StaticModFPS F, const vector> &tree, int k, int l, int r){ if(r-l==1) return StaticModFPS{(fx[l]*mpow(F[0], MOD-2, MOD))%MOD}; int mid = (l+r)/2; if(tree[k*2+2].size()==0) return InterpolationbyDivideandConquer(fx, F, tree, k*2+1, l, mid); StaticModFPS left = InterpolationbyDivideandConquer(fx, F.modulo(tree[k*2+1]), tree, k*2+1, l, mid); StaticModFPS right = InterpolationbyDivideandConquer(fx, F.modulo(tree[k*2+2]), tree, k*2+2, mid, r); return left * tree[k*2+2] + right * tree[k*2+1]; } template StaticModFPS PolynomialInterpolation(const vector &xi, const vector &fx){ typedef StaticModFPS fps; int n = xi.size(); int N = 1; while(N tree(2*N-1, fps{}); for(int i=0;i=0;i--){ if(tree[i*2+2].size()==0) tree[i] = tree[i*2+1]; else tree[i] = tree[i*2+1] * tree[i*2+2]; } for(ll i=0;i(fx, tree[0], tree, 0, 0, N).prefix(n); } // O(N^2logN) (deg(f)=deg(g)=deg(ans)=Nとして) template StaticModFPS simpleComposition(const StaticModFPS &f, const StaticModFPS &g, int deg){ int n = f.size(); StaticModFPS c(deg, 0), gpower{1}; for(int i=0;i deg) gpower.resize(deg); } return c; } // reference: http://www.eecs.harvard.edu/~htk/publication/1978-jacm-brent-kung.pdf // N-1次多項式 f(x)にM-1次多項式 g(x)を合成した結果を求める // deg(f) = deg(g) = deg(ans) = Nとして、 // f(x)をk:=ceil(√N+1)ブロックに平方分割すると　f(x) = f_0(x) + f_1(x) x^k ... と約k項になる // f((g(x))) = f_0(g(x)) + f_1(g(x))g(x)^k + ... // 1. f_i(g(x))はk項とN項の合成なので、g(x)^i (0<=i<=k)を前処理しておくとO(Nk) // 2. g(x)^kiを求める、かけるのは共に一回あたりO(NlogN) // (1, 2)をkブロック分行うのでO(k × (Nk + NlogN)) = O(N^2 + N^1.5 logN) template StaticModFPS Composition(const StaticModFPS &f, const StaticModFPS &g, int deg){ typedef StaticModFPS fps; int n = f.size(); int k = (int)sqrt(n); if(k*k gpower(k+1, {1}); for(int i=1;i<=k;i++){ gpower[i] = gpower[i-1] * g; if(gpower[i].size()>deg) gpower[i].resize(deg); } vector fi(k, fps(deg, 0)); for(int i=0;i=n) break; int sz = gpower[j].size(); for(int t=0;t deg) gd.resize(deg); } return ret; } template ll PowerSum(ll n, ll k){ vector x(k+2), y(k+2); for(int i=0;i=MOD) y[i] -= MOD; if(i==n) return y[i]; } return adjacentInterpolation(x, y, n); } int main(){ ll n, k;scanf("%lld %lld", &n, &k); std::cout << PowerSum<1000000007>(n, k) << '\n'; /* ll r, d, n;scanf("%lld %lld %lld", &r, &d, &n); vector x(d+2), y(d+2); ll P = 998244353, tmp = 0; ll rs = 1; for(int i=0;i= P) tmp -= P; x[i] = i, y[i] = tmp; rs = (rs * r)%P; } if(n==0) { std::cout << 0 << '\n'; return 0; } if(n(x, y, n-1) << '\n'; */ }