#if !defined(MYLOCAL)//提出時用テンプレート #pragma GCC optimize("Ofast") #if defined(NDEBUG) #undef NDEBUG #endif #include "bits/stdc++.h" #if !defined(_MSC_VER) && __has_include() #include using namespace atcoder; #endif using namespace std; using ll=long long; using dd=double; using vll=vector< ll>; using vdd=vector< dd>; using vvll=vector< vll>; using vvdd=vector; using vvvll=vector< vvll>; using vvvdd=vector; using vvvvll=vector; using pll=pair; using tll=tuple; using qll=tuple; using vpll=vector< pll>; using vtll=vector< tll>; using vqll=vector< qll>; using vvpll=vector; using vvtll=vector; using vvqll=vector; using namespace chrono; constexpr ll INF = 1001001001001001001; struct Fast{ Fast(){ cin.tie(0); ios::sync_with_stdio(false); cout<::max_digits10); } } fast; #define REPS(i, S, E) for (ll i = (S); i <= (E); i++) #define REP(i, N) REPS(i, 0, (N)-1) #define DEPS(i, S, E) for (ll i = (E); i >= (S); i--) #define DEP(i, N) DEPS(i, 0, (N)-1) #define EXPAND( x ) x//VS用おまじない #define overload3(_1,_2,_3,name,...) name #define overload4(_1,_2,_3,_4,name,...) name #define overload5(_1,_2,_3,_4,_5,name,...) name #define rep3(i, S, E) for (ll i = (S); i <= (E); i++) #define rep4(i, S, E, t) for (ll i = (S); i <= (E); i+=(t)) #define rep(...) EXPAND(overload4(__VA_ARGS__,rep4,rep3,_,_)(__VA_ARGS__)) #define dep3(i, E, S) for (ll i = (E); i >= (S); i--) #define dep4(i, E, S, t) for (ll i = (E); i >= (S); i-=(t)) #define dep(...) EXPAND(overload4(__VA_ARGS__, dep4, dep3,_,_)(__VA_ARGS__)) #define each2(e,v) for (auto && e:v) #define each3(a,b,v) for (auto &&[a,b]:v) #define each4(a,b,c,v) for (auto &&[a,b,c]:v) #define each5(a,b,c,d,v) for (auto &&[a,b,c,d]:v) #define each(...) EXPAND(overload5(__VA_ARGS__,each5,each4,each3,each2,_)(__VA_ARGS__)) #define ALL1(v) (v).begin(), (v).end() #define ALL2(v,E) (v).begin(), (v).begin()+((E)+1) #define ALL3(v,S,E) (v).begin()+(S), (v).begin()+((E)+1) #define ALL(...) EXPAND(overload3(__VA_ARGS__, ALL3, ALL2, ALL1)(__VA_ARGS__)) #define all ALL #define RALL1(v) (v).rbegin(), (v).rend() #define RALL2(v,E) (v).rbegin(), (v).rbegin()+((E)+1) #define RALL3(v,S,E) (v).rbegin()+(S), (v).rbegin()+((E)+1) #define RALL(...) EXPAND(overload3(__VA_ARGS__, RALL3, RALL2, RALL1)(__VA_ARGS__)) #define rall RALL template inline bool chmax(T &a, T b) { if (a < b) { a = b; return true; }return false; } template inline bool chmin(T &a, T b) { if (a > b) { a = b; return true; }return false; } template inline T MaxE(vector&v,ll S,ll E){ T m=v[S]; rep(i,S,E)chmax(m,v[i]); return m; } template inline T MinE(vector&v,ll S,ll E){ T m=v[S]; rep(i,S,E)chmin(m,v[i]); return m; } template inline T MaxE(vector &v) { return MaxE(v,0,(ll)v.size()-1); } template inline T MinE(vector &v) { return MinE(v,0,(ll)v.size()-1); } template inline auto maxe(T &&v,ll S,ll E){ return *max_element(ALL(v,S,E)); } template inline auto maxe(T &&v){ return *max_element(ALL(v)); } template inline auto mine(T &&v,ll S,ll E){ return *min_element(ALL(v,S,E)); } template inline auto mine(T &&v){ return *min_element(ALL(v)); } template inline T Sum(vector &v,ll S,ll E){ T s=T(); rep(i,S,E)s+=v[i]; return s; } template inline T Sum(vector &v) { return Sum(v,0,v.size()-1); } template::type::value_type> inline U sum(T &&v,ll S,ll E) {return accumulate(all(v,S,E),U());} template inline auto sum(T &&v) {return sum(v,0,v.end()-v.begin()-1);} template inline ll sz(T &&v){ return (ll)v.size(); } inline ll CEIL(ll a,ll b){ return (a<0) ? -(-a/b) : (a+b-1)/b; } //負もOK inline ll FLOOR(ll a,ll b){ return -CEIL(-a,b); } //負もOK //pair用テンプレート template inline pair& operator+=(pair &a,const pair &b){ a.first+=b.first; a.second+=b.second; return a; } template inline pair& operator-=(pair &a,const pair &b){ a.first-=b.first; a.second-=b.second; return a; } template inline pair& operator*=(pair &a,const pair &b){ a.first*=b.first; a.second*=b.second; return a; } template inline pair& operator/=(pair &a,const pair &b){ a.first/=b.first; a.second/=b.second; return a; } template inline pair& operator%=(pair &a,const pair &b){ a.first%=b.first; a.second%=b.second; return a; } template inline pair& operator+=(pair &a,R b){ a.first+=b; a.second+=b; return a; } template inline pair& operator-=(pair &a,R b){ a.first-=b; a.second-=b; return a; } template inline pair& operator*=(pair &a,R b){ a.first*=b; a.second*=b; return a; } template inline pair& operator/=(pair &a,R b){ a.first/=b; a.second/=b; return a; } template inline pair& operator%=(pair &a,R b){ a.first%=b; a.second%=b; return a; } template inline pair operator+(const pair &a,R b){ pair c=a; return c+=b; } template inline pair operator-(const pair &a,R b){ pair c=a; return c-=b; } template inline pair operator*(const pair &a,R b){ pair c=a; return c*=b; } template inline pair operator/(const pair &a,R b){ pair c=a; return c/=b; } template inline pair operator%(const pair &a,R b){ pair c=a; return c%=b; } template inline pair operator-(R b,const pair &a){ pair c=-a; return c+=b; } template inline pair operator-(const pair &a,const pair &b){ pair c=a; return c-=b; } template inline pair operator-(const pair &a){ pair c=a; return c*=(-1); } template inline ostream &operator<<(ostream &os,const pair &a){ return os << a.first << ' ' << a.second; } //tuple用テンプレート 出力用のみ template inline ostream &operator<<(ostream &os,const tuple &a){ return os << get<0>(a) << ' ' << get<1>(a) << ' ' << get<2>(a); } template inline ostream &operator<<(ostream &os,const tuple &a){ return os << get<0>(a) << ' ' << get<1>(a) << ' ' << get<2>(a) << ' ' << get<3>(a); } //vector用テンプレート template inline ostream &operator<<(ostream &os,const vector &a){ for (ll i=0; i<(ll)a.size(); i++) os<<(i>0?" ":"")<) #include using namespace atcoder; #endif struct{ system_clock::time_point st = system_clock::now(); ll operator()()const{return duration_cast(system_clock::now()-st).count()/1000;} } timeget; ////////////////////////////////////////// namespace fpsspace{ using Int = long long; using ll = long long; constexpr int inf=int(1e9); /********* utility関数 *********/ template T POW(T a,ll n){//a^n n負も可 if (n<0) a=T(1)/a,n=-n; T r=1; for (; n>0; n>>=1,a*=a) if (n&1)r*=a; return r; } ll LimitMul(ll a,ll b,ll l=ll(9e18)){//min(a*b,l) a,b≧0 return (b==0 || a<=l/b) ? a*b : l; } /*---- 1/i列挙 i=1~d ----*/ template struct Wrap{};//オーバロード解決用にKindを型に変換 template> vector &Invs(int d,Wrap){//Kind=1 or 2(modint系)の時 static vector invs(2,T(1)); int MOD = T::mod(); for (int i=(int)invs.size();i<=d;++i) invs.push_back(-invs[MOD%i]*T(MOD/i)); return invs; } template vector &Invs(int d,Wrap<0>){//その他の時 static vector invs(1); for (int i=(int)invs.size();i<=d;++i) invs.push_back(T(1)/i); return invs; } template vector &Fact(int d){// i!列挙 i=0~d static vector fact(1,T(1)); for (int i=(int)fact.size();i<=d;++i) fact.push_back(fact.back()*T(i)); return fact; } template vector &FInv(int d){// 1/i!列挙 i=0~d static vector finv(1,T(1)); const vector &invs=Invs(d,Wrap{}); for (int i=(int)finv.size();i<=d;++i) finv.push_back(finv.back()*invs[i]); return finv; } // Berlekamp Massey法 2L-1次までのA(x)からA=P/QのQをL次で復元 Kind=1,2のみ template vector BerlekampMassey(const vector &a){ vector C={1},B={1};//C:求める数列、B:1つ前のCの状態を保存 int m=1; //ポインタ?っぽいもの T b=T(1); //前回のdの値 auto C_update=[](vector &C,T d,T b,vector &B,int m){ T d_b=d/b; int M=(int)B.size(); if ((int)C.size() tmp=C; C_update(C,d,b,B,m); //C -= d/b * (Bをmだけ右シフトしたもの) B.swap(tmp); b=d; m=0; } else C_update(C,d,b,B,m); //C -= d/b * (Bをmだけ右シフトしたもの) } m++; } return C; } template FPS de_sparse( //a*F'=b*Fを満たすF const SPFPS &a_,const SPFPS &b_,S f0,Int dmx_,const vector &invs_=vector()) { assert(a_.lowdeg()<=b_.lowdeg()); int dmx=(int)dmx_; const vector &invs = invs_.size() ? invs_ : Invs(dmx,Wrap{}); SPFPS a=a_.shift(-a_.lowdeg()),b=b_.shift(-a_.lowdeg()); T a0inv=T(1)/a.co(0); a*=a0inv,b*=a0inv; a.erase(a.begin()); FPS f({T(f0)},dmx); for (int d=1;d<=dmx;++d){ for (auto [bb,i]:b){ if (d-1-i>=0) f.at(d)+=bb*f[d-1-i]; } for (auto [aa,i]:a){ if (d-i>=0) f.at(d)-=aa*f[d-i]*(d-i); } f.at(d)*=invs[d]; } return f; } /********* 疎FPSクラス *********/ template struct sparseFps: vector>{ using vector>::vector; //親クラスのコンストラクタの隠蔽を回避 sparseFps &Norm(){//d昇順、同一dのco加算、co=0を削除 sort(this->begin(),this->end(), [](const auto &x,const auto &y){return x.secondsize();++i){ if (j>=0 && deg(j)==deg(i)){ co(j)+=co(i); } else{ if (!(j>=0 && co(j)==T(0))) ++j; (*this)[j]=(*this)[i]; } } if (j>=0 && co(j)==T(0)) --j; this->resize(j+1); return *this; } /*---- I/F ----*/ template void set(S co,R deg){ this->emplace_back(T(co),Int(deg)); } Int deg()const{ return this->empty() ? -1 : this->back().second; }//最高次数 T co(Int i)const{ return (*this)[i].first; }//(*this)[i]の係数 T &co(Int i) { return (*this)[i].first; } Int deg(Int i)const{ return (*this)[i].second; }//(*this)[i]の次数 Int °(Int i) { return (*this)[i].second; } Int lowdeg()const{ return this->empty() ? inf : this->front().second; } sparseFps &operator+=(const sparseFps &sg){ this->insert(this->end(),sg.begin(),sg.end()); return Norm(); } sparseFps operator+(const sparseFps &sg)const{ return sparseFps(*this)+=sg; } sparseFps &operator*=(T b){ for (auto&&[c,_]:*this) c*=b; return *this; } sparseFps operator*(T b)const{ return sparseFps(*this)*=b; } sparseFps &operator*=(const sparseFps &sg){ return *this=*this*sg; } sparseFps operator*(const sparseFps &sg)const{ sparseFps ret; for (auto&&[cf,df]:*this) for (auto&&[cg,dg]:sg) ret.set(cf*cg,df+dg); return ret.Norm(); } sparseFps shift(Int k)const{ // *x^k sparseFps ret; for (auto&&[co,d]:*this) if (d+k>=0) ret.set(co,d+k); return ret; } sparseFps diff()const{ sparseFps ret; for (auto&&[co,d]:*this) if (d>0) ret.set(co*d,d-1); return ret; } template FPS exp(Int dmx)const{ assert(lowdeg()!=0); //定数項=0必須 return de_sparse(sparseFps{{1,0},},diff(),1,dmx); } template FPS pow(ll k,Int dmx,const vector &invs_=vector())const{ assert(!(k<0 && lowdeg()>0));//k負なら定数項必須 if (k==0) return FPS({1},dmx); //-- 計算後最高次数d:k<0ならdmx、k>0ならmin(dmx,deg()*k)まで int d = (k<0 || LimitMul(deg(),k)>(ll)dmx) ? int(dmx) : int(deg()*k); //-- invs[i]=1/iをi=1~dまで計算(計算済み分は再利用、足りない分だけ計算) const vector &invs = invs_.size() ? invs_ : Invs(d,Wrap{}); //-- 最低次数関連処理 int s=(int)lowdeg();//計算前最低次数 if (k>0 && LimitMul(s,k)>(ll)dmx) return FPS(dmx);//計算後all0の時 //-- 漸化式で計算 T f0inv=T(1)/co(0); FPS g({POW(co(0),k)},dmx); for (int i=1;i<=d-s*k;++i){ //k負の時必ずs=0なのでOK for (int j=1;j<(int)this->size();++j){ auto [c,dg]=(*this)[j]; int b=int(dg)-s; if (i-b<0)break; g.at(i)+=c*g.at(i-b)*(T(k)*b-i+b); } g.at(i)*=f0inv*invs[i]; } return g.shift(Int(s*k)); } }; /********* FPSクラス *********/ template< class T, //係数の型 int Kind //係数の種類 0:その他、1:NTTfriendly mod、2:任意mod > struct Fps: vector{ static_assert(0<=Kind && Kind<=3); static constexpr int kind=Kind; int dMx=int(1e6); //次数上限(x^dMxより上は保持しない) using vT = vector; /*---- utility ----*/ int isize()const{ return (int)vector::size(); } int NormSize()const{//leading zeroを除いたサイズ const用 int sv=isize(); while (sv>0 && (*this)[sv-1]==T(0)) --sv; return sv; } int Deg()const{ return NormSize()-1; } //最高次数 const用 Fps &Cut(){ return cut(dMx); } Fps &ZeroExtend(){ int anm=max(0,dMx-isize()+1); vT::insert(vT::end(),anm,T(0)); return *this; } int MinD(const Fps &g)const{ return min(dMx,g.dMx); } void MergeD(const Fps &g){ dMx=MinD(g); Cut(); } template Fps &Add(const Fps &g){ MergeD(g); for (int i=min(dMx,g.Deg());i>=0;--i) at(i)+=Sign*g[i]; return *this; } Fps ProdSparse(const sparseFps &g,int d)const{//f*疎g mod x^(d+1) Fps ret(d); for (auto&&[co,dg]:g) for (int i=0;i<(int)isize();++i){ if (dg+i>d) break; ret.at(dg+i)+=co*(*this)[i]; } return ret; } Fps InvSparse(const sparseFps &g,int d)const{//f/疎g mod x^(d+1) g0≠0 assert(!g.empty() && g.deg(0)==0 && g.co(0)!=0); //-- g定数項を1にする T c0inv=T(1)/g.co(0); Fps ret=((*this)*c0inv).setdmx(d); if (g.size()==1u) return ret; sparseFps gg=g*c0inv; //-- 配るDP計算 for (int i=0; i+(int)gg.deg(1)<=d; ++i){ for (int j=1; j<(int)gg.size(); ++j){ auto [co,dg]=gg[j]; int ii=i+(int)dg; if (d &g,ll k,const vector &invs_=vector()) { assert(g.size()==2U && g.co(0)==T(1) && g.deg(0)==0); const vector &invs = invs_.size() ? invs_ : Invs(dMx,Wrap{}); int b=(int)g.deg(1); T c=g.co(1)*k; for (int i=1;i*b<=dMx;++i,c*=-g.co(1)) at(i*b)+=c*invs[i]; return *this; } /*---- コンストラクタ ----*/ explicit Fps(Int dmx=int(1e6)): dMx(int(dmx)){} Fps(initializer_list i,Int dmx=int(1e6)): vT(i.begin(),i.end()),dMx(int(dmx)){ Cut(); } template ::iterator_category> Fps(It l,It r,Int dmx=int(1e6)): vT(l,r),dMx(int(dmx)){ Cut(); } Fps(vector &&v,Int dmx=int(1e6)): vT(move(v)),dMx(int(dmx)){} Fps(const sparseFps &sf,Int dmx=int(1e6)):dMx(int(dmx)){ //疎f → f for (auto&&[co,deg]:sf) if (deg<=dmx) at(deg)=co; } /*---- I/F ----*/ sparseFps tosparse()const{ //f → 疎f sparseFps ret; for (int i=0;i::size(); } Int deg(){ fit(); return size()-1; } Int lowdeg()const{ for (int i=0;iresize(i+1); return (*this)[i]; } Fps &fit(){ this->resize(NormSize()); return *this; } Fps &operator+=(const Fps &g){ return Add<1>(g); } Fps &operator-=(const Fps &g){ return Add<-1>(g); } Fps &operator*=(const Fps &g){ return *this=*this*g; } Fps &operator/=(const Fps &g){ return *this=*this/g; } Fps &operator*=(const sparseFps &g){ return *this=*this*g; } Fps &operator/=(const sparseFps &g){ return *this=*this/g; } Fps &operator+=(T c){ at(0)+=c; return *this; } Fps &operator-=(T c){ at(0)-=c; return *this; } Fps &operator*=(T c){ for (auto&& e: *this) e*=c; return *this; } Fps &operator/=(T c){ return (*this)*=T(1)/c; } Fps operator+(const Fps &g)const{ return Fps(*this)+=g; } Fps operator-(const Fps &g)const{ return Fps(*this)-=g; } Fps operator*(const Fps &g)const{ return Prod(*this,g,MinD(g)); } Fps operator/(const Fps &g)const{ return InvSparse(g.tosparse(),MinD(g)); } Fps operator*(const sparseFps &g)const{ return ProdSparse(g,dMx); } Fps operator/(const sparseFps &g)const{ return InvSparse(g,dMx); } Fps operator+(T c)const{ return Fps(*this)+=c; } Fps operator-(T c)const{ return Fps(*this)-=c; } Fps operator*(T c)const{ return Fps(*this)*=c; } Fps operator/(T c)const{ return Fps(*this)/=c; } Fps operator-()const{ return Fps(*this)*=T(-1); } friend Fps operator+(T c,const Fps &f){ return f+c; } friend Fps operator-(T c,const Fps &f){ return -f+c; } friend Fps operator*(T c,const Fps &f){ return f*c; } T prod1(const Fps &g,Int k_)const{ //[x^k]f*g int df=Deg(),dg=g.Deg(),k=(int)k_; if (MinD(g)=0; ++i,--j) ret+=(*this)[i]*g[j]; return ret; } T bostanmori(const Fps &g,ll k)const{ //[x^k]f/g assert(g.at(0)!=0); Fps P=Fps(*this).setdmx(inf),Q=Fps(g).setdmx(inf); for (; k>0; k>>=1){ Fps Q1=Q; for (int i=1;i f; for (int i=0;i<=d;++i) f.push_back(at(i)); vector Q=BerlekampMassey(f); Int dmx=Int(Q.size()-1); return Fps(move(Q),dmx); } T nthterm(Int d,ll k)const{ //[x^k]f 線形漸化式を仮定しx^d(d奇数)までから推定 Fps Q=berlekamp_massey(d); Fps P=Prod(*this,Q,Q.dMx-1).fit(); return P.bostanmori(Q,k); } Fps &estimate(Int d,Int dmx=-1){ //dmx次まで推定 線形漸化式を仮定しx^d(d奇数)までから推定 if (dmx==-1) dmx=dMx; Fps Q=berlekamp_massey(d); Fps P=Prod(*this,Q,Q.dMx-1).fit().setdmx(dmx); return *this=(Q.setdmx(dmx).inv()*P).ZeroExtend(); } Fps &cut(Int d){ //x^dまでにする if (d+1=max(0,-k);--i) ret.at(i+k)=(*this)[i]; return ret; } T eval(T x)const{ //f(c) T ret=T(0); for (int i=isize()-1;i>=0;--i) ret*=x,ret+=(*this)[i]; return ret; } Fps diff()const{ //微分 Fps ret(dMx-1); for (int i=Deg();i>=1;--i) ret.at(i-1)=(*this)[i]*i; return ret; } Fps integ()const{ //積分 Fps ret(dMx+1); for (int i=min(Deg(),dMx); i>=0; --i) ret.at(i+1)=(*this)[i]/(i+1); return ret; } T integrange(T l,T r)const{ //定積分 ∫_l^r f dx Fps itg=integ(); return itg.eval(r)-itg.eval(l); } Fps inv()const{ assert(at(0)!=0);//定数項≠0 Fps g{T(1)/at(0)}; for (int i=1;iint(dMx/k)) return Fps(dMx);//f(x)=0か結果=0の時 int m=int(dMx+1-z*k); //最終は先頭にゼロがz*k個→計算はdMx+1-z*k項でok Fps g=shift(-z).setdmx(m-1)/at(z); //定数項1にする変換 Fps gk=(g.log()*k).exp(); //g^k Fps ret=(gk*POW(at(z),k)).setdmx(dMx).shift(Int(z*k)); //変換を戻す return ret; } Fps powdbl(ll k)const{ //f^k Fps ret({1},dMx),g=*this; for (; k>0; k>>=1,g*=g) if (k&1)ret*=g; return ret; } Fps powsparse(ll k,const vector &invs=vector())const{ //疎f^k return tosparse().template pow(k,dMx,invs); } pair div(const Fps &g)const{ //多項式f/g,f%g const Fps &f=*this; int na=f.NormSize(),nb=g.NormSize(); assert(nb>0); int n=na-nb+1;//商の項数 if (n<=0) return {Fps(dMx),f}; int nu=f.isize(),nv=g.isize(); Fps aR(f.rbegin()+nu-na,f.rbegin()+min(nu-na+n,nu),n-1); Fps bR(g.rbegin()+nv-nb,g.rbegin()+min(nv-nb+n,nv),n-1); Fps qR=bR.inv()*aR; qR.resize(n); reverse(qR.begin(),qR.end()); qR.fit().setdmx(dMx); Fps r=(f-Prod(qR,g,dMx)).fit(); return {move(qR),move(r)}; } }; /********* 積をNTTmod畳み込み、任意mod畳み込み、畳み込み不使用から選択 *********/ template //f*g mod x^(d+1) 畳み込み不使用 Fps Prod(const Fps &f,const Fps &g,int d){ return f.ProdSparse(g.tosparse(),d); } template //f*g mod x^(d+1) NTTmod畳み込み Fps Prod(const Fps &f,const Fps &g,int d){ int nf=min(d+1,f.NormSize()),ng=min(d+1,g.NormSize()); vector ff,gg; ff.reserve(nf),gg.reserve(ng); for (int i=0;i hh=convolution(ff,gg); if ((int)hh.size()>d+1) hh.resize(d+1); return Fps(hh.begin(),hh.end(),d); } template //f*g mod x^(d+1) 任意mod畳み込み Fps Prod(const Fps &f,const Fps &g,int d){ static constexpr int m0 = 167772161; //m0 ff,gg; ff.reserve(nf),gg.reserve(ng); for (int i=0;i h0=convolution(ff,gg); vector h1=convolution(ff,gg); vector h2=convolution(ff,gg); Fps ret(d); int nn=min(d+1,(int)h0.size()); ret.reserve(nn); for (int i=0;i Fps Prod(const Fps &f,const Fps &g,int d){ vector ff(f.begin(),f.end()),gg(g.begin(),g.end()); vector hh = ArbitraryModConvolution::CooleyTukey::multiply(ff,gg); if ((int)hh.size()>d+1) hh.resize(d+1); return Fps(hh.begin(),hh.end(),d); } #endif /********* I/F関数 *********/ template FPS prodtwopow(//f^k*g^m sparseFps f_,ll k,sparseFps g_,ll m,Int dmx, const vector &invs=vector()) { if (k==0) f_={{T(1),0},},k=1; if (m==0) g_={{T(1),0},},m=1; Int fz=f_.lowdeg(),gz=g_.lowdeg(); assert(!(fz==Int(1e9) && k<0) && !(gz==Int(1e9) && m<0));//f=0かつk>0はNG if (fz==Int(1e9) || gz==Int(1e9)) return FPS(dmx);//f=0なら結果=0 ll z=fz*k+gz*m; //k,m巨大時のoverflowは未対応とする assert(z>=0); if (ll(dmx) f=f_.shift(-fz),g=g_.shift(-gz); Int dmx2=dmx-z; sparseFps a=f*g,b=f.diff()*g*k+f*g.diff()*m; T h0=POW(f.co(0),k)*POW(g.co(0),m); FPS h=de_sparse(a,b,h0,dmx2,invs); return h.setdmx(dmx).shift(Int(z)); } }//namespace fpsspace #if 0 using fpsT = dd; using fps = fpsspace::Fps; //0:畳み込み不使用 #elif 0 using fpsT = mll; using fps = fpsspace::Fps; //1:NTTfriendly mod #elif 1 using fpsT = atcoder::modint; using fps = fpsspace::Fps; //2:任意mod #elif 0 using fpsT = dd; using fps = fpsspace::Fps; //3:FFT #endif using spfps = fpsspace::sparseFps; /* - 各種演算の結果の次数上限は、一部例外を除きf,gの小さい方となる。 - 疎FPSクラスは次数昇順、係数≠0必須 - -------- コンストラクタ -------- fps f; //f(x)=0 次数上限1e6 fps f(d); // 〃 〃 d fps f{2,3,4,}; //f(x)=2+3x+4x^2 次数上限1e6 fps f({2,3,4,},d); // 〃 〃 d fps f(all(v)); //vll等のvをコピー 次数上限1e6 fps f(all(v),d); // 〃 〃 d - -------- コンストラクタ疎版 -------- vectorと同じ spfps sf={{4,2},{-1,5}}; //f(x)=4x^2-x^5 sf.set(c,d); //c*x^dを末尾に追加 - -------- 演算子(fps同士) -------- f+=g f-=g f+g f-g -f 疎f+=疎g 疎f*=疎g 疎f+疎g 疎f*疎g f*=g f*g //NTTmod,任意mod,愚直がテンプレートで切り替わる f*=疎g f*疎g //愚直 f/=g f/=疎g f/g f/疎g //漸化式で愚直 g定数項≠0 - -------- 演算子(定数) -------- f+=c f-=c f*=c f/=c f+c f-c f*c f/c 疎f*=c 疎f*c - -------- アクセス・操作 -------- f[i]=val; //直接操作 f.at(i)=val; //自動サイズ調整有 ll n=f.size(); //項数(次数+1) leading zero含む ll d=f.deg(); //非0の最高次の次数 f(x)=0の時-1 ll d=f.lowdeg(); //非0の最低次の次数 f(x)=0の時1e9 f.setdmx(d); //次数上限をx^dにセット & mod x^(d+1) d≧0 f.fit(); //最高次≠0になるよう縮める fps f(sf); //疎f→f 変換 fps f(sf,d); //疎f→f 変換 次数上限d spfps sf=f.tosparse(); //f→疎f 変換 - -------- 演算 -------- mll c=f.prod1(g,k); //[x^k]f*g mll c=f.bostanmori(g,k);//[x^k]f/g g定数項≠0 k巨大(10^18)でもOK f.cut(d); //x^dまでにする f.mod(n); //mod x^n fps g=f.shift(k); //f*x^k k負も可 spfps sg=sf.shift(k); //疎f*x^k k負も可 mll val=f.eval(c); //f(c) fps g=f.diff(); //微分 fps g=f.integ(); //積分 mll val=f.integrange(l,r); //定積分 ∫_l^r f dx fps g=f.inv(); //1/f 定数項≠0 fps g=f.log(); //log f 定数項=1 fps g=f.exp(); //exp f 定数項=0 fps g=sf.exp(d); //exp 疎f 定数項=0 fps g=f.pow(k); //f^k k負は未対応 fps g=f.powdbl(k); //f^k doubling版 fps g=sf.pow(k,d); //疎f^k 次数上限d k負も可(定数項≠0必須) fps g=f.powsparse(k); //疎f^k k負も可(定数項≠0必須) auto[h,r]=f.div(g); //多項式の除算・剰余 h=f/g,r=f%g 次数上限はfの方 fps Q=f.berlekamp_massey(); //f=P/QのQを復元 fは2d-1次、Qはd次 Qのdmx=d mll c=f.nthterm(k); //[x^k]f 線形漸化式を仮定 k巨大(10^18)でもOK f.estimate(); //次数上限まで推定 線形漸化式を仮定 f.estimate(d); //d次まで推定 線形漸化式を仮定 fps F=fpsspace::de_sparse(sf,sg,F0,d); //微分方程式 疎f*F'=疎g*F 次数上限d fps h=fpsspace::prodtwopow(sf,k,sg,m,d); //疎f^k*疎g^m 次数上限d k,m負も可 */ namespace fpsspace{ template Fps prodallPque(vector> &fs){ using FPS=Fps; if (fs.empty()) return FPS{1}; auto comp=[](const FPS &a,const FPS &b){ return a.size() > b.size(); }; priority_queue,decltype(comp)> pq(comp); for (FPS &f: fs) pq.push(move(f)); while (pq.size()>1U){ FPS f=move(pq.top()); pq.pop(); FPS g=move(pq.top()); pq.pop(); pq.push(f*g); } return move(pq.top()); } template Fps prodall(vector> &fs){ using FPS=Fps; if (fs.empty()) return FPS{1}; deque dq; for (FPS &f: fs) dq.push_back(move(f)); while (dq.size()>1U){ dq.push_back(dq[0]*dq[1]); dq.pop_front(); dq.pop_front(); } return move(dq[0]); } /* - -------- 総積 Πfs[i] fsは破壊される fps g=fpsspace::prodallPque(fs); //priority_queue版 fps g=fpsspace::prodall(fs); //deque版 */ } template struct combination_{ vector f,g; ll mxN=0; combination_(){} combination_(ll maxN): f(maxN+1,1),g(maxN+1),mxN(maxN) { for (ll i=1;i<=mxN;++i) { f[i]=f[i-1]*i; } g[mxN]=1/f[mxN]; for (ll i=mxN;i>=1;--i) { g[i-1]=g[i]*i; } } T P(ll n,ll r){ return (n<0 || r<0 || n vector CnLnR(long long nL,long long nR,long long r,SP sp){ if (nR-nL+1<=0) return vector(); if (r<0) return vector(nR-nL+1,0); vector v=sp(nL-r+1,nR-r+1,r); for (T& e: v) e*=finv(r); return v; } template vector HrLrR(long long n,long long rL,long long rR,SP sp){//r<0不可 return CnLnR(n-1+rL,n-1+rR,n-1,sp); } }; using combination = combination_; void cin2solve() { ll n,m,P; cin >> n >> m >> P; modint::set_mod((int)P); combination cmb(n); vector fs; rep(i,1,n) fs.push_back(fps{1,i}); fps g=fpsspace::prodall(fs); modint ans=0; rep(k,1,m){ modint va=cmb(m,k); va*=cmb.P(n-k,m-k); va*=g.at(k); ans+=va; } ans/=cmb.P(n,m); cout << ans.val() << '\n'; return; } ////////////////////////////////////////// int main(){ #if 1 //SolvingSpace::labo(); cin2solve(); //SolvingSpace::generand(); #else ll t; cin >> t; rep(i,0,t-1){ SolvingSpace::cin2solve(); //SolvingSpace::generand(); } #endif cerr << timeget() <<"ms"<< '\n'; return 0; }