#include using namespace std; using ll=long long; const ll ILL=2167167167167167167; const int INF=2100000000; #define rep(i,a,b) for (int i=(int)(a);i<(int)(b);i++) #define all(p) p.begin(),p.end() template using pq_ = priority_queue, greater>; template int LB(vector &v,T a){return lower_bound(v.begin(),v.end(),a)-v.begin();} template int UB(vector &v,T a){return upper_bound(v.begin(),v.end(),a)-v.begin();} template bool chmin(T &a,T b){if(b bool chmax(T &a,T b){if(a void So(vector &v) {sort(v.begin(),v.end());} template void Sore(vector &v) {sort(v.begin(),v.end(),[](T x,T y){return x>y;});} bool yneos(bool a,bool upp=false){if(a){cout<<(upp?"YES\n":"Yes\n");}else{cout<<(upp?"NO\n":"No\n");}return a;} template void vec_out(vector &p,int ty=0){ if(ty==2){cout<<'{';for(int i=0;i<(int)p.size();i++){if(i){cout<<",";}cout<<'"'< T vec_min(vector &a){assert(!a.empty());T ans=a[0];for(auto &x:a) chmin(ans,x);return ans;} template T vec_max(vector &a){assert(!a.empty());T ans=a[0];for(auto &x:a) chmax(ans,x);return ans;} template T vec_sum(vector &a){T ans=T(0);for(auto &x:a) ans+=x;return ans;} int pop_count(long long a){int res=0;while(a){res+=(int)(a&1),a>>=1;}return res;} template T square(T a){return a * a;} #include using mint = atcoder::modint; void solve(); // DEAR MYSTERIES / TOMOO int main() { ios::sync_with_stdio(false); cin.tie(nullptr); int t = 1; cin >> t; rep(i, 0, t) solve(); } void solve(){ int N, P; cin >> N >> P; vector> G(N + 1); vector A(N), seen(N); rep(i, 0, N) cin >> A[i], A[i]--; vector ans(N, -1); rep(i, 0, N) { vector p; while (seen[i] == 0) { // cout << i << " " << A[i] << endl; int nx = A[i]; p.push_back(nx); seen[i] = 1; i = nx; } reverse(all(p)); if ((int)p.size() % 2 == 1) { if ((int)p.size() == 1) { ans[i] = i; } else { mint::set_mod(p.size()); auto tmp = (mint(1) / (2 * P)); rep(j, 0, p.size()) { ans[p[j]] = p[(j + tmp).val()]; } } } else if (G[p.size()].empty()) { G[p.size()] = (p); } else { mint::set_mod(p.size()); int tmp = (mint(P)).inv().val(); mint::set_mod(p.size() * 2); vector q; rep(j, 0, p.size()) { q.push_back(G[p.size()][j]); q.push_back(p[j]); } rep(j, 0, q.size()) { ans[q[j]] = q[((mint)j + tmp).val()]; } G[p.size()].clear(); } } vector merge; for (auto x : G) for (auto y : x) merge.push_back(y); if ((int)merge.size() == 2) { ans[merge[0]] = merge[0]; ans[merge[1]] = merge[0]; } else if (!merge.empty()) { int fr = merge.front(); merge.erase(merge.begin()); mint::set_mod(merge.size()); mint tmp = (mint(2 * P)).inv(); rep(j, 0, merge.size()) { ans[merge[j]] = merge[(j + tmp).val()]; } ans[fr] = ans[merge.back()]; } for (auto &x : ans) x++; vec_out(ans); for (auto &x : ans) x--; if (false) { int ng = 0; rep(i, 0, N) { int a = A[i]; rep(rp, 0, 2 * P) a = ans[a]; if (a != i) ng++; } cout << ng << endl; } } /* * 奇数サイクル : * 1 / 2p = a (mod sz) * として、a 個先に行けばいい * * 偶数サイクル : * 二つあるなら、 * 2p * a = 2 (mod 2 * sz) * p * a = 1 (mod sz) * として、a 個先に行く * そうでないとき、いくつかの要素が余る * このサイクルの個数は多分 sqrt(N) 未満 * だとしてもむずい * 2, 4 のサイクルのとき、どう組めばいいのかわかっていない * 5 のサイクルを作って、それに 2 由来のものを 1 つクッつければいい * 偶数サイクルはをひと繋ぎにして、1 つだけ外す * そして、1 / 2p = a (mod (sum sz - 1)) を求め、それだけ進める * できたサイクルに、いい感じになる箇所を見つけ、そこに最後の一つを入れる */