結果
| 問題 |
No.1013 〇マス進む
|
| コンテスト | |
| ユーザー |
marurunn11
|
| 提出日時 | 2024-01-18 21:42:04 |
| 言語 | C++17(gcc12) (gcc 12.3.0 + boost 1.87.0) |
| 結果 |
TLE
|
| 実行時間 | - |
| コード長 | 16,770 bytes |
| コンパイル時間 | 12,555 ms |
| コンパイル使用メモリ | 290,312 KB |
| 最終ジャッジ日時 | 2025-02-18 20:26:26 |
|
ジャッジサーバーID (参考情報) |
judge3 / judge2 |
(要ログイン)
| ファイルパターン | 結果 |
|---|---|
| sample | AC * 3 |
| other | AC * 12 TLE * 1 -- * 49 |
ソースコード
#pragma GCC target("avx2")
#pragma GCC optimize("O3")
#pragma GCC optimize("unroll-loops")
#include "bits/stdc++.h"
//#include <atcoder/all>
//using namespace atcoder;
using namespace std;
#ifdef _MSC_VER
#include <intrin.h> //gcc上ではこれがあると動かない。__popcnt, umul128 等用のincludeファイル。
#define __builtin_popcount __popcnt
#define __builtin_popcountll __popcnt64
// 1 の位から何個 0 が連なっているか。(0 入れると 0 を返す。)
inline unsigned int __builtin_ctz(unsigned int x) { unsigned long r; _BitScanForward(&r, x); return r; }
inline unsigned int __builtin_ctzll(unsigned long long x) { unsigned long r; _BitScanForward64(&r, x); return r; }
// 2進での leading 0 の個数。(0 入れると 32, 64 を返す。)
inline unsigned int __builtin_clz(unsigned x) { return (unsigned int)__lzcnt(x); }
inline unsigned int __builtin_clzll(unsigned long long x) { return (unsigned int)__lzcnt64(x); }
#pragma warning(disable : 4996)
#pragma intrinsic(_umul128)
#include <boost/multiprecision/cpp_int.hpp>
#define __int128 boost::multiprecision::int128_t
#endif
//---------- 多倍長関連 ----------
//#include <boost/multiprecision/cpp_int.hpp>
//#include <boost/multiprecision/cpp_dec_float.hpp>
//namespace mp = boost::multiprecision;
typedef long long ll;
typedef long double ld;
#define int long long
#define LL128 boost::multiprecision::int128_t
#define LL boost::multiprecision::cpp_int
#define LD50 boost::multiprecision::cpp_dec_float_50
#define LD100 boost::multiprecision::cpp_dec_float_100
#define rep(i, n) for(long long i = 0; i < (n); ++i)
#define REP(i, s, n) for(long long i = (s); i < (n); ++i)
#define rrep(i, n) for(long long i = (n) - 1; i >= 0; --i)
#define sqrt(d) pow((ld) (d), 0.50)
#define PII pair<int, int>
#define ALL(v) v.begin(), v.end()
constexpr int INF2 = std::numeric_limits<int>::max() / 2 - 10000000;
constexpr long long INF = std::numeric_limits<long long>::max() / 2 - 10000000;
const ld pi = acos(-1);
//constexpr int MOD = 1000000007; //1e9 + 7
constexpr int MOD = 998244353; // 7 * 17 * 2^23 + 1
//---------- chmax, min 関連 ----------
template<class T> inline void chmax(T& a, T b) {
if (a < b) a = b;
}
template<class T> inline void chmin(T& a, T b) {
if (a > b) a = b;
}
//繰り返し2乗法 (非再帰)
//N^aの、Mで割った余りを求める。
template<typename T = long long>
constexpr T my_pow(T N, long long a, T M) {
assert(0 <= a);
T x = N % M, res = (T)1;
while (a) {
if (a & 1) {
res *= x;
res %= M;
}
x *= x; // x は *this の (2のべき乗) 乗を管理する。
x %= M;
a >>= 1;
}
return res;
}
// 繰り返し2乗法 (非再帰)
// T = modint でも動く。
template<typename T = long long>
constexpr T my_pow(T N, long long a) {
assert(0 <= a);
T x = N, res = (T)1;
while (a) {
if (a & 1) res *= x;
x *= x; // x は *this の (2のべき乗) 乗を管理する。
a >>= 1;
}
return res;
}
// base を基数としたときの、n の i 桁目を、res[i] に入れる。
template<typename T = long long>
vector<signed> ll_to_vector(T n, signed base = 10) {
assert(base > 0);
if (n == 0) return { 0 };
vector<signed> res;
while (n) {
T q = n / base;
res.emplace_back(n - q * base);
n = q;
}
return res;
}
//O (sqrt(n)) で素数判定する用。
constexpr bool is_prime(long long N) {
//有名素数
if (N == 1000000007 || N == 1000000009) return true;
if (N == 998244353 || N == 167772161 || N == 469762049 || N == 1224736769) return true; //g = 3;
if (N == 924844033 || N == 1012924417) return true; //g = 5;
if (N == 163577857) return true; //g = 23;
//小さい素数の別処理
if (N <= 1) return false;
if (N == 2 || N == 3) return true;
if (N % 2 == 0) return false;
if (N % 3 == 0) return false;
for (long long i = 1; (6 * i + 1) * (6 * i + 1) <= N; ++i) {
if (N % (6 * i + 1) == 0) return false;
}
for (long long i = 0; (6 * i + 5) * (6 * i + 5) <= N; ++i) {
if (N % (6 * i + 5) == 0) return false;
}
return true;
}
template <int n> constexpr bool is_prime_constexpr = is_prime(n);
class UnionFind {
private:
vector<int> parent;
vector<int> rank;
vector<int> v_size;
vector<int> v_rep; //代表元
public:
UnionFind(int N) : parent(N), rank(N, 0), v_size(N, 1), v_rep(N, 1) {
rep(i, N) {
parent[i] = i;
v_rep[i] = i;
}
}
int root(int x) {
if (parent[x] == x) return x;
return parent[x] = root(parent[x]); //経路圧縮
}
void unite(int x, int y) {
int rx = root(x);
int ry = root(y);
if (rx == ry) return; //xの根とyの根が同じなので、何もしない。
if (rank[rx] < rank[ry]) {
parent[rx] = ry;
v_size[ry] += v_size[rx];
}
else {
parent[ry] = rx;
v_size[rx] += v_size[ry];
if (rank[rx] == rank[ry]) ++rank[rx];
}
}
bool same(int x, int y) {
return (root(x) == root(y));
}
int count_tree() {
int N = parent.size();
int res = 0;
rep(i, N) {
if (root(i) == i) ++res;
}
return res;
}
int size(int x) {
return v_size[root(x)];
}
//代表元のセット (x を含む集合の代表元を x にする)
void set_rep(int x) {
assert(0 <= x && x < (int)parent.size());
int rx = root(x);
v_rep[rx] = x;
}
//x を含む集合の代表元を返す。
int get_rep(int x) {
assert(0 <= x && x < (int)parent.size());
int rx = root(x);
return v_rep[rx];
}
};
// 幾何。二点間距離。
template<typename T = long double>
T calc_dist(int x1, int y1, int x2, int y2) {
long long tempo = (x1 - x2) * (x1 - x2) + (y1 - y2) * (y1 - y2);
T res = pow((T)tempo, 0.50);
return res;
}
//ランレングス圧縮
//T は string 等のコンテナである型。要素 c と連続個数の pair を返す。
template<typename T>
auto RunLength(const T& S) {
vector<pair<typename T::value_type, int>> res;
if (S.empty()) return res;
res.push_back({ S[0], 1 });
for (int i = 1; i < (int)S.size(); i++) {
if (res.back().first == S[i]) ++res.back().second;
else res.push_back({ S[i], 1 });
}
return res;
}
void printf_ld(long double res) {
printf("%.12Lf\n", res);
//cout << std::fixed << std::setprecision(12) << res << endl;
}
template <class X>
void print_vec(const X& v) {
if (v.empty()) cout << endl;
for (typename X::const_iterator iter = std::begin(v); iter != std::end(v); ++iter) {
if (iter != --std::end(v)) cout << *iter << " ";
else cout << *iter << endl;
}
}
template <class X>
void print_vec_debug(const X& v) {
if (v.empty()) std::cerr << endl;
for (typename X::const_iterator iter = std::begin(v); iter != std::end(v); ++iter) {
if (iter != --std::end(v)) std::cerr << *iter << " ";
else std::cerr << *iter << endl;
}
}
//mint 構造体。自動で mod を取る。
//m はコンパイル時に決まる定数である必要があるので、入力を用いることはできない。
//割り算に m の素数判定が必要になり、is_prime に依存するようになった。
//※ constexpr 関数の const 修飾は C++11 では許されない。
template<int m, typename T = long long> class mint {
private:
T _val;
public:
//---------- コンストラクタ ----------
constexpr mint(T v = 0LL) noexcept : _val(v% m) {
if (_val < 0) _val += m;
}
constexpr T val() const noexcept {
return _val;
}
//------------------------------ 二項演算子のオーバーロード ------------------------------
constexpr mint& operator += (const mint& r) noexcept {
_val += r._val;
if (_val >= m) _val -= m;
return *this;
}
constexpr mint& operator -= (const mint& r) noexcept {
_val -= r._val;
if (_val < 0) _val += m;
return *this;
}
constexpr mint& operator *= (const mint& r) noexcept {
_val *= r._val; _val %= m;
return *this;
}
constexpr mint& operator /= (const mint& r) noexcept {
if (!prime) {
//a * u + b * v = 1 を互除法で解く。但し、gcd(a, m) == 1 でなければならない。
T a = r._val, b = m, u = 1, v = 0;
while (b) {
T q = a / b;
a -= q * b; swap(a, b); //互除法。余りをとって swap。
u -= q * v; swap(u, v);
}
//assert(a == 1); //gcd(r._val, m) == 1;
_val *= u; _val %= m;
if (_val < 0) _val += m;
}
else {
//フェルマーの小定理。底が prime である場合のみ使用可能。
*this *= r.modpow(m - 2);
}
return *this;
}
constexpr mint operator + (const mint& r) const noexcept { return mint(*this) += r; }
constexpr mint operator - (const mint& r) const noexcept { return mint(*this) -= r; }
constexpr mint operator * (const mint& r) const noexcept { return mint(*this) *= r; }
constexpr mint operator / (const mint& r) const noexcept { return mint(*this) /= r; }
constexpr bool operator == (const mint& r) const noexcept {
return this->_val == r._val;
}
constexpr bool operator != (const mint& r) const noexcept {
return this->_val != r._val;
}
//------------------------------ 単項演算子のオーバーロード ------------------------------
//---------- 前置インクリメントのオーバーロード ----------
constexpr mint operator ++() noexcept { this->_val++; if (this->_val == m) this->_val = 0; return mint(*this); }
constexpr mint operator --() noexcept { if (this->_val == 0) this->_val = m; this->_val--; return mint(*this); }
//---------- 後置インクリメントのオーバーロード ----------
constexpr mint operator++(signed) noexcept { mint temp(_val); ++_val; if (_val == m) _val = 0; return temp; }
constexpr mint operator--(signed) noexcept { mint temp(_val); if (_val == 0) _val = m; --_val; return temp; }
constexpr mint operator -() const noexcept { return mint(-_val); }
//---------- 入出力のオーバーロード ----------
friend constexpr ostream& operator << (ostream& os, const mint<m, T>& x) noexcept {
return os << x._val;
}
friend istream& operator >> (istream& is, mint<m, T>& x) noexcept {
T init_val;
is >> init_val;
x = mint<m, T>(init_val);
return is;
}
//---------- 逆元 ----------
constexpr mint<m, T> inverse() const noexcept {
mint<m, T> e(1);
return e / (*this);
}
private:
// 愚直な O(sqrt(m)) の素数判定; 余りに m が大きすぎると、コンパイル時の定数式の評価に失敗するが、1e11 程度までなら大丈夫。
// Miller-Rabin を使ってもよい。
static constexpr bool prime = is_prime_constexpr<m>;
//---------- 繰り返し二乗法 ----------
constexpr mint<m, T> modpow(long long n) const noexcept {
assert(0 <= n);
mint<m, T> x = *this, r = 1;
while (n) {
if (n & 1) r *= x;
x *= x; // x は *this の (2のべき乗) 乗を管理する。
n >>= 1;
}
return r;
}
};
using modint = mint<MOD, long long>;
vector<modint> dp_fac;
vector<modint> dp_fac_inv;
// x! まで計算するときに最初に呼び出す。O(x).
template<typename T = modint>
void fac_initialize(int x, vector<T>& dp = dp_fac, vector<T>& dp_inv = dp_fac_inv) {
if ((int)dp.size() <= x) {
int n = dp.size(); if (n == 0) ++n;
dp.resize(x + 1, (T)1);
for (int i = n; i <= x; ++i) {
dp.at(i) = dp.at(i - 1) * i;
}
}
if ((int)dp_inv.size() <= x) {
int n = dp_inv.size();
dp_inv.resize(x + 1, (T)1);
dp_inv.at(x) /= dp.at(x);
for (int i = x - 1; i >= n; --i) {
dp_inv.at(i) = dp_inv.at(i + 1) * (i + 1);
}
}
}
// 階乗。x ! まで計算する。結果は dp (デフォルトで dp_fac<modint>) に保存する。
// long long にするためには、第二引数に vector<long long> を指定する必要がある。20 ! = 2.43e18 まで long long に入る。
template<typename T = modint>
T factorial(int x, vector<T>& dp = dp_fac) {
assert(x >= 0);
//既に計算済み
if ((int)dp.size() > x) {
return dp.at(x);
}
int n = dp.size();
//dp サイズを x + 1 に伸ばす。
for (int i = n; i < x + 1; i++) {
if (i == 0) dp.push_back((T)1);
else dp.push_back(dp.back() * i);
}
return dp.at(x);
}
template<typename T = modint>
T factorial_inv(int x, vector<T>& dp = dp_fac_inv) {
assert(x >= 0);
//既に計算済み
if ((int)dp.size() > x) {
return dp.at(x);
}
int n = dp.size();
//dp サイズを x + 1 に伸ばす。
for (int i = n; i < x + 1; i++) {
if (i == 0) dp.push_back((T)1);
else dp.push_back(dp.back() / i);
}
return dp.at(x);
}
// 二項係数 N_C_a
template<typename T = modint, typename U = int>
T my_comb(U N, U a, vector<T>& dp = dp_fac, vector<T>& dp_inv = dp_fac_inv) {
if (N < a) return (T)0;
T ans = factorial<T>(N, dp);
ans *= factorial_inv<T>(a, dp_inv);
ans *= factorial_inv<T>(N - a, dp_inv);
return ans;
}
//二項係数 N_C_a (1点計算用)
template<typename T, typename U = int>
T my_comb2(U N, U a) {
if (N < a) return (T)0;
T answer = 1;
for (U i = (U)0; i < a; i++) {
answer *= (N - i);
answer /= i + 1;
}
return answer;
}
ld now_clock() {
ld t = (ld)clock() / (ld)CLOCKS_PER_SEC;
return t;
}
//周期問題を解く。
template<typename U = long long>
class vec_loop {
private:
int s = -1; // loopの開始位置
int period = -1; //loopの周期
U sum_period = 0; //1周期での和
vector<U> vec; //本体のベクトル
vector<U> sum_vec = { 0 }; // vec の和
unordered_map<U, int> cnt; //要素の出現回数を記録。(2になったらループ発生)
unordered_map<U, int> index_mp; //index_mp[vec[i]] = i
vector<U> max_sum_vec_base; //ループ前の [0, i) における和の最大値
vector<U> max_sum_vec_loop; //ループ内の [s, s + i) における和の最大値
public:
//コンストラクタ
vec_loop() : s(-1), period(-1), sum_vec(1, 0) {};
//配列に push_back して、ループ検出した場合 true を返す。
//基本的に最初にこれを true を返すまでやって、配列を構築する。
bool push_back(U y) {
assert(s == -1 && period == -1);
++cnt[y];
if (cnt[y] == 2) {
//ループを検出した。
s = index_mp[y];
period = vec.size() - s;
sum_period = sum_vec.back() - sum_vec[s];
assert(vec[s] == y);
for (int i = 0; i <= s; ++i) {
U tmp = max_sum_vec_base.empty() ? 0 : max_sum_vec_base.back();
tmp = max(tmp, sum_vec[i]);
max_sum_vec_base.push_back(tmp);
}
for (int i = s; i <= (int)vec.size(); ++i) {
U tmp = max_sum_vec_loop.empty() ? 0 : max_sum_vec_loop.back();
tmp = max(tmp, sum_vec[i] - sum_vec[s]);
max_sum_vec_loop.push_back(tmp);
}
return true;
}
else {
//ループを検出しなかった。
index_mp[y] = vec.size();
vec.push_back(y);
sum_vec.push_back(y + sum_vec.back());
return false;
}
}
//i 番目の値を返す。
U at(const long long i) {
assert(0 <= i);
if (i < (int)vec.size()) {
return vec[i];
}
else {
assert(s != -1 && period != -1);
return vec.at(s + (i - s) % period);
}
}
U operator[](const int i) { return at(i); };
//[0, r) の区間和
U sum(long long r) {
assert(0 <= r);
if (r <= (int)vec.size()) {
return sum_vec[r];
}
else {
assert(s != -1 && period != -1);
return sum_vec[s + (r - s) % period] + sum_period * ((r - s) / period);
}
}
//[l, r) の区間和
U sum(long long l, long long r) {
assert(0 <= l && l <= r);
return sum(r) - sum(l);
}
//[0, r) の 和の最大値
U max_sum(long long r) {
assert(s != -1 && period != -1);
if (r <= s) return max_sum_vec_base[r];
long long cnt_loop = (r - s) / period;
U res = max_sum_vec_base.back();
res += cnt_loop * max((U)0, sum_period) + max_sum_vec_loop[(r - s) - cnt_loop * period]; //右辺は 0 以上
if (cnt_loop > 0) res = max(res, max_sum_vec_base.back() + max_sum_vec_loop.back());
return res;
}
std::size_t size() {return vec.size();}
};
signed main() {
ll N, K;
cin >> N >> K;
vector<int> P(N);
rep(i, N) cin >> P[i];
rep(i, N) P.push_back(P[i]);
vector<int> revP(N + 1, 0);
rep(i, N) revP[P[i]] = i;
vector<int> to(N + 1);
vector<vector<int>> from(N + 1);
rep(i, N) {
to[P[i]] = P[i + P[i]];
from[P[i + P[i]]].push_back(P[i]);
}
vector<int> res0(N + 1, -1);
REP(i, 1, N + 1) {
if (!from[P[i]].empty()) continue;
vec_loop vec;
int now = i;
while (true) {
bool flag = vec.push_back(now);
if (flag) break;
now = to[now];
}
rep(i, (int)vec.size()) {
res0[vec[i]] = vec.sum(i, i + K);
}
}
REP(i, 1, N + 1) {
if (res0[i] != -1) continue;
vec_loop vec;
int now = i;
while (true) {
bool flag = vec.push_back(now);
if (flag) break;
now = to[now];
}
//cerr << "i == " << i << endl;
//cerr << "P[i] == " << P[i] << endl;
//rep(j, (int)vec.size()) cerr << vec[j] << " ";
//cerr << endl;
rep(i, (int)vec.size()) {
res0[vec[i]] = vec.sum(i, i + K);
}
}
REP(i, 0, N) {
cout << res0[P[i]] + i + 1 << endl;
}
}
marurunn11