#ifndef HIDDEN_IN_VS // 折りたたみ用 // 警告の抑制 #define _CRT_SECURE_NO_WARNINGS // ライブラリの読み込み #include using namespace std; // 型名の短縮 using ll = long long; using ull = unsigned long long; // -2^63 ～ 2^63 = 9 * 10^18（int は -2^31 ～ 2^31 = 2 * 10^9） using pii = pair; using pll = pair; using pil = pair; using pli = pair; using vi = vector; using vvi = vector; using vvvi = vector; using vvvvi = vector; using vl = vector; using vvl = vector; using vvvl = vector; using vvvvl = vector; using vb = vector; using vvb = vector; using vvvb = vector; using vc = vector; using vvc = vector; using vvvc = vector; using vd = vector; using vvd = vector; using vvvd = vector; template using priority_queue_rev = priority_queue, greater>; using Graph = vvi; // 定数の定義 const double PI = acos(-1); const vi DX = { 1, 0, -1, 0 }; // 4 近傍（下，右，上，左） const vi DY = { 0, 1, 0, -1 }; int INF = 1001001001; ll INFL = 4004004003104004004LL; // (int)INFL = 1010931620; // 入出力高速化 struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp; // 汎用マクロの定義 #define all(a) (a).begin(), (a).end() #define sz(x) ((int)(x).size()) #define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), x)) #define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), x)) #define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");} #define YES(b) {cout << ((b) ? "YES\n" : "NO\n");} #define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順 #define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順 #define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順 #define repe(v, a) for(const auto& v : (a)) // a の全要素（変更不可能） #define repea(v, a) for(auto& v : (a)) // a の全要素（変更可能） #define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索（昇順） #define repis(i, set) for(int i = lsb(set), bset##i = set; i >= 0; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素（昇順） #define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て（昇順） #define smod(n, m) ((((n) % (m)) + (m)) % (m)) // 非負mod #define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去 #define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了 #define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 矩形内判定 // 汎用関数の定義 template inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; } template inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新（更新されたら true を返す） template inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新（更新されたら true を返す） template inline T get(T set, int i) { return (set >> i) & T(1); } // 演算子オーバーロード template inline istream& operator>>(istream& is, pair& p) { is >> p.first >> p.second; return is; } template inline istream& operator>>(istream& is, vector& v) { repea(x, v) is >> x; return is; } template inline vector& operator--(vector& v) { repea(x, v) --x; return v; } template inline vector& operator++(vector& v) { repea(x, v) ++x; return v; } #endif // 折りたたみ用 #if __has_include() #include using namespace atcoder; #ifdef _MSC_VER #include "localACL.hpp" #endif //using mint = modint1000000007; using mint = modint998244353; //using mint = modint; // mint::set_mod(m); namespace atcoder { inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; } inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; } } using vm = vector; using vvm = vector; using vvvm = vector; using vvvvm = vector; #endif #ifdef _MSC_VER // 手元環境（Visual Studio） #include "local.hpp" #else // 提出用（gcc） inline int popcount(int n) { return __builtin_popcount(n); } inline int popcount(ll n) { return __builtin_popcountll(n); } inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : -1; } inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : -1; } inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; } inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; } #define dump(...) #define dumpel(v) #define dump_list(v) #define dump_mat(v) #define input_from_file(f) #define output_to_file(f) #define Assert(b) { if (!(b)) while (1) cout << "OLE"; } #endif ll TLE(int n, int k, ll l, ll u, vl a) { if (n == 1) return 0; ll w = u - l; multiset s; rep(i, n) s.insert(a[i]); ll s_min = *min_element(all(a)); ll s_max = *max_element(all(a)); ll res = 0; while (s_max - s_min > w) { auto itl = s.begin(); auto itr = prev(s.end()); ll dl = *next(itl) - *itl; ll dr = *itr - *prev(itr); if (dl < dr) { ll v = *itr; s.erase(itr); s.insert(v - k); s_max = *prev(s.end()); res++; } else { ll v = *itl; s.erase(itl); s.insert(v + k); s_min = *s.begin(); res++; } } dump(s); return res; } ll TLE2(int n, int k, ll l, ll u, vl a) { if (n == 1) return 0; ll w = u - l; multiset s; rep(i, n) s.insert(a[i]); ll s_min = *min_element(all(a)); ll s_max = *max_element(all(a)); ll res = 0; while (s_max - s_min > w) { auto itl = s.begin(); auto itr = prev(s.end()); ll dl = *next(itl) - *itl; ll dr = *itr - *prev(itr); if (dl < dr) { ll v = *itr; s.erase(itr); s.insert(v - (dr + k - 1) / k * k); s_max = *prev(s.end()); res += (dr + k - 1) / k; } else { ll v = *itl; s.erase(itl); s.insert(v + (dl + k - 1) / k * k); s_min = *s.begin(); res += (dl + k - 1) / k; } } return res; } //【三分探索（下に凸）】O(log(r - l)) /* * 階差の符号変化が - → 0 → + である関数 f(x) の開区間 (l..r) における最小値を与える x を返す． */ template ll ternary_search_lc(ll l, ll r, const FUNC& f) { // verify : https://atcoder.jp/contests/abc279/tasks/abc279_d while (r - l > 2) { ll s = l + r; ll m1 = s / 2 - (s % 2 < 0); ll m2 = m1 + 1; if (f(m1) > f(m2)) l = m1; else r = m2; } return l + 1; /* f の定義の雛形 auto f = [&](ll x) { return x; }; */ } //【ウェーブレット行列】 /* * Wavelet_matrix(vT a) : O(n log n) * 整数列 a[0..n) で初期化する． * * T get(int i) : O(log n) * 昇順で i 番目の要素を返す． * * T get(int l, int r, int i) : O(log n)) * a[l..r) の中で昇順で i 番目の要素を返す． * * int count(int l, int r, T v) : O(log n) * a[l..r) に v が何個あるかを返す． * * int count(int l, int r, T v0, T v1) : O(log n) * a[l..r) の中で [v0..v1) に値をもつ要素の個数を返す． * 注意：点群 {(i, a[i])} に対し，矩形内に存在する点の個数を求めているとも解釈できる． * * int position(T v, int c) : O((log n)^2) * 昇順で c 番目の v の位置を返す． * * ll sum(int l, int r) : O(1) * a[l..r) の和を返す． * * ll sum(int l, int r, T v0, T v1) : O(log n) * a[l..r) の中で [v0..v1) に値をもつ要素の和を返す． * * ll abs_sum(int l, int r, T v) : O(log n) * Σi∈[l..r) |a[i] - v| を返す． */ template class Wavelet_matrix { // 参考 : https://miti-7.hatenablog.com/entry/2018/04/28/152259 int n; // 要素数 int k; // msb 以下の桁数 vi bs; // bs[i][j] : 第 j+1 ビットについての安定ソート後の a[i] の第 j ビット array bs_acc; // bs_acc[b] : bs[*][b] のビット b=0,1 それぞれの個数の累積和 vi num_zeros; // num_zeros[j] : bs[j] の 0 の個数 vi id; // 値 → 安定ソートが終わったときの最左位置 vector> acc; // acc[j] : 第 j ビットについての安定ソート後の a の累積和 vector val; // 座圧前の値のユニークな昇順列 // a[0..r) に v が何個あるかを返す． int count_sub(int r, int v) { // 一つも無ければすぐに 0 を返す． if (!id[v]) return 0; // 最上位ビットから順に見ていく repir(j, k - 1, 0) { // 注目ビットに応じて次の位置を求めていく． if (v >> j & 1) { r = num_zeros[j] + bs_acc[1][j][r]; } else { r = bs_acc[0][j][r]; } } return r - id[v]; } // a[l..r) の中で [0..v) に値をもつ要素の個数を返す． int count_rsub(int l, int r, int v) { int cnt = 0; repir(j, k - 1, 0) { if (v >> j & 1) { cnt += bs_acc[0][j][r] - bs_acc[0][j][l]; r = num_zeros[j] + bs_acc[1][j][r]; l = num_zeros[j] + bs_acc[1][j][l]; } else { r = bs_acc[0][j][r]; l = bs_acc[0][j][l]; } } return cnt; } // a[l..r) の中で [0..v) に値をもつ要素の和を返す． T sum_rsub(int l, int r, int v) { T res = 0; repir(j, k - 1, 0) { if (v >> j & 1) { res += acc[j][bs_acc[0][j][r]] - acc[j][bs_acc[0][j][l]]; r = num_zeros[j] + bs_acc[1][j][r]; l = num_zeros[j] + bs_acc[1][j][l]; } else { r = bs_acc[0][j][r]; l = bs_acc[0][j][l]; } } return res; } public: // 整数列 t で初期化する． Wavelet_matrix(const vector& a) : n(sz(a)) { // verify : https://judge.yosupo.jp/problem/static_range_frequency // a[0..n) を座標圧縮して t[0..n) にする． val = a; uniq(val); val.emplace_back((T)INFL + 1); vi t(n); rep(i, n) t[i] = lbpos(val, a[i]); k = msb(sz(val)) + 1; bs = vi(n); bs_acc[0] = bs_acc[1] = vvi(k, vi(n + 1)); num_zeros = vi(k); id = vi(sz(val), -1); acc = vector>(k + 1, vector(n + 1)); // j : 注目ビット位置（上位ビットから順に見ていく） repir(j, k - 1, 0) { rep(i, n) { // 注目ビットが 1 か bs[i] += t[i] & T(1) << j; // ビット 0, 1 それぞれの個数の累積和を求めておく． rep(b, 2) bs_acc[b][j][i + 1] = bs_acc[b][j][i]; if (t[i] >> j & 1) { bs_acc[1][j][i + 1]++; } else { bs_acc[0][j][i + 1]++; num_zeros[j]++; } // 要素の累積和の計算 acc[j + 1][i + 1] = acc[j + 1][i] + val[t[i]]; } // 注目ビットが 0 のものを左，1 のものを右に寄せる安定ソートを行う． vi nt0, nt1; rep(i, n) { if (t[i] >> j & 1) nt1.push_back(t[i]); else nt0.push_back(t[i]); } t.clear(); repe(x, nt0) t.push_back(x); repe(x, nt1) t.push_back(x); } rep(i, n) { // 値 → 安定ソートが終わったときの最左位置 if (id[t[i]] != -1) id[t[i]] = i; // 要素の累積和の計算 acc[0][i + 1] = acc[0][i] + val[t[i]]; } } Wavelet_matrix() : n(0), k(0) {} // 昇順で c 番目の v の位置を返す． int position(T v, int c) { int ord = lbpos(val, v); if (val[ord] != v) return -1; int i = id[ord] + c; rep(j, k) { if (ord >> j & 1) { i = ubpos(bs_acc[1][j], i - num_zeros[j]) - 1; } else { i = ubpos(bs_acc[0][j], i - num_zeros[j]) - 1; } } return i; } // 昇順で i 番目の要素を返す． T get(int i) { Assert(0 <= i && i < n); int ord = 0; // 最上位ビットから順に見ていく repir(j, k - 1, 0) { ord <<= 1; // 注目ビットに応じて次の位置を求めつつ，値を更新していく． if (bs[i] >> j & 1) { ord++; i = num_zeros[j] + bs_acc[1][j][i]; } else { i = bs_acc[0][j][i]; } } return val[ord]; } // a[l..r) のうち昇順で i 番目の要素を返す． T get(int l, int r, int i) { // verify : https://judge.yosupo.jp/problem/range_kth_smallest chmax(l, 0); chmin(r, n); Assert(0 <= i && i < r - l); int ord = 0; repir(j, k - 1, 0) { ord <<= 1; int cnt0 = bs_acc[0][j][r] - bs_acc[0][j][l]; if (i >= cnt0) { ord++; l = num_zeros[j] + bs_acc[1][j][l]; r = num_zeros[j] + bs_acc[1][j][r]; i -= cnt0; } else { l = bs_acc[0][j][l]; r = bs_acc[0][j][r]; } } return val[ord]; } // a[l..r) に v が何個あるかを返す． int count(int l, int r, T v) { // verify : https://judge.yosupo.jp/problem/static_range_frequency chmax(l, 0); chmin(r, n); if (l >= r) return 0; int ord = lbpos(val, v); if (val[ord] != v) return 0; return count_sub(r, ord) - count_sub(l, ord); } // a[l..r) の中で [v0..v1) に値をもつ要素の個数を返す． int count(int l, int r, T v0, T v1) { // verify : https://atcoder.jp/contests/arc097/tasks/arc097_c chmax(l, 0); chmin(r, n); if (l >= r || v0 >= v1) return 0; int ord0 = lbpos(val, v0); int ord1 = lbpos(val, v1); return count_rsub(l, r, ord1) - count_rsub(l, r, ord0); } // a[l..r) の和を返す． T sum(int l, int r) { // verify : https://judge.yosupo.jp/problem/static_range_sum chmax(l, 0); chmin(r, n); if (l >= r) return 0; return acc[k][r] - acc[k][l]; } // a[l..r) の中で [v0..v1) に値をもつ要素の和を返す． T sum(int l, int r, T v0, T v1) { // verify : https://atcoder.jp/contests/abc339/tasks/abc339_g chmax(l, 0); chmin(r, n);; if (l >= r || v0 >= v1) return 0; int ord0 = lbpos(val, v0); int ord1 = lbpos(val, v1); return sum_rsub(l, r, ord1) - sum_rsub(l, r, ord0); } // Σi∈[l..r) |a[i] - v| を返す． T abs_sum(int l, int r, T v) { // verify : https://yukicoder.me/problems/no/2169 chmax(l, 0); chmin(r, n); if (l >= r) return 0; int ord = lbpos(val, v); T res = sum_rsub(l, r, (1 << k) - 1); res -= (r - l) * v; res -= 2 * sum_rsub(l, r, ord); res += 2 * count_rsub(l, r, ord) * v; return res; } }; //【mod 累積和】 /* * Mod_cumulative_sum(vT a, int m) : O(n log n) * 数列 a[0..n) と法 m で初期化する． * * T mod_sum(int l, int r, T b) : O(log n) * Σi∈[l..r) (a[i] + b) mod m を返す． * * T mod_sum_neg(int l, int r, T b) : O(log n) * Σi∈[l..r) (-a[i] + b) mod m を返す． * * T floor_sum(int l, int r, T b) : O(log n) * Σi∈[l..r) floor((a[i] + b) / m) を返す． * * T floor_sum_neg(int l, int r, T b) : O(log n) * Σi∈[l..r) floor((-a[i] + b) / m) を返す． * * 利用：【ウェーブレット行列】 */ template class Mod_cumulative_sum { int n; ll m; // A[i] : Σa[0..i); vector A; // A_rem : A[0..n) mod m Wavelet_matrix A_rem; public: // 数列 a[0..n) と法 m で初期化する． Mod_cumulative_sum(const vector& a, ll m) : n(sz(a)), m(m), A(n + 1) { Assert(m > 0); rep(i, n) A[i + 1] = A[i] + a[i]; vector ini(n); rep(i, n) { ini[i] = a[i] % m; if (ini[i] < 0) ini[i] += m; } A_rem = Wavelet_matrix(ini); } Mod_cumulative_sum() : n(0) {} // Σi∈[l..r) (a[i] + b) mod m を返す． T mod_sum(int l, int r, T b) { chmax(l, 0); chmin(r, n); if (l >= r) return 0; T b_rem = b % m; if (b_rem < 0) b_rem += m; T res = (r - l) * b_rem; res += A_rem.sum(l, r); res -= m * A_rem.count(l, r, m - b_rem, m); return res; } // Σi∈[l..r) (-a[i] + b) mod m を返す． T mod_sum_neg(int l, int r, T b) { chmax(l, 0); chmin(r, n); if (l >= r) return 0; T b_rem = b % m; if (b_rem < 0) b_rem += m; T res = (r - l) * b_rem; res -= A_rem.sum(l, r); res += m * A_rem.count(l, r, b_rem + 1, m); return res; } // Σi∈[l..r) floor((a[i] + b) / m) を返す． T floor_sum(int l, int r, T b) { chmax(l, 0); chmin(r, n); if (l >= r) return 0; T res = A[r] - A[l]; res += (r - l) * b; res -= mod_sum(l, r, b); res /= m; return res; } // Σi∈[l..r) floor((-a[i] + b) / m) を返す． T floor_sum_neg(int l, int r, T b) { chmax(l, 0); chmin(r, n); if (l >= r) return 0; T res = -(A[r] - A[l]); res += (r - l) * b; res -= mod_sum_neg(l, r, b); res /= m; return res; } }; //【フィボナッチ探索】 /* * Fibonacci_search(ll w) : O(log w) * 最大で幅 w の開区間まで扱えるよう初期化する． * * ll search(ll left, ll right, function f, bool up = true) : O(log(right - left)) * 関数 f(i) の開区間 (left, right) における最大[小]値を与える i を返す． * up = true なら f の階差の符号変化は + → 0 → - で，返すのは最大値となる． * up = false なら f の階差の符号変化は - → 0 → + で，返すのは最小値となる． */ struct Fibonacci_search { int n; vl fib; Fibonacci_search(ll w) : n(1), fib({ 1, 1 }) { // 利用する範囲のフィボナッチ数列を準備する． while (fib[n] < w) { fib.push_back(fib[n] + fib[n - 1]); n++; } } ll search(ll left, ll right, const function& f_, bool up = true) const { auto f = [&](ll x) { // 符号変化の条件を満たすよう範囲外の値を定めておく． ll val; if (x <= left) { val = -INFL - (left - x); } else if (x >= right) { // たぶん大丈夫だけどオーバーフローに注意 val = -INFL - (x - right); } else { val = (up ? f_(x) : -f_(x)); } return val; }; // l, m1, m2, r の順で区間を φ : 1 : φ に内分する点を得る． int i = n; ll l = left; ll r = l + fib[i]; ll m1 = l + fib[i - 2]; ll m2 = l + fib[i - 1]; i -= 3; // 内分点における関数値の計算 ll v1 = f(m1); ll v2 = f(m2); // 候補が内分点のみになるまで while (i > 0) { // 左の内分点での値の方が大きければ，次の区間は左側をとる． if (v1 > v2) { // 右の内分点を新たに右端とする． r = m2; // 左の内分点を新たに右の内分点とする． m2 = m1; v2 = v1; // 左の内分点を新たに計算する． m1 = l + fib[i]; v1 = f(m1); } // 右の内分点での値の方が大きければ，次の区間は右側をとる． else { // 左の内分点を新たに左端とする． l = m1; // 右の内分点を新たに左の内分点とする． m1 = m2; v1 = v2; // 右の内分点を新たに計算する． m2 = r - fib[i]; v2 = f(m2); } i--; } // 最後の候補を比較し，大きかった方の番号を返す． return (v1 > v2) ? m1 : m2; } }; ll WA(int n, int k, ll l, ll u, vl a) { ll d = u - l; sort(all(a)); Mod_cumulative_sum A(a, k); Fibonacci_search F((ll)1e12 + 100); auto f = [&](ll L) { ll R = L + d; int l = lbpos(a, L); ll cost = A.floor_sum_neg(0, l, L + k - 1); int r = ubpos(a, R); cost += A.floor_sum(r, n, -R + k - 1); dump(L, R, ":", cost); return cost; }; // dump(f(223600000)); exit(0); // 区分定数関数なので凸ではないが，とりあえず投げてみる． ll L = F.search(-1LL, (ll)1e12 + 1, f, false); dump("L:", L); return f(L); } ll solve(int n, int k, ll l, ll u, vl a) { ll d = u - l; sort(all(a)); Mod_cumulative_sum A(a, k); vi a_rem(n); rep(i, n) a_rem[i] = (int)(a[i] % k); uniq(a_rem); int W = sz(a_rem); Fibonacci_search F((ll)1e12 + 100); auto f = [&](ll x) { ll L = k * (x / W) + a_rem[x % W]; ll R = L + d; int l = lbpos(a, L); ll cost = A.floor_sum_neg(0, l, L + k - 1); int r = ubpos(a, R); cost += A.floor_sum(r, n, -R + k - 1); dump(L, R, ":", cost); return cost; }; // dump(f(223600000)); exit(0); ll L = F.search(-1LL, (ll)1e12 + 1, f, false); dump("L:", L); return f(L); } int main() { // input_from_file("input.txt"); // output_to_file("output.txt"); int n, k; ll l, u; cin >> n >> k >> l >> u; vl a(n); cin >> a; dump(TLE(n, k, l, u, a)); dump("------"); cout << solve(n, k, l, u, a) << endl; }