#include #include using namespace std; #define pb push_back #define mp make_pair #define all(x) (x).begin(),(x).end() #define rep(i,n) for(int i=0;i<(n);i++) constexpr int MOD = 1000000007; typedef long long ll; typedef unsigned long long ull; typedef pair pii; constexpr int dx[] = {1, 0, -1, 0, 1, 1, -1, -1}; constexpr int dy[] = {0, -1, 0, 1, 1, -1, -1, 1}; template ostream &operator<<(ostream &os, const vector &vec){os << "["; for (const auto &v : vec) {os << v << ","; } os << "]"; return os; } template ostream &operator<<(ostream &os, const pair &p){os << "(" << p.first << ", " << p.second << ")"; return os;} // WaveletMatrix Tはデータ型 // verified: https://codeforces.com/contest/1042/submission/43071856 // N要素の配列Aに対する次のクエリを高速に処理する。メモリ使用量はO(N log max x) (max xはデータ型の最大値) // 1. rank(k, x): Aの先頭から位置kまでに文字xがいくつあるか // 2. select(n, x): n個目(1-origin)の文字xの次の位置はどこか // 3. QuantileRange(l, r, n): 位置lと位置rの間で、n番目(1-origin)に小さい数は何か // 4. RankLessThan(l, r, x): 位置lと位置rの間に、xと同じ数字が何個あるか, xより小さい数字が何個あるか, xより大きい数字が何個あるかを返す // selectのみ時間がかかる(O(log N log max x))が、その他はO(log max x)で処理可能 // メモリ使用量: T = long long, N = 2*10^5 で 20MBくらい // また、負の数は制御できない!Aの中やxに負の数が紛れ込まないようにしよう // usage: // vector A(N); // WaveletMatrix wm(A); template struct WaveletMatrix { // FID // 手抜き実装のため、完備辞書にはなっていない (O(N)の追加領域が必要) struct FID { vector bit; vector acc; int N; FID(vector &bit_) { N = bit_.size(); int N2 = (N >> 5) + 1; bit.resize(N2); for(int i = 0; i < N2; i++) { for(int j = 0; j < 32; j++) { if ((i << 5) + j < N) bit[i] |= bit_[(i << 5) + j] << j; } } acc = vector(N2); for(int i = 0; i < N2 - 1; i++) { acc[i + 1] = acc[i] + __builtin_popcount(bit[i]); } } FID() {} // rank: 位置kまでに何個のxがあるかを返す // O(1) inline int rank(int k, int x = 1) { int n1 = acc[k >> 5] + __builtin_popcount(bit[k >> 5] & (uint32_t)(((1ULL << (k & 0x1f)) - 1))); return x ? n1 : k - n1; } // select: ビット列の先頭から見てn個目のxのビットの次の位置はどこか // O(log N) inline int select(int n, int x = 1) { int ng = 0, ok = N + 1; while(ok - ng > 1) { int c = (ok + ng) / 2; if (rank(c, x) >= n) { ok = c; } else { ng = c; } } return ok; } inline int operator[](int k) { return ((bit[k >> 5] >> (k & 0x1f)) & 1); } inline size_t size() { return N; } }; vector cntZero; vector bits; unordered_map pos; int level; ll mask; // rank // Aの先頭から位置kまでに文字xがいくつあるか // O(log max x) inline int rank(int k, T x) { int now = k; for(int j = level - 1; j >= 0; j--) { if (x >> j & 1) { now = cntZero[j] + bits[j].rank(now); } else { now = now - bits[j].rank(now); } } return now - pos[x ^ mask]; } // select: // n個目(1-origin)の文字xの次の位置はどこか // O(log N log max x) inline int select(int n, T x) { int now = pos[x ^ mask] + n; for(int j = 0; j < level; j++) { if (x >> j & 1) { int w = now - cntZero[j]; now = bits[j].select(w); } else { now = bits[j].select(now, 0); } } return now; } // QuantileRange // 位置lと位置rの間で、n番目(1-origin)に小さい数は何か // 「数」と「その数と同じ数の中で、先頭から数えて何番目か」を返す // O(log max x) inline pair QuantileRange(int l, int r, int n) { T ans = 0; for(int j = level - 1; j >= 0; j--) { ans <<= 1LL; int nz = bits[j].rank(r, 0) - bits[j].rank(l, 0); if (n > nz) { n -= nz; l = bits[j].rank(l, 1) + cntZero[j]; r = bits[j].rank(r, 1) + cntZero[j]; ans |= 1LL; } else { l = bits[j].rank(l, 0); r = bits[j].rank(r, 0); } } return {ans, l + n - pos[ans ^ mask]}; } // RankLessThan // 位置lと位置rの間に、xと同じ数字が何個あるか, xより小さい数字が何個あるか, xより大きい数字が何個あるかを返す // tuple ret = wm.RankLessThan(0, N, x); int eq = get<0>(ret), less = get<1>(ret), greater = get<2>(ret); // O(log max x) inline tuple RankLessThan(int l, int r, T x) { T n_eq = 0, n_less = 0, n_greater = 0; for(int j = level - 1; j >= 0; j--) { if (x >> j & 1) { n_less += bits[j].rank(r, 0) - bits[j].rank(l, 0); l = bits[j].rank(l, 1) + cntZero[j]; r = bits[j].rank(r, 1) + cntZero[j]; } else { n_greater += bits[j].rank(r, 1) - bits[j].rank(l, 1); l = bits[j].rank(l, 0); r = bits[j].rank(r, 0); } } n_eq = r - l; return {n_eq, n_less, n_greater}; } WaveletMatrix(vector A_) : level(sizeof(T) * 8) { cntZero.resize(level); bits.resize(level); vector zero(A_.size()); vector one(A_.size()); for(int j = level - 1; j >= 0; j--) { int n0 = 0, n1 = 0; vector bit(A_.size()); int cnt = 0; for(int i = 0; i < A_.size(); i++) { if (A_[i] >> j & 1) { one[n1++] = A_[i]; bit[i] = 1; } else { zero[n0++] = A_[i]; cnt++; } } vector newA(zero.begin(), zero.begin() + n0); newA.insert(newA.end(), one.begin(), one.begin() + n1); A_ = std::move(newA); bits[j] = FID(bit); cntZero[j] = cnt; } //reverse(bits.begin(), bits.end()); mask = random_device()(); for(int i = 0; i < A_.size(); i++) { if (pos.find(A_[i]) == pos.end()) { pos[A_[i] ^ mask] = i; } } } void show() { cout << "cntZero: "; for (int i = 0; i < cntZero.size(); i++) { cout << cntZero[i] << ", "; } cout << endl; cout << "bits: " << endl; for (int j = 0; j < level; j++) { for (int i = 0; i < bits[j].size(); i++) { cout << bits[j][i] << ", "; } cout << endl; } cout << endl; } }; void solve() { int N, K; cin >> N >> K; vector A(N); for (int i = 0; i < N; i++) { cin >> A[i]; } WaveletMatrix wm(A); int c_prev = wm.QuantileRange(0, K, (K + 1) / 2).first; ll sum = 0; for (int i = 0; i < K; i++) { sum += abs(A[i] - c_prev); } ll ans = sum; for(int i = K + 1; i <= N; i++) { int c = wm.QuantileRange(i - K, i, (K + 1) / 2).first; if (c != c_prev) { tuple t1 = wm.RankLessThan(i - K , i - 1, c_prev); tuple t2 = wm.RankLessThan(i - K , i - 1, c); if (c_prev > c) { int x1 = get<2>(t1) + get<0>(t1); int x2 = get<1>(t2) + get<0>(t2); sum += (c_prev - c) * (x1 - x2); } else { int x1 = get<1>(t1) + get<0>(t1); int x2 = get<2>(t2) + get<0>(t2); sum += (c - c_prev) * (x1 - x2); } } sum -= abs(A[i - K - 1] - c_prev); sum += abs(A[i - 1] - c); c_prev = c; ans = min(ans, sum); } cout << ans << endl; } int main() { std::cin.tie(0); std::ios::sync_with_stdio(false); cout.setf(ios::fixed); cout.precision(16); solve(); return 0; }