// QCFium 法 #pragma GCC target("avx2") #pragma GCC optimize("O3") #pragma GCC optimize("unroll-loops") #ifndef HIDDEN_IN_VS // 折りたたみ用 // 警告の抑制 #define _CRT_SECURE_NO_WARNINGS // ライブラリの読み込み #include using namespace std; // 型名の短縮 using ll = long long; using ull = unsigned long long; // -2^63 ~ 2^63 = 9e18(int は -2^31 ~ 2^31 = 2e9) using pii = pair; using pll = pair; using pil = pair; using pli = pair; using vi = vector; using vvi = vector; using vvvi = vector; using vvvvi = vector; using vl = vector; using vvl = vector; using vvvl = vector; using vvvvl = vector; using vb = vector; using vvb = vector; using vvvb = vector; using vc = vector; using vvc = vector; using vvvc = vector; using vd = vector; using vvd = vector; using vvvd = vector; template using priority_queue_rev = priority_queue, greater>; using Graph = vvi; // 定数の定義 const double PI = acos(-1); int DX[4] = { 1, 0, -1, 0 }; // 4 近傍(下,右,上,左) int DY[4] = { 0, 1, 0, -1 }; int INF = 1001001001; ll INFL = 4004004003094073385LL; // (int)INFL = INF, (int)(-INFL) = -INF; // 入出力高速化 struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp; // 汎用マクロの定義 #define all(a) (a).begin(), (a).end() #define sz(x) ((int)(x).size()) #define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), (x))) #define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), (x))) #define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");} #define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順 #define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順 #define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順 #define repe(v, a) for(const auto& v : (a)) // a の全要素(変更不可能) #define repea(v, a) for(auto& v : (a)) // a の全要素(変更可能) #define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索(昇順) #define repis(i, set) for(int i = lsb(set), bset##i = set; i < 32; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素(昇順) #define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て(昇順) #define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去 #define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了 #define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 半開矩形内判定 // 汎用関数の定義 template inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; } template inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新(更新されたら true を返す) template inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新(更新されたら true を返す) template inline T getb(T set, int i) { return (set >> i) & T(1); } template inline T smod(T n, T m) { n %= m; if (n < 0) n += m; return n; } // 非負mod // 演算子オーバーロード template inline istream& operator>>(istream& is, pair& p) { is >> p.first >> p.second; return is; } template inline istream& operator>>(istream& is, vector& v) { repea(x, v) is >> x; return is; } template inline vector& operator--(vector& v) { repea(x, v) --x; return v; } template inline vector& operator++(vector& v) { repea(x, v) ++x; return v; } #endif // 折りたたみ用 #if __has_include() #include using namespace atcoder; #ifdef _MSC_VER #include "localACL.hpp" #endif //using mint = modint1000000007; using mint = modint998244353; //using mint = static_modint<1234567891>; //using mint = modint; // mint::set_mod(m); namespace atcoder { inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; } inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; } } using vm = vector; using vvm = vector; using vvvm = vector; using vvvvm = vector; using pim = pair; #endif #ifdef _MSC_VER // 手元環境(Visual Studio) #include "local.hpp" #else // 提出用(gcc) inline int popcount(int n) { return __builtin_popcount(n); } inline int popcount(ll n) { return __builtin_popcountll(n); } inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : 32; } inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : 64; } template inline int lsb(const bitset& b) { return b._Find_first(); } inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; } inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; } #define dump(...) #define dumpel(v) #define dump_list(v) #define dump_mat(v) #define input_from_file(f) #define output_to_file(f) #define Assert(b) { if (!(b)) { vc MLE(1<<30); EXIT(MLE.back()); } } // RE の代わりに MLE を出す #endif //【座標圧縮】O(n log n) /* * a[0..n) を座標圧縮した結果を a_cp[0..n) に格納し,その値域の大きさを返す. * また xs[j] に圧縮された座標 j に対応する元の座標を格納する. * * a に重複する要素がなければ,a_cp[i] は a[i] が昇順で何番目かを表し, * xs[j] は昇順で j 番目の要素が何かを表す. */ template int coordinate_compression(const vector& a, vi& a_cp, vector* xs = nullptr) { // verify : https://atcoder.jp/contests/tessoku-book/tasks/tessoku_book_o int n = sz(a); if (xs == nullptr) xs = new vector; // *xs : a の x 座標のユニークな昇順列 *xs = a; uniq(*xs); // a[i] が xs において何番目かを求める. a_cp.resize(n); rep(i, n) a_cp[i] = lbpos(*xs, a[i]); return sz(*xs); } //【転倒数(座圧)】O(n log n) /* * a[0..n) の転倒数を返す. * * 利用:【座標圧縮】 */ template vl inversion_number_cc(const vector& a) { // verify : https://onlinejudge.u-aizu.ac.jp/courses/lesson/1/ALDS1/all/ALDS1_5_D int n = sz(a); // b : a を座標圧縮した結果 vi b; int m = coordinate_compression(a, b); // fw[i] : 今まで見てきた範囲に値 i が何個あったか fenwick_tree fw(m); vl res(n); // 位置について昇順に見ていく. rep(i, n) { fw.add(b[i], 1); // 自身より大きい数が今までに何個あったか調べ,加算する. res[i] = fw.sum(b[i] + 1, m) + (i > 0 ? res[i - 1] : 0); } return res; } //【monotone minima】O(w log h + h) /* * 与えられた monotone 行列 a[0..h)[0..w) について,各行の最小値の位置を並べたリストを返す. * NIL は無効値を表す. * * 制約:無効値は右上または左下にしか存在しない. */ template vi monotone_minima(int h, int w, const FUNC& a, ll NIL = 2 * INFL + 100) { // 参考 : https://speakerdeck.com/tatyam_prime/monge-noshou-yin-shu // verify : https://judge.yosupo.jp/problem/min_plus_convolution_convex_arbitrary //【方法】 // lsb の大きい行から順に最小値の位置を調べていく. // 1 つ lsb の大きい行の結果を参照することにより調べるべき範囲を各回 O(w) に制限できる. vi j_min(h); // di : 行を調べる間隔 / 2(最大の 2 冪から始めて半分ずつにしていく) for (int di = 1 << msb(h); di > 0; di >>= 1) { // i : 調べる行番号(1-indexed) // 2 di ずつ増加させるので lsb は変化しない. int di2 = 2 * di; for (int i = di; i <= h; i += di2) { int jL = (i - di > 0 ? j_min[i - di - 1] : 0); int jR = (i + di <= h ? j_min[i + di - 1] : w - 1); ll a_min = 2 * INFL + 10; repi(j, jL, jR) { ll val = a(i - 1, j); if (val == NIL) continue; if (chmin(a_min, val)) j_min[i - 1] = j; } } } return j_min; /* A の定義の雛形 auto A = [&](int i, int j) { return 0LL; }; */ } //【Monge DAG 最長路(長さごと)】O(n^2 (log n)^2) /* * 重み付き DAG G を * 頂点集合が [0..n] * 辺 s→t(s vector> monge_DAG_longest_path_all(const vector>& M) { //【方法】 // dp[k][i] : 頂点 0 から i までの長さ k のパスの重みの最大値 // と定めると,遷移は // dp[k+1][t] = MAX_s∈[0..t) (dp[k][s] + M[t][s]) // となる.これは max-plus 代数における行列ベクトル積として // dp[k+1] = M * dp[k] // と表される. // // k を固定する. // M は下三角 Monge なのでその第 s 列に dp[k][s] を加えた行列も下三角 Monge である. // さらに下三角部分を矩形に分割したそれぞれも Monge である. // よって各矩形領域について monotone minima で行最大値を求めることができ, // その結果を統合することで dp[k+1] が得られる. //【注意】 // M[s][t] でなく M[t][s] なのが気持ち悪いが,こうしないとキャッシュヒット率が悪くなる. //【注意】 // 下三角のまま行最大値を求めようとしても無効値が邪魔をして失敗する. int n = sz(M) - 1; // dp[k][i] : 頂点 0 から i までの長さ k のパスの重みの最大値 vector> dp(n + 1, vector(n + 1, -T(INFL))); dp[0][0] = 0; // rects_sml : 下三角部分を矩形に分割したときの小ブロック(はみ出しあり) vector rects_sml; // rects_lrg : 下三角部分を矩形に分割したときの大ブロック vector> rects_lrg; // {(i,j) | l≦j rf = [&](int l, int r) { // 小さくなったらはみ出しも許して打ち切って記録する. if (r - l <= 20) { rects_sml.emplace_back(l, r); return; } int m = (l + r) / 2; rects_lrg.emplace_back(m, r, l, m); rf(l, m); rf(m, r); }; rf(0, n + 1); rep(k, n) { // M の下三角部分を分割した各小ブロック M[l..r)[l..r) について処理を行う. for (auto [l, r] : rects_sml) { // 矩形が小さいときは素朴に処理する. repi(t, l, r - 1) repi(s, l, t - 1) { chmax(dp[k + 1][t], dp[k][s] + M[t][s]); } } // M の下三角部分を分割した各大ブロック M[t1..t2)[s1..s2) について処理を行う. for (auto [t1, t2, s1, s2] : rects_lrg) { int Dt = t2 - t1; int Ds = s2 - s1; // monotone minima vi s_min(Dt); for (int di = 1 << msb(Dt); di > 0; di >>= 1) { int di2 = 2 * di; for (int i = di; i <= Dt; i += di2) { int jL = (i - di > 0 ? s_min[i - di - 1] : 0); int jR = (i + di <= Dt ? s_min[i + di - 1] : Ds - 1); T a_min = T(INFL); repi(j, jL, jR) { T val = -(M[t1 + i - 1][s2 - 1 - j] + dp[k][s2 - 1 - j]); if (chmin(a_min, val)) s_min[i - 1] = j; } } } // 注目ブロックからの影響を反映する. repi(t, t1, t2 - 1) { int s = s2 - 1 - s_min[t - t1]; chmax(dp[k + 1][t], M[t][s] + dp[k][s]); } } } return dp; } int main() { input_from_file("input.txt"); // output_to_file("output.txt"); int n; cin >> n; vi p(n); cin >> p; vvi M(n + 1, vi(n + 1)); rep(i, n) { vi a(p.begin() + i, p.end()); auto b = inversion_number_cc(a); repi(j, i + 1, n) M[j][i] = (int)b[j - (i + 1)]; } vi res(n, M[n][0]); auto dp = monge_DAG_longest_path_all(M); rep(i, n) res[i] -= dp[i + 1][n]; rep(i, n) cout << res[i] << "\n"; }