結果

問題 No.1912 Get together 2
ユーザー ei1333333ei1333333
提出日時 2022-04-22 21:50:28
言語 C++17
(gcc 12.3.0 + boost 1.83.0)
結果
AC  
実行時間 287 ms / 2,000 ms
コード長 3,980 bytes
コンパイル時間 3,145 ms
コンパイル使用メモリ 298,120 KB
実行使用メモリ 94,192 KB
最終ジャッジ日時 2024-06-24 02:57:52
合計ジャッジ時間 9,456 ms
ジャッジサーバーID
(参考情報)
judge5 / judge1
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 3 ms
7,644 KB
testcase_01 AC 2 ms
6,944 KB
testcase_02 AC 4 ms
13,656 KB
testcase_03 AC 5 ms
17,756 KB
testcase_04 AC 3 ms
9,560 KB
testcase_05 AC 4 ms
11,740 KB
testcase_06 AC 5 ms
15,704 KB
testcase_07 AC 5 ms
17,760 KB
testcase_08 AC 18 ms
28,268 KB
testcase_09 AC 17 ms
30,480 KB
testcase_10 AC 25 ms
30,392 KB
testcase_11 AC 19 ms
30,412 KB
testcase_12 AC 27 ms
32,700 KB
testcase_13 AC 282 ms
94,072 KB
testcase_14 AC 284 ms
94,100 KB
testcase_15 AC 287 ms
94,084 KB
testcase_16 AC 284 ms
94,056 KB
testcase_17 AC 287 ms
94,192 KB
testcase_18 AC 260 ms
94,076 KB
testcase_19 AC 257 ms
93,968 KB
testcase_20 AC 264 ms
94,132 KB
testcase_21 AC 258 ms
94,164 KB
testcase_22 AC 262 ms
94,084 KB
testcase_23 AC 260 ms
94,088 KB
testcase_24 AC 259 ms
94,060 KB
testcase_25 AC 262 ms
94,124 KB
testcase_26 AC 261 ms
94,084 KB
testcase_27 AC 259 ms
94,028 KB
testcase_28 AC 28 ms
18,288 KB
testcase_29 AC 26 ms
16,364 KB
testcase_30 AC 30 ms
20,464 KB
testcase_31 AC 22 ms
12,272 KB
testcase_32 AC 24 ms
14,324 KB
testcase_33 AC 287 ms
93,992 KB
testcase_34 AC 3 ms
7,644 KB
testcase_35 AC 274 ms
94,124 KB
権限があれば一括ダウンロードができます

ソースコード

diff #

#include <bits/stdc++.h>

using namespace std;

using int64 = long long;
//const int mod = 1e9 + 7;
const int mod = 998244353;

const int64 infll = (1LL << 62) - 1;
const int inf = (1 << 30) - 1;

struct IoSetup {
  IoSetup() {
    cin.tie(nullptr);
    ios::sync_with_stdio(false);
    cout << fixed << setprecision(10);
    cerr << fixed << setprecision(10);
  }
} iosetup;


template< typename T1, typename T2 >
ostream &operator<<(ostream &os, const pair< T1, T2 > &p) {
  os << p.first << " " << p.second;
  return os;
}

template< typename T1, typename T2 >
istream &operator>>(istream &is, pair< T1, T2 > &p) {
  is >> p.first >> p.second;
  return is;
}

template< typename T >
ostream &operator<<(ostream &os, const vector< T > &v) {
  for(int i = 0; i < (int) v.size(); i++) {
    os << v[i] << (i + 1 != v.size() ? " " : "");
  }
  return os;
}

template< typename T >
istream &operator>>(istream &is, vector< T > &v) {
  for(T &in: v) is >> in;
  return is;
}

template< typename T1, typename T2 >
inline bool chmax(T1 &a, T2 b) { return a < b && (a = b, true); }

template< typename T1, typename T2 >
inline bool chmin(T1 &a, T2 b) { return a > b && (a = b, true); }

template< typename T = int64 >
vector< T > make_v(size_t a) {
  return vector< T >(a);
}

template< typename T, typename... Ts >
auto make_v(size_t a, Ts... ts) {
  return vector< decltype(make_v< T >(ts...)) >(a, make_v< T >(ts...));
}

template< typename T, typename V >
typename enable_if< is_class< T >::value == 0 >::type fill_v(T &t, const V &v) {
  t = v;
}

template< typename T, typename V >
typename enable_if< is_class< T >::value != 0 >::type fill_v(T &t, const V &v) {
  for(auto &e: t) fill_v(e, v);
}

template< typename F >
struct FixPoint : F {
  FixPoint(F &&f) : F(forward< F >(f)) {}

  template< typename... Args >
  decltype(auto) operator()(Args &&... args) const {
    return F::operator()(*this, forward< Args >(args)...);
  }
};

template< typename F >
inline decltype(auto) MFP(F &&f) {
  return FixPoint< F >{forward< F >(f)};
}

#include <immintrin.h>

/**
 * @brief Superset Zeta/Moebius Transform SIMD (上位集合のゼータ/メビウス変換, SIMD)
 */
__attribute__((target("avx2")))
void superset_zeta_transform_simd(int *buf, int n) {
  assert((n & (n - 1)) == 0);
  for(int i = 1; i < n; i <<= 1) {
    for(int j = 0; j < n; j += i << 1) {
      if(i <= 2) {
        for(int k = 0; k < i; k++) {
          buf[j + k] += buf[j + k + i];
        }
      } else if(i == 4) {
        for(int k = 0; k < i; k += 4) {
          auto a = _mm_loadu_si128((__m128i * )(buf + j + k));
          auto b = _mm_loadu_si128((__m128i * )(buf + j + k + i));
          a = _mm_add_epi32(a, b);
          _mm_storeu_si128((__m128i * )(buf + j + k), a);
        }
      } else {
        for(int k = 0; k < i; k += 8) {
          auto a = _mm256_loadu_si256((__m256i * )(buf + j + k));
          auto b = _mm256_loadu_si256((__m256i * )(buf + j + k + i));
          a = _mm256_add_epi32(a, b);
          _mm256_storeu_si256((__m256i * )(buf + j + k), a);
        }
      }
    }
  }
}

int dp2[20][1 << 20];

int main() {
  int N, M;
  cin >> N >> M;
  vector< int > V(N);
  cin >> V;
  vector< int > T(N);
  for(int i = 0; i < N; i++) {
    string s;
    cin >> s;
    for(int j = 0; j < M; j++) {
      if(s[j] == 'x') {
        T[i] |= 1 << j;
      }
    }
  }
  for(int i = 0; i < N; i++) {
    for(int j = 0; j < M; j++) {
      if((~T[i] >> j) & 1) {
        dp2[j][T[i]] += V[i];
      }
    }
  }
  for(int i = 0; i < M; i++) {
    superset_zeta_transform_simd(dp2[i], (1 << M));
  }
  vector< int64 > dp(1 << M, -infll);
  dp[0] = 0;
  auto get_cost = [&](int bit, int p) {
    bit |= 1 << p;
    bit ^= (1 << M) - 1;
    return 1LL * dp2[p][bit] * dp2[p][bit];
  };
  for(int i = 0; i < (1 << M); i++) {
    for(int j = 0; j < M; j++) {
      if((~i >> j) & 1) {
        chmax(dp[i | (1 << j)], dp[i] + get_cost(i, j));
      }
    }
  }
  cout << dp.back() << "\n";
}
0