// QCFium 法 #pragma GCC target("avx2") #pragma GCC optimize("O3") #pragma GCC optimize("unroll-loops") #ifndef HIDDEN_IN_VS // 折りたたみ用 // 警告の抑制 #define _CRT_SECURE_NO_WARNINGS // ライブラリの読み込み #include using namespace std; // 型名の短縮 using ll = long long; using ull = unsigned long long; // -2^63 ~ 2^63 = 9e18(int は -2^31 ~ 2^31 = 2e9) using pii = pair; using pll = pair; using pil = pair; using pli = pair; using vi = vector; using vvi = vector; using vvvi = vector; using vvvvi = vector; using vl = vector; using vvl = vector; using vvvl = vector; using vvvvl = vector; using vb = vector; using vvb = vector; using vvvb = vector; using vc = vector; using vvc = vector; using vvvc = vector; using vd = vector; using vvd = vector; using vvvd = vector; template using priority_queue_rev = priority_queue, greater>; using Graph = vvi; // 定数の定義 const double PI = acos(-1); int DX[4] = { 1, 0, -1, 0 }; // 4 近傍(下,右,上,左) int DY[4] = { 0, 1, 0, -1 }; int INF = 1001001001; ll INFL = 4004004003094073385LL; // (int)INFL = INF, (int)(-INFL) = -INF; // 入出力高速化 struct fast_io { fast_io() { cin.tie(nullptr); ios::sync_with_stdio(false); cout << fixed << setprecision(18); } } fastIOtmp; // 汎用マクロの定義 #define all(a) (a).begin(), (a).end() #define sz(x) ((int)(x).size()) #define lbpos(a, x) (int)distance((a).begin(), std::lower_bound(all(a), (x))) #define ubpos(a, x) (int)distance((a).begin(), std::upper_bound(all(a), (x))) #define Yes(b) {cout << ((b) ? "Yes\n" : "No\n");} #define rep(i, n) for(int i = 0, i##_len = int(n); i < i##_len; ++i) // 0 から n-1 まで昇順 #define repi(i, s, t) for(int i = int(s), i##_end = int(t); i <= i##_end; ++i) // s から t まで昇順 #define repir(i, s, t) for(int i = int(s), i##_end = int(t); i >= i##_end; --i) // s から t まで降順 #define repe(v, a) for(const auto& v : (a)) // a の全要素(変更不可能) #define repea(v, a) for(auto& v : (a)) // a の全要素(変更可能) #define repb(set, d) for(int set = 0, set##_ub = 1 << int(d); set < set##_ub; ++set) // d ビット全探索(昇順) #define repis(i, set) for(int i = lsb(set), bset##i = set; i < 32; bset##i -= 1 << i, i = lsb(bset##i)) // set の全要素(昇順) #define repp(a) sort(all(a)); for(bool a##_perm = true; a##_perm; a##_perm = next_permutation(all(a))) // a の順列全て(昇順) #define uniq(a) {sort(all(a)); (a).erase(unique(all(a)), (a).end());} // 重複除去 #define EXIT(a) {cout << (a) << endl; exit(0);} // 強制終了 #define inQ(x, y, u, l, d, r) ((u) <= (x) && (l) <= (y) && (x) < (d) && (y) < (r)) // 半開矩形内判定 // 汎用関数の定義 template inline ll powi(T n, int k) { ll v = 1; rep(i, k) v *= n; return v; } template inline bool chmax(T& M, const T& x) { if (M < x) { M = x; return true; } return false; } // 最大値を更新(更新されたら true を返す) template inline bool chmin(T& m, const T& x) { if (m > x) { m = x; return true; } return false; } // 最小値を更新(更新されたら true を返す) template inline T getb(T set, int i) { return (set >> i) & T(1); } template inline T smod(T n, T m) { n %= m; if (n < 0) n += m; return n; } // 非負mod // 演算子オーバーロード template inline istream& operator>>(istream& is, pair& p) { is >> p.first >> p.second; return is; } template inline istream& operator>>(istream& is, vector& v) { repea(x, v) is >> x; return is; } template inline vector& operator--(vector& v) { repea(x, v) --x; return v; } template inline vector& operator++(vector& v) { repea(x, v) ++x; return v; } #endif // 折りたたみ用 #if __has_include() #include using namespace atcoder; #ifdef _MSC_VER #include "localACL.hpp" #endif //using mint = modint1000000007; using mint = modint998244353; //using mint = static_modint<100>; //using mint = modint; // mint::set_mod(m); namespace atcoder { inline istream& operator>>(istream& is, mint& x) { ll x_; is >> x_; x = x_; return is; } inline ostream& operator<<(ostream& os, const mint& x) { os << x.val(); return os; } } using vm = vector; using vvm = vector; using vvvm = vector; using vvvvm = vector; using pim = pair; #endif #ifdef _MSC_VER // 手元環境(Visual Studio) #include "local.hpp" #else // 提出用(gcc) inline int popcount(int n) { return __builtin_popcount(n); } inline int popcount(ll n) { return __builtin_popcountll(n); } inline int lsb(int n) { return n != 0 ? __builtin_ctz(n) : 32; } inline int lsb(ll n) { return n != 0 ? __builtin_ctzll(n) : 64; } template inline int lsb(const bitset& b) { return b._Find_first(); } inline int msb(int n) { return n != 0 ? (31 - __builtin_clz(n)) : -1; } inline int msb(ll n) { return n != 0 ? (63 - __builtin_clzll(n)) : -1; } #define dump(...) #define dumpel(...) #define dump_list(v) #define dump_mat(v) #define input_from_file(f) #define output_to_file(f) #define Assert(b) { if (!(b)) { vc MLE(1<<30); EXIT(MLE.back()); } } // RE の代わりに MLE を出す #endif //【ニム積】 /* * Nim_product() : O(65536) * 初期化を行う. * * ull prod(ull x, ull y) : O(216) * x と y のニム積を返す. * * ull pow(ull x, ull n) : O(216 log n) * n 個の x のニム積を返す. * * ull inv(ull x) : O(216 * 64) * x のニム積逆元を返す. */ class Nim_product { // 参考 : https://kyopro-friends.hatenablog.com/entry/2020/04/07/195850 // 参考 :『ON NUMBERS AND GAMES』(John H. Conway) (pp.52-53) // p[i][j] : i と j のニム積 vector> p; // a と b のニム積を返す(ただし a, b < 2^16) ull prod16(ull a, ull b) { constexpr ull mask = (1ULL << 8) - 1; ull ah = a >> 8, al = a & mask; ull bh = b >> 8, bl = b & mask; ull val = (p[ah][bh] ^ p[al][bh] ^ p[ah][bl]) << 8; val ^= p[p[ah][bh]][1LL << 7]; val ^= p[al][bl]; return val; } // a と b のニム積を返す(ただし a, b < 2^32) ull prod32(ull a, ull b) { constexpr ull mask = (1ULL << 16) - 1; ull ah = a >> 16, al = a & mask; ull bh = b >> 16, bl = b & mask; ull val = (prod16(ah, bh) ^ prod16(al, bh) ^ prod16(ah, bl)) << 16; val ^= prod16(prod16(ah, bh), 1ULL << 15); val ^= prod16(al, bl); return val; } // a と b のニム積を返す(ただし a, b < 2^64) ull prod64(ull a, ull b) { constexpr ull mask = (1ULL << 32) - 1; ull ah = a >> 32, al = a & mask; ull bh = b >> 32, bl = b & mask; ull val = (prod32(ah, bh) ^ prod32(al, bh) ^ prod32(ah, bl)) << 32; val ^= prod32(prod32(ah, bh), 1ULL << 31); val ^= prod32(al, bl); return val; } public: Nim_product() : p(256, vector(256)) { // verify : https://judge.yosupo.jp/problem/nim_product_64 p[1][1] = 1; // [0..256) と [0..256) とのニム積を前計算する. int pow2 = 2; rep(k, 3) { int K = 1 << k; repi(a, pow2, pow2 * pow2 - 1) rep(b, pow2 * pow2) { int ah = a >> K, al = a & (pow2 - 1); int bh = b >> K, bl = b & (pow2 - 1); ull val = (p[ah][bh] ^ p[al][bh] ^ p[ah][bl]) << K; val ^= p[p[ah][bh]][1LL << (K - 1)]; val ^= p[al][bl]; p[a][b] = val; } rep(a, pow2) repi(b, pow2, pow2 * pow2 - 1) p[a][b] = p[b][a]; pow2 *= pow2; } } // x と y のニム積を返す. ull prod(ull x, ull y) { // verify : https://judge.yosupo.jp/problem/nim_product_64 if (x < (1ULL << 8) && y < (1ULL << 8)) return p[x][y]; else if (x < (1ULL << 16) && y < (1ULL << 16)) return prod16(x, y); else if (x < (1ULL << 32) && y < (1ULL << 32)) return prod32(x, y); else return prod64(x, y); } // n 個の x のニム積を返す. ull pow(ull x, ull n) { ull res = 1, pow2 = x; while (n > 0) { if ((n & 1) != 0) res = prod(res, pow2); pow2 = prod(pow2, pow2); n /= 2; } return res; } // x のニム積逆元を返す. ull inv(ull x) { // verify : https://projecteuler.net/problem=459 Assert(x > 0); if (x < (1ULL << 1)) return 1; if (x < (1ULL << 2)) return 5ULL - x; if (x < (1ULL << 4)) return pow(x, (1ULL << 4) - 2); if (x < (1ULL << 8)) return pow(x, (1ULL << 8) - 2); if (x < (1ULL << 16)) return pow(x, (1ULL << 16) - 2); if (x < (1ULL << 32)) return pow(x, (1ULL << 32) - 2); return pow(x, ~0ULL - 1); } }; Nim_product NP; using SC01 = ull; SC01 addC01(SC01 x, SC01 y) { return x ^ y; } SC01 oC01() { return 0; } SC01 miC01(SC01 x) { return x; } SC01 mulC01(SC01 x, SC01 y) { return NP.prod(x, y); } SC01 eC01() { return 1; } SC01 invC01(SC01 x) { return NP.inv(x); } #define NimAdd_NimMul_field SC01, addC01, oC01, miC01, mulC01, eC01, invC01 //【体】 /* * 体 (S, add, o, mi, mul, e, inv) の元を表す(add, mi, mul は +, -, *, / をそれぞれオーバーロードする) */ template struct Field { S v; // 零元 static S o() { return o_(); } // 単位元 static S e() { return e_(); } // コンストラクタ Field() : v(o()) {} Field(S v) : v(v) {} // キャスト operator S() const { return v; } // 比較 bool operator==(const Field& b) const { return v == b.v; } bool operator!=(const Field& b) const { return v != b.v; } // 単項演算 Field operator-() const { return Field(mi(v)); } Field inv() const { return Field(inv_(v)); } // 二項演算 Field& operator+=(const Field& b) { v = add(v, b.v); return *this; } Field& operator-=(const Field& b) { v = add(v, mi(b.v)); return *this; } Field& operator*=(const Field& b) { v = mul(v, b.v); return *this; } Field& operator/=(const Field& b) { v = mul(v, inv_(b.v)); return *this; } friend Field operator+(Field a, const Field& b) { a += b; return a; } friend Field operator-(Field a, const Field& b) { a -= b; return a; } friend Field operator*(Field a, const Field& b) { a *= b; return a; } friend Field operator/(Field a, const Field& b) { a /= b; return a; } // 入出力 friend istream& operator>>(istream& is, Field& a) { is >> a.v; return is; } friend ostream& operator<<(ostream& os, const Field& a) { //#ifdef _MSC_VER // if (a.v == o()) return os << "o"; // if (a.v == e()) return os << "e"; //#endif return os << a.v; } }; //【行列】 /* * Matrix(int n, int m) : O(n m) * n×m 零行列で初期化する. * * Matrix(int n) : O(n^2) * n×n 単位行列で初期化する. * * Matrix(vvT a) : O(n m) * 二次元配列 a[0..n)[0..m) の要素で初期化する. * * bool empty() : O(1) * 行列が空かを返す. * * A + B : O(n m) * n×m 行列 A, B の和を返す.+= も使用可. * * A - B : O(n m) * n×m 行列 A, B の差を返す.-= も使用可. * * c * A / A * c : O(n m) * n×m 行列 A とスカラー c のスカラー積を返す.*= も使用可. * * A * x : O(n m) * n×m 行列 A と n 次元列ベクトル x の積を返す. * * x * A : O(n m)(やや遅い) * m 次元行ベクトル x と n×m 行列 A の積を返す. * * A * B : O(n m l) * n×m 行列 A と m×l 行列 B の積を返す. * * Mat pow(ll d) : O(n^3 log d) * 自身を d 乗した行列を返す. */ template struct Matrix { int n, m; // 行列のサイズ(n 行 m 列) vector> v; // 行列の成分 // n×m 零行列で初期化する. Matrix(int n, int m) : n(n), m(m), v(n, vector(m)) {} // n×n 単位行列で初期化する. Matrix(int n) : n(n), m(n), v(n, vector(n)) { rep(i, n) v[i][i] = T(1); } // 二次元配列 a[0..n)[0..m) の要素で初期化する. Matrix(const vector>& a) : n(sz(a)), m(sz(a[0])), v(a) {} Matrix() : n(0), m(0) {} // 代入 Matrix(const Matrix&) = default; Matrix& operator=(const Matrix&) = default; // アクセス inline vector const& operator[](int i) const { return v[i]; } inline vector& operator[](int i) { // verify : https://judge.yosupo.jp/problem/matrix_product // inline を付けて [] でアクセスするとなぜか v[] への直接アクセスより速くなった. return v[i]; } // 入力 friend istream& operator>>(istream& is, Matrix& a) { rep(i, a.n) rep(j, a.m) is >> a.v[i][j]; return is; } // 行の追加 void push_back(const vector& a) { Assert(sz(a) == m); v.push_back(a); n++; } // 行の削除 void pop_back() { Assert(n > 0); v.pop_back(); n--; } void resize(int n_) { v.resize(n_); n = n_; } // 空か bool empty() const { return min(n, m) == 0; } // 比較 bool operator==(const Matrix& b) const { return n == b.n && m == b.m && v == b.v; } bool operator!=(const Matrix& b) const { return !(*this == b); } // 加算,減算,スカラー倍 Matrix& operator+=(const Matrix& b) { rep(i, n) rep(j, m) v[i][j] += b[i][j]; return *this; } Matrix& operator-=(const Matrix& b) { rep(i, n) rep(j, m) v[i][j] -= b[i][j]; return *this; } Matrix& operator*=(const T& c) { rep(i, n) rep(j, m) v[i][j] *= c; return *this; } Matrix operator+(const Matrix& b) const { return Matrix(*this) += b; } Matrix operator-(const Matrix& b) const { return Matrix(*this) -= b; } Matrix operator*(const T& c) const { return Matrix(*this) *= c; } friend Matrix operator*(const T& c, const Matrix& a) { return a * c; } Matrix operator-() const { return Matrix(*this) *= T(-1); } // 行列ベクトル積 : O(m n) vector operator*(const vector& x) const { vector y(n); rep(i, n) rep(j, m) y[i] += v[i][j] * x[j]; return y; } // ベクトル行列積 : O(m n) friend vector operator*(const vector& x, const Matrix& a) { vector y(a.m); rep(i, a.n) rep(j, a.m) y[j] += x[i] * a[i][j]; return y; } // 積:O(n^3) Matrix operator*(const Matrix& b) const { // verify : https://judge.yosupo.jp/problem/matrix_product Matrix res(n, b.m); rep(i, res.n) rep(k, m) rep(j, res.m) res[i][j] += v[i][k] * b[k][j]; return res; } Matrix& operator*=(const Matrix& b) { *this = *this * b; return *this; } // 累乗:O(n^3 log d) Matrix pow(ll d) const { // verify : https://judge.yosupo.jp/problem/pow_of_matrix Matrix res(n), pow2 = *this; while (d > 0) { if (d & 1) res *= pow2; pow2 *= pow2; d >>= 1; } return res; } #ifdef _MSC_VER friend ostream& operator<<(ostream& os, const Matrix& a) { rep(i, a.n) { os << "["; rep(j, a.m) os << a[i][j] << " ]"[j == a.m - 1]; if (i < a.n - 1) os << "\n"; } return os; } #endif }; //【線形方程式】O(n m min(n, m))(の改変) /* * 与えられた n×m 行列 A と n 次元ベクトル b に対し, * 線形方程式 A x = b の特殊解 x0(m 次元ベクトル)を返す(なければ空リスト) * また同次形 A x = 0 の解空間の基底(m 次元ベクトル)のリストを xs に格納する. */ template pair>, vi> gauss_jordan_elimination1(Matrix& A) { // verify : https://judge.yosupo.jp/problem/system_of_linear_equations int n = A.n, m = A.m; // pivots[i] : 第 i 行のピボットが第何列にあるか vi pivots; // 注目位置を v[i][j] とする. int i = 0, j = 0; while (i < n && j < m) { // 注目列の下方の行から非 0 成分を見つける. int i2 = i; while (i2 < n && A[i2][j] == T(0)) i2++; // 見つからなかったら注目位置を右に移す. if (i2 == n) { j++; continue; } // 見つかったら第 i 行とその行を入れ替える. if (i != i2) swap(A[i], A[i2]); // v[i][j] をピボットに選択する. pivots.push_back(j); // v[i][j] が 1 になるよう第 i 行全体を v[i][j] で割る. T vij_inv = T(1) / A[i][j]; repi(j2, j, m - 1) A[i][j2] *= vij_inv; // 第 i 行以外の第 j 列の成分が全て 0 になるよう第 i 行を定数倍して減じる. rep(i2, n) { if (A[i2][j] == T(0) || i2 == i) continue; T mul = A[i2][j]; if (mul != T(0)) { repi(j2, j, m - 1) A[i2][j2] -= A[i][j2] * mul; } } // 注目位置を右下に移す. i++; j++; } int rnk = sz(pivots); // 同次形 A x = 0 の一般解 {x} の基底の構成(任意定数を 1-hot にする) vector> xs; i = 0; rep(j, m) { if (i < rnk && j == pivots[i]) { i++; continue; } vector x(m); x[j] = T(1); rep(i2, i) x[pivots[i2]] = -A[i2][j]; xs.emplace_back(move(x)); } return { xs, pivots }; } //【線形方程式】O(n m min(n, m))(の改変) /* * 与えられた n×m 行列 A と n 次元ベクトル b に対し, * 線形方程式 A x = b の特殊解 x0(m 次元ベクトル)を返す(なければ空リスト) * また同次形 A x = 0 の解空間の基底(m 次元ベクトル)のリストを xs に格納する. */ template int gauss_jordan_elimination2(Matrix& A) { // verify : https://judge.yosupo.jp/problem/system_of_linear_equations int n = A.n, m = A.m; // pivots[i] : 第 i 行のピボットが第何列にあるか vi pivots; // 注目位置を v[i][j] とする. int i = 0, j = 0; while (i < n && j < m) { // 注目列の下方の行から非 0 成分を見つける. int i2 = i; while (i2 < n && A[i2][j] == T(0)) i2++; // 見つからなかったら注目位置を右に移す. if (i2 == n) { j++; continue; } // 見つかったら第 i 行とその行を入れ替える. if (i != i2) swap(A[i], A[i2]); // v[i][j] をピボットに選択する. pivots.push_back(j); // v[i][j] が 1 になるよう第 i 行全体を v[i][j] で割る. T vij_inv = T(1) / A[i][j]; repi(j2, j, m - 1) A[i][j2] *= vij_inv; // 第 i 行以外の第 j 列の成分が全て 0 になるよう第 i 行を定数倍して減じる. rep(i2, n) { if (A[i2][j] == T(0) || i2 == i) continue; T mul = A[i2][j]; if (mul != T(0)) { repi(j2, j, m - 1) A[i2][j2] -= A[i][j2] * mul; } } // 注目位置を右下に移す. i++; j++; } int rnk = sz(pivots); return rnk; } void TLE() { using F = Field; int n, t; cin >> n >> t; Matrix mat(t, n); rep(i, t) rep(j, n) { ull x; cin >> x; x--; mat[i][j] = x; } auto [xs, pivots] = gauss_jordan_elimination1(mat); dumpel(xs); dump(pivots); int h = sz(xs), w = sz(pivots); dump(h, w); vector> ys(h); rep(i, h) { repe(j, pivots) ys[i].push_back(F(xs[i][j])); } dumpel(ys); mint res = 0; mint pow2_64 = mint(2).pow(64); vm pow_pow2_64(20); pow_pow2_64[0] = 1; rep(i, 19) pow_pow2_64[i + 1] = pow_pow2_64[i] * pow2_64; // 0 のとこを決め打って包除原理.もうちょっと定数倍高速化してみた. repb(set_h, h) { int pc_h = popcount(set_h); repb(set_w, w) { int pc_w = popcount(set_w); Matrix mat(pc_h, pc_w); int pt_h = 0; repis(i, set_h) { int pt_w = 0; repis(j, set_w) mat[pt_h][pt_w++] = ys[i][j]; pt_h++; } int r = gauss_jordan_elimination2(mat); // dump(pc_h, pc_w, r, pc_h - r); res += ((h - pc_h + pc_w) & 1 ? -1 : 1) * pow_pow2_64[pc_h - r]; } } EXIT(res); } //【転置】O(h w) /* * a[0..h)[0..w) を転置したものを返す. */ template vector> transpose(const vector>& a) { // verify : https://yukicoder.me/problems/no/1974 int h = sz(a), w = sz(a[0]); vector> b(w, vector(h)); rep(i, h) rep(j, w) b[j][i] = a[i][j]; return b; } int main() { // input_from_file("input.txt"); // output_to_file("output.txt"); using F = Field; mint pow2_64 = mint(2).pow(64); vm pow_pow2_64(20); pow_pow2_64[0] = 1; rep(i, 19) pow_pow2_64[i + 1] = pow_pow2_64[i] * pow2_64; int n, t; cin >> n >> t; Matrix mat(t, n); rep(i, t) rep(j, n) { ull x; cin >> x; x--; mat[i][j] = x; } auto [xs, pivots] = gauss_jordan_elimination1(mat); dumpel(xs); dump(pivots); int w = sz(xs); if (w == 0) EXIT(0); xs = transpose(xs); dumpel(xs); int h = sz(xs); dump(h, w); mint res = 0; vector>> dp(1LL << h); vector> piv(1LL << h); // bitDP してみた.オーダーはしらんけど思った以上に速くなった. repb(set, h) { dump("set:", set); if (set == 0) { res += pow_pow2_64[w]; continue; } int mb = msb(set); int pset = set ^ (1 << mb); dp[set] = dp[pset]; piv[set] = piv[pset]; vector v = xs[mb]; int D = sz(piv[set]); rep(i, D) { int j = piv[set][i]; F mul = v[j]; rep(j, w) v[j] -= dp[set][i][j] * mul; } rep(j, w) { if (v[j] != F(0)) { F v_inv = v[j].inv(); rep(j2, w) v[j2] *= v_inv; dp[set].push_back(v); piv[set].push_back(j); D++; break; } } int pc = popcount(set); res += (pc & 1 ? -1 : 1) * pow_pow2_64[w - D]; dump(dp[set]); dump(piv[set]); } // dumpel(dp); dumpel(piv); EXIT(res); }