結果

問題 No.1901 bitwise xor convolution (characteristic 2)
ユーザー koba-e964koba-e964
提出日時 2023-03-28 00:34:19
言語 Rust
(1.77.0)
結果
AC  
実行時間 1,222 ms / 4,000 ms
コード長 4,383 bytes
コンパイル時間 8,067 ms
コンパイル使用メモリ 177,512 KB
実行使用メモリ 109,876 KB
最終ジャッジ日時 2023-10-19 22:20:53
合計ジャッジ時間 10,705 ms
ジャッジサーバーID
(参考情報)
judge11 / judge12
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 1 ms
4,348 KB
testcase_01 AC 1 ms
4,348 KB
testcase_02 AC 1 ms
4,348 KB
testcase_03 AC 1 ms
4,348 KB
testcase_04 AC 1 ms
4,348 KB
testcase_05 AC 1 ms
4,348 KB
testcase_06 AC 2 ms
4,348 KB
testcase_07 AC 1,221 ms
109,876 KB
testcase_08 AC 1,222 ms
109,876 KB
testcase_09 AC 1,220 ms
109,876 KB
権限があれば一括ダウンロードができます
コンパイルメッセージ
warning: function `bit_conv` is never used
  --> Main.rs:54:4
   |
54 | fn bit_conv(a: u32, b: u32) -> u64 {
   |    ^^^^^^^^
   |
   = note: `#[warn(dead_code)]` on by default

warning: 1 warning emitted

ソースコード

diff #

#[allow(unused_imports)]
use std::cmp::*;
#[allow(unused_imports)]
use std::collections::*;
use std::io::{Write, BufWriter};
// https://qiita.com/tanakh/items/0ba42c7ca36cd29d0ac8
macro_rules! input {
    ($($r:tt)*) => {
        let stdin = std::io::stdin();
        let mut bytes = std::io::Read::bytes(std::io::BufReader::new(stdin.lock()));
        let mut next = move || -> String{
            bytes.by_ref().map(|r|r.unwrap() as char)
                .skip_while(|c|c.is_whitespace())
                .take_while(|c|!c.is_whitespace())
                .collect()
        };
        input_inner!{next, $($r)*}
    };
}

macro_rules! input_inner {
    ($next:expr) => {};
    ($next:expr,) => {};
    ($next:expr, $var:ident : $t:tt $($r:tt)*) => {
        let $var = read_value!($next, $t);
        input_inner!{$next $($r)*}
    };
}

macro_rules! read_value {
    ($next:expr, [ $t:tt ; $len:expr ]) => {
        (0..$len).map(|_| read_value!($next, $t)).collect::<Vec<_>>()
    };
    ($next:expr, $t:ty) => ($next().parse::<$t>().expect("Parse error"));
}

trait Change { fn chmax(&mut self, x: Self); fn chmin(&mut self, x: Self); }
impl<T: PartialOrd> Change for T {
    fn chmax(&mut self, x: T) { if *self < x { *self = x; } }
    fn chmin(&mut self, x: T) { if *self > x { *self = x; } }
}
/*
#[cfg(x86_64)]
fn bit_conv(a: u32, b: u32) -> u64 {
    use std::arch::x86_64::*;
    unsafe {
        let a = _mm_set_epi32(0, 0, 0, a as i32);
        let b = _mm_set_epi32(0, 0, 0, b as i32);
        let prod = _mm_clmulepi64_si128(a, b, 0);
        (_mm_extract_epi32(prod, 1) as u32 as u64) << 32 | _mm_extract_epi32(prod, 0) as u32 as u64
    }
}
#[cfg(not(x86_64))]*/
fn bit_conv(a: u32, b: u32) -> u64 {
    let mut res = 0;
    for i in 0..32 {
        if (a & 1 << i) != 0 {
            res ^= (b as u64) << i;
        }
    }
    res
}

// https://yukicoder.me/problems/no/1901 (4)
// アダマール変換 -> 点ごとの積 -> アダマール変換 -> 2^n で割る をすればよく、
// そのために各点で n+1 整数係数の 32 次未満・64 次未満の多項式を持ちたい。
// これは 32bit 整数・64bit 整数を n+1 個持つ方針でできる。
// 計算量は O(2^n n^2)、ただし _mm_clmulepi64_si128 を 2^n (n^2/2 + O(n)) 回呼ぶ。
fn main() {
    let out = std::io::stdout();
    let mut out = BufWriter::new(out.lock());
    macro_rules! puts {($($format:tt)*) => (let _ = write!(out,$($format)*););}
    #[allow(unused)]
    macro_rules! putvec {
        ($v:expr) => {
            for i in 0..$v.len() {
                puts!("{}{}", $v[i], if i + 1 == $v.len() {"\n"} else {" "});
            }
        }
    }
    input! {
        n: usize,
        a: [[i32; 32]; 1 << n],
        b: [[i32; 32]; 1 << n],
    }
    let mut x = vec![[0u32; 32]; 1 << n];
    let mut y = vec![[0u32; 32]; 1 << n];
    for i in 0..1 << n {
        for j in 0..32 {
            if a[i][j] == 1 {
                x[i][j] = 1;
            }
        }
        for j in 0..32 {
            if b[i][j] == 1 {
                y[i][j] = 1;
            }
        }
    }
    for i in 0..n {
        for bits in 0..1 << n {
            if (bits & 1 << i) != 0 { continue; }
            for u in 0..32 {
                let p = x[bits][u];
                let q = x[bits | 1 << i][u];
                x[bits][u] = p.wrapping_add(q);
                x[bits | 1 << i][u] = p.wrapping_sub(q);
                let p = y[bits][u];
                let q = y[bits | 1 << i][u];
                y[bits][u] = p.wrapping_add(q);
                y[bits | 1 << i][u] = p.wrapping_sub(q);
            }
        }
    }
    let mut prod = vec![[0u32; 63]; 1 << n];
    for bits in 0..1 << n {
        for i in 0..32 {
            for j in 0..32 {
                prod[bits][i + j] = prod[bits][i + j].wrapping_add(x[bits][i].wrapping_mul(y[bits][j]));
            }
        }
    }
    for i in 0..n {
        for bits in 0..1 << n {
            if (bits & 1 << i) != 0 { continue; }
            for u in 0..63 {
                let p = prod[bits][u];
                let q = prod[bits | 1 << i][u];
                prod[bits][u] = p.wrapping_add(q);
                prod[bits | 1 << i][u] = p.wrapping_sub(q);
            }
        }
    }
    for v in &mut prod {
        for j in 0..63 {
            v[j] = (v[j] >> n) & 1;
        }
        putvec!(v);
    }
}
0