結果

問題 No.2272 多項式乗算 mod 258280327
ユーザー Dmitrii KozyrevDmitrii Kozyrev
提出日時 2023-04-16 04:22:53
言語 C++23
(gcc 12.3.0 + boost 1.83.0)
結果
WA  
実行時間 -
コード長 2,627 bytes
コンパイル時間 4,068 ms
コンパイル使用メモリ 283,288 KB
実行使用メモリ 16,128 KB
最終ジャッジ日時 2024-04-19 19:11:01
合計ジャッジ時間 20,456 ms
ジャッジサーバーID
(参考情報)
judge2 / judge3
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 438 ms
13,056 KB
testcase_01 AC 441 ms
13,184 KB
testcase_02 AC 443 ms
12,800 KB
testcase_03 AC 450 ms
12,928 KB
testcase_04 AC 455 ms
13,056 KB
testcase_05 AC 448 ms
12,928 KB
testcase_06 AC 446 ms
12,928 KB
testcase_07 AC 440 ms
13,056 KB
testcase_08 AC 437 ms
12,928 KB
testcase_09 AC 430 ms
13,056 KB
testcase_10 AC 448 ms
13,056 KB
testcase_11 AC 436 ms
13,184 KB
testcase_12 AC 467 ms
12,928 KB
testcase_13 WA -
testcase_14 WA -
testcase_15 AC 434 ms
12,800 KB
testcase_16 AC 456 ms
13,056 KB
testcase_17 AC 443 ms
13,056 KB
testcase_18 AC 448 ms
12,928 KB
testcase_19 AC 452 ms
13,184 KB
testcase_20 AC 451 ms
13,056 KB
testcase_21 AC 452 ms
12,928 KB
testcase_22 AC 454 ms
12,928 KB
testcase_23 AC 434 ms
12,800 KB
testcase_24 AC 455 ms
12,928 KB
testcase_25 AC 434 ms
13,184 KB
testcase_26 AC 448 ms
13,184 KB
testcase_27 AC 476 ms
13,568 KB
testcase_28 AC 444 ms
13,184 KB
testcase_29 WA -
testcase_30 WA -
testcase_31 WA -
testcase_32 WA -
権限があれば一括ダウンロードができます

ソースコード

diff #

#include <bits/stdc++.h>

#pragma GCC optimize("Ofast,unroll-loops")
#pragma GCC target("avx,avx2,fma") 
using namespace std;
using ll = long long;

const int mod = 258280327;

namespace {
    template<int n, typename T>
    void mult(const T *__restrict a, const T *__restrict b, T *__restrict res) {
        if (n <= 64) { // if length is small then naive multiplication if faster
            for (int i = 0; i < n; i++) {
                for (int j = 0; j < n; j++) {
                    //res[i + j] += (res[i + j] + (ll)a[i] * b[j]) % mod;
                    res[i + j] += a[i] * b[j];
                }
            }
        } else {
            // cout << n << endl;
            const int mid = n / 2;
            alignas(64) T btmp[n], E[n] = {};
            auto atmp = btmp + mid;
            for (int i = 0; i < mid; i++) {
                atmp[i] = (a[i] + a[i + mid]) % mod; // atmp(x) - sum of two halfs a(x)
                //if(atmp[i] >= mod) atmp[i] -= mod;
                btmp[i] = (b[i] + b[i + mid]) % mod; // btmp(x) - sum of two halfs b(x)
                //if(btmp[i] >= mod) btmp[i] -= mod;
            }
            // cout << "sum" << endl;
            mult<mid>(atmp, btmp, E); // Calculate E(x) = (alow(x) + ahigh(x)) * (blow(x) + bhigh(x))
            // cout << "mult1" << endl;
            mult<mid>(a + 0, b + 0, res); // Calculate rlow(x) = alow(x) * blow(x)
            // cout << "mult2" << endl;
            mult<mid>(a + mid, b + mid, res + n); // Calculate rhigh(x) = ahigh(x) * bhigh(x)
            // cout << "mult3" << endl;
            for (int i = 0; i < mid; i++) { // Then, calculate rmid(x) = E(x) - rlow(x) - rhigh(x) and write in memory
                const auto tmp = res[i + mid];
                res[i + mid] += E[i] - res[i] - res[i + 2 * mid];
                //res[i + mid] %= mod;
                res[i + 2 * mid] += E[i + mid] - tmp - res[i + 3 * mid];
                //res[i + 2 * mid] %= mod;
            }
            // cout << "done" << endl;
        }
    }
}

const int nmax = (1 << 12) * 49;
alignas(64) static ll a[nmax],b[nmax],ret[2 * nmax];

int main(){
    ios_base::sync_with_stdio(false);
    cin.tie(0);
    int n,m;
    cin >> n;
    for(int i = 0;i <= n;++i) {
        cin >> a[i];
        a[i] %= mod;
        //a[i] %= mod;
    }
    cin >> m;
    for(int i = 0;i <= m;++i) {
        cin >> b[i];
        b[i] %= mod;
        //b[i] %= mod;
    }
    mult<nmax>(a, b, ret);
    cout << n + m << endl;
    for(int i = 0;i <= n + m;++i){
        auto x = (ret[i] % mod + mod) % mod;
        cout << x << ' ';
    }
    cout << endl;
    return 0;
}
0