結果

問題 No.2272 多項式乗算 mod 258280327
ユーザー MarioYCMarioYC
提出日時 2023-04-14 23:22:26
言語 C++17
(gcc 12.3.0 + boost 1.83.0)
結果
WA  
実行時間 -
コード長 2,451 bytes
コンパイル時間 2,692 ms
コンパイル使用メモリ 205,244 KB
実行使用メモリ 16,128 KB
最終ジャッジ日時 2024-04-18 21:07:48
合計ジャッジ時間 66,213 ms
ジャッジサーバーID
(参考情報)
judge2 / judge4
このコードへのチャレンジ
(要ログイン)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 1,781 ms
13,056 KB
testcase_01 AC 1,798 ms
13,056 KB
testcase_02 AC 1,784 ms
13,056 KB
testcase_03 AC 1,846 ms
12,928 KB
testcase_04 AC 1,797 ms
12,928 KB
testcase_05 AC 1,796 ms
12,928 KB
testcase_06 AC 1,835 ms
12,928 KB
testcase_07 AC 1,820 ms
13,056 KB
testcase_08 AC 1,808 ms
12,800 KB
testcase_09 AC 1,819 ms
13,056 KB
testcase_10 AC 1,785 ms
13,056 KB
testcase_11 AC 1,811 ms
13,056 KB
testcase_12 AC 1,817 ms
12,928 KB
testcase_13 WA -
testcase_14 TLE -
testcase_15 AC 1,771 ms
13,056 KB
testcase_16 AC 1,828 ms
12,928 KB
testcase_17 AC 1,801 ms
13,056 KB
testcase_18 AC 1,763 ms
13,056 KB
testcase_19 AC 1,801 ms
13,056 KB
testcase_20 AC 1,827 ms
13,056 KB
testcase_21 AC 1,770 ms
13,056 KB
testcase_22 AC 1,796 ms
12,928 KB
testcase_23 AC 1,828 ms
12,928 KB
testcase_24 WA -
testcase_25 WA -
testcase_26 WA -
testcase_27 WA -
testcase_28 WA -
testcase_29 WA -
testcase_30 WA -
testcase_31 WA -
testcase_32 WA -
権限があれば一括ダウンロードができます

ソースコード

diff #

#include <bits/stdc++.h>

using namespace std;
using ll = long long;

const int mod = 258280327;

#pragma GCC optimize("Ofast,unroll-loops")
#pragma GCC target("avx,avx2,fma") 
namespace {
    template<int n, typename T>
    void mult(const T *__restrict a, const T *__restrict b, T *__restrict res) {
        if (n <= 64) { // if length is small then naive multiplication if faster
            for (int i = 0; i < n; i++) {
                for (int j = 0; j < n; j++) {
                    res[i + j] = (res[i + j] + a[i] * b[j]) % mod;
                }
            }
        } else {
            // cout << n << endl;
            const int mid = n / 2;
            alignas(64) T btmp[n], E[n] = {};
            auto atmp = btmp + mid;
            for (int i = 0; i < mid; i++) {
                atmp[i] = a[i] + a[i + mid]; // atmp(x) - sum of two halfs a(x)
                if(atmp[i] >= mod) atmp[i] -= mod;
                btmp[i] = b[i] + b[i + mid]; // btmp(x) - sum of two halfs b(x)
                if(btmp[i] >= mod) btmp[i] -= mod;
            }
            // cout << "sum" << endl;
            mult<mid>(atmp, btmp, E); // Calculate E(x) = (alow(x) + ahigh(x)) * (blow(x) + bhigh(x))
            // cout << "mult1" << endl;
            mult<mid>(a + 0, b + 0, res); // Calculate rlow(x) = alow(x) * blow(x)
            // cout << "mult2" << endl;
            mult<mid>(a + mid, b + mid, res + n); // Calculate rhigh(x) = ahigh(x) * bhigh(x)
            // cout << "mult3" << endl;
            for (int i = 0; i < mid; i++) { // Then, calculate rmid(x) = E(x) - rlow(x) - rhigh(x) and write in memory
                const auto tmp = res[i + mid];
                res[i + mid] += E[i] - res[i] - res[i + 2 * mid];
                res[i + mid] %= mod;
                res[i + 2 * mid] += E[i + mid] - tmp - res[i + 3 * mid];
                res[i + 2 * mid] %= mod;
            }
            // cout << "done" << endl;
        }
    }
}

const int nmax = (1 << 12) * 49;
alignas(64) static ll a[nmax],b[nmax],ret[2 * nmax];

int main(){
    ios_base::sync_with_stdio(false);
    cin.tie(0);
    int n,m;
    cin >> n;
    for(int i = 0;i <= n;++i) cin >> a[i];
    cin >> m;
    for(int i = 0;i <= m;++i) cin >> b[i];
    mult<nmax, ll>(a, b, ret);
    cout << n + m << endl;
    for(int i = 0;i <= n + m;++i){
        auto x = ret[i];
        if(ret[i] < 0) ret[i] += mod;
        cout << x << ' ';
    }
    cout << endl;
    return 0;
}
0