結果

問題 No.940 ワープ ε=ε=ε=ε=ε=│;p>д<│
ユーザー maspymaspy
提出日時 2019-12-04 10:48:46
言語 Python3
(3.12.2 + numpy 1.26.4 + scipy 1.12.0)
結果
AC  
実行時間 544 ms / 5,000 ms
コード長 2,782 bytes
コンパイル時間 199 ms
コンパイル使用メモリ 11,080 KB
実行使用メモリ 132,152 KB
最終ジャッジ日時 2023-08-20 01:52:28
合計ジャッジ時間 7,970 ms
ジャッジサーバーID
(参考情報)
judge15 / judge12
このコードへのチャレンジ(β)

テストケース

テストケース表示
入力 結果 実行時間
実行使用メモリ
testcase_00 AC 125 ms
29,984 KB
testcase_01 AC 125 ms
29,776 KB
testcase_02 AC 124 ms
29,956 KB
testcase_03 AC 125 ms
30,360 KB
testcase_04 AC 120 ms
29,816 KB
testcase_05 AC 126 ms
30,348 KB
testcase_06 AC 127 ms
30,124 KB
testcase_07 AC 122 ms
30,104 KB
testcase_08 AC 125 ms
30,104 KB
testcase_09 AC 123 ms
30,236 KB
testcase_10 AC 124 ms
30,196 KB
testcase_11 AC 129 ms
30,032 KB
testcase_12 AC 129 ms
30,320 KB
testcase_13 AC 128 ms
30,220 KB
testcase_14 AC 127 ms
29,980 KB
testcase_15 AC 210 ms
42,912 KB
testcase_16 AC 391 ms
77,428 KB
testcase_17 AC 215 ms
63,348 KB
testcase_18 AC 236 ms
70,896 KB
testcase_19 AC 214 ms
62,940 KB
testcase_20 AC 267 ms
80,412 KB
testcase_21 AC 189 ms
50,232 KB
testcase_22 AC 363 ms
91,332 KB
testcase_23 AC 399 ms
78,868 KB
testcase_24 AC 380 ms
94,328 KB
testcase_25 AC 527 ms
124,332 KB
testcase_26 AC 544 ms
132,152 KB
権限があれば一括ダウンロードができます

ソースコード

diff #

import sys
read = sys.stdin.buffer.read
readline = sys.stdin.buffer.readline
readlines = sys.stdin.buffer.readlines

import numpy as np

X,Y,Z = map(int,read().split())

MOD = 10 ** 9 + 7

def cumprod(arr,MOD):
    L = len(arr); Lsq = int(L**.5+1)
    arr = np.resize(arr,Lsq**2).reshape(Lsq,Lsq)
    for n in range(1,Lsq):
        arr[:,n] *= arr[:,n-1]; arr[:,n] %= MOD
    for n in range(1,Lsq):
        arr[n] *= arr[n-1,-1]; arr[n] %= MOD
    return arr.ravel()[:L]

def make_fact(U,MOD):
    x = np.arange(U,dtype=np.int64); x[0] = 1
    fact = cumprod(x,MOD)
    x = np.arange(U,0,-1,dtype=np.int64); x[0] = pow(int(fact[-1]),MOD-2,MOD)
    fact_inv = cumprod(x,MOD)[::-1]
    return fact,fact_inv

def make_power(a,L,MOD):
    B = L.bit_length()
    x = np.empty(1 + (1<<B),np.int64)
    x[0] = 1; x[1] = a
    for n in range(B):
        x[1<<n:1<<(n+1)] = x[:1<<n] * (a * x[(1<<n)-1] % MOD) % MOD
    return x[:L]

U = X + Y + Z + 100
fact,fact_inv = make_fact(U,MOD)
power2 = make_power(2,U,MOD)

def fft_convolve(f,g,MOD=MOD):
    """
    数列 (多項式) f, g の畳み込みの計算.上下 15 bitずつ分けて計算することで,
    30 bit以下の整数,長さ 250000 程度の数列での計算が正確に行える.
    """
    fft = np.fft.rfft; ifft = np.fft.irfft
    Lf = len(f); Lg = len(g); L = Lf + Lg - 1
    fft_len = 1 << L.bit_length()
    fl = f & (1 << 15) - 1; fh = f >> 15
    gl = g & (1 << 15) - 1; gh = g >> 15
    conv = lambda f,g: ifft(fft(f,fft_len) * fft(g,fft_len))[:L]
    x = conv(fl,gl) % MOD
    y = conv(fl+fh,gl+gh) % MOD
    z = conv(fh,gh) % MOD
    a, b, c = map(lambda x: (x + .5).astype(np.int64), [x,y,z])
    return (a + ((b - a - c) << 15) + (c << 30)) % MOD

def f(X,Y,Z):
    if X==Y==Z==0:
        return 1
    """
    (2-2P/1-2P)^{Z+1} * (1/4-4P) の x^Xy^Y の係数を返す
    """
    N = Z + 1
    U = X + Y + 100
    # 分子
    A = fact[N] * fact_inv[:N+1] % MOD * fact_inv[:N+1][::-1]
    A[1::2] *= (-1); A %= MOD
    A = A[:U]; A *= power2[N]; A %= MOD
    # 分母の逆
    B = fact[N-1:N+U-1] * fact_inv[N-1] % MOD * fact_inv[:U] % MOD
    B *= power2[:U]; B %= MOD
    C = fft_convolve(A,B)[:U]
    # 4 - 4P で割る
    C *= (MOD+1)//4; C %= MOD; np.cumsum(C,out=C); C %= MOD
    # 各 n に対して、P^n = (x + y - xy)^n での x^Xy^Y の係数を求める
    L = max(X,Y); R = X+Y
    x = np.zeros(R-L+1,np.int64)
    x = fact[L:R+1].copy()
    x *= fact_inv[L-Y:R-Y+1]; x %= MOD
    x *= fact_inv[L-X:R-X+1]; x %= MOD
    x *= fact_inv[0:X+Y-L+1][::-1]; x %= MOD
    x[(R+L+1)%2::2] *= (-1)
    return (x * C[L:R+1] % MOD).sum() % MOD

# 3, 13, 512, 882313923
# f(1,1,0), f(1,1,1), f(10,0,0), f(31,53,6000), f(53,31,6000)
# f(6000,31,53), f(6000,53,31)

answer = f(X,Y,Z)
print(answer)
0