[Algorithm] C++ 백준 22289번: 큰 수 곱셈 (3)

길이 최대 1,000,000자리의 두 비음수 정수 곱을 출력합니다. 복잡도 O(n log n)의 FFT 기반 다중 정밀도 곱셈을 사용하며, 복소수 오차를 줄이기 위해 complex<long double>와 안정 반올림을 적용해 자리올림을 정확히 처리합니다. 0 예외와 블록 기반(10^4) 변환으로 입출력 효율도 확보합니다.

문제 정보

문제: https://www.acmicpc.net/problem/22289
제목: 큰 수 곱셈 (3)
요약: 길이 최대 1,000,000자리의 두 비음수 정수 A, B가 주어지면 A×B를 출력합니다. 0을 제외한 수는 0으로 시작하지 않습니다.
제한: 시간 1초, 메모리 512MB, 각 수 길이 ≤ 1,000,000

입출력 형식/예제

입력

1
A B

출력

1
A×B

예시

1
2
입력: 893724358493284 238947328947329
출력: 213553048277135320552236238436

접근 개요(아이디어 스케치)

자리수 n이 매우 크므로 학교식 곱셈 O(n^2)은 불가 → 컨볼루션 기반 O(n log n) 필요.
문자열을 하위 자릿수부터 BASE=10^4 블록으로 나눠 벡터화 후, FFT로 두 벡터를 컨볼루션.
부동소수 오차 최소화를 위해 complex<long double> 사용, 역변환 후 floor(val+0.5)로 반올림.
컨볼루션 결과에 대해 BASE 기준 자리올림을 수행하고, 최상위 0을 제거.

flowchart TD
  A[입력 문자열 A,B] --> B[BASE=10^4 블록화]
  B --> C[FFT로 컨볼루션]
  C --> D[역FFT + 반올림]
  D --> E[BASE 기준 캐리 전파]
  E --> F[리딩 제로 제거 및 출력]

알고리즘 설계

블록화: 오른쪽에서 BASE_DIGS=4 자리씩 잘라 정수 벡터로 변환(LSB-first).
FFT: 길이를 합의 최솟 두 배 이상 2의 거듭제곱으로 패딩, 비트반전→길이 배수 루프.
안정화: long double로 각 단계의 위상오차를 줄이고, 역FFT 후 반올림.
캐리: 각 블록에 carry 누적, 음수 방지 분기 포함(이론상 양수지만 안전장치).
출력: 최상위 블록은 그대로, 이후 블록은 4자리 채움 출력.

복잡도

시간: O(n log n) (n은 자릿수/블록 개수에 비례)
공간: O(n)

구현 (C++)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
// 더 많은 정보는 42jerrykim.github.io 에서 확인하세요.
#include <bits/stdc++.h>
using namespace std;

using cld = complex<long double>;
const long double PI = acosl(-1.0L);

static void fft(vector<cld>& a, bool invert) {
    int n = (int)a.size();
    for (int i = 1, j = 0; i < n; ++i) {
        int bit = n >> 1;
        for (; j & bit; bit >>= 1) j ^= bit;
        j ^= bit;
        if (i < j) swap(a[i], a[j]);
    }
    for (int len = 2; len <= n; len <<= 1) {
        long double ang = 2 * PI / len * (invert ? -1 : 1);
        cld wlen(cosl(ang), sinl(ang));
        for (int i = 0; i < n; i += len) {
            cld w(1);
            for (int j = 0; j < len / 2; ++j) {
                cld u = a[i + j];
                cld v = a[i + j + len / 2] * w;
                a[i + j] = u + v;
                a[i + j + len / 2] = u - v;
                w *= wlen;
            }
        }
    }
    if (invert) {
        for (int i = 0; i < n; ++i) a[i] /= n;
    }
}

int main() {
    ios::sync_with_stdio(false);
    cin.tie(nullptr);

    string sa, sb;
    if (!(cin >> sa >> sb)) return 0;
    if (sa == "0" || sb == "0") { cout << 0; return 0; }

    const int BASE = 10000;      // 10^4
    const int BASE_DIGS = 4;

    auto toBlocks = [&](const string& s) {
        vector<int> a;
        a.reserve((s.size() + BASE_DIGS - 1) / BASE_DIGS);
        for (int i = (int)s.size(); i > 0; i -= BASE_DIGS) {
            int x = 0;
            int start = max(0, i - BASE_DIGS);
            for (int j = start; j < i; ++j) x = x * 10 + (s[j] - '0');
            a.push_back(x); // least significant block first
        }
        return a;
    };

    vector<int> A = toBlocks(sa), B = toBlocks(sb);

    int n = 1;
    while (n < (int)A.size() + (int)B.size()) n <<= 1;
    vector<cld> fa(n), fb(n);
    for (size_t i = 0; i < A.size(); ++i) fa[i] = (long double)A[i];
    for (size_t i = 0; i < B.size(); ++i) fb[i] = (long double)B[i];

    fft(fa, false);
    fft(fb, false);
    for (int i = 0; i < n; ++i) fa[i] *= fb[i];
    fft(fa, true);

    vector<long long> res(n);
    for (int i = 0; i < n; ++i) {
        long double val = fa[i].real();
        res[i] = (long long)floorl(val + 0.5L); // 안정적 반올림
    }

    long long carry = 0;
    for (size_t i = 0; i < res.size(); ++i) {
        long long cur = res[i] + carry;
        if (cur >= 0) {
            res[i] = cur % BASE;
            carry = cur / BASE;
        } else {
            long long k = (-cur + BASE - 1) / BASE;
            cur += k * BASE;
            res[i] = cur % BASE;
            carry = (cur / BASE) - k;
        }
    }
    while (carry > 0) { res.push_back(carry % BASE); carry /= BASE; }
    while (res.size() > 1 && res.back() == 0) res.pop_back();

    cout << res.back();
    for (int i = (int)res.size() - 2; i >= 0; --i) {
        cout << setw(BASE_DIGS) << setfill('0') << (int)res[i];
    }
    return 0;
}