本來沒有學習這種較難的算法的想法的,因為比賽也做不到這種難度的題, 但是最近打牛客多校02,有一題要求 [1,n][1,n][1,n] 中素數的個數,我以為是像莫反一樣容斥,但是后面感覺不行。賽后知道是用 min_25 篩來求,賽時過了一車,因此我也不得不學習這個算法了。
我打算拿洛谷里面的模板來舉例。
就是給你積性函數
f(x)={kx=1g(x)=∑i=0kaixix=pc,p∈prime,c≥1f(x1)f(x2)(x1,x2)=1f(x)=\begin{cases} k & x=1 \\ g(x)=\sum_{i=0}^ka_ix^i & x=p^c,p\in prime,c\ge 1 \\ f(x_1)f(x_2) & (x_1,x_2)=1 \end{cases} f(x)=????kg(x)=∑i=0k?ai?xif(x1?)f(x2?)?x=1x=pc,p∈prime,c≥1(x1?,x2?)=1?
然后讓你求
∑i=1nf(i)\sum_{i=1}^nf(i) i=1∑n?f(i)
其中 n≤1013n\le10^{13}n≤1013
在牛客多校的那個題中,也有 n≤109n\le 10^9n≤109
一般來講,想解決這種問題都要從 iii 最小的質因子入手,因為一個數要么是質數,要么最小的質因子 ≤n0.5\le n^{0.5}≤n0.5,而 n0.5n^{0.5}n0.5 一般都是10610^6106~10710^7107 數量級,可以直接用線性篩得到,也能全部枚舉一次。因此總的思路大概就是先求出 ∑i=1ng(i)\sum_{i=1}^ng(i)∑i=1n?g(i) 然后通過枚舉最小的質因子來修正有超過一個質因子的數的貢獻,這樣能夠很好的解決大質數無法直接得到的問題。
如果沒有學過要怎么求 ∑i=1nik\sum_{i=1}^ni^k∑i=1n?ik,可以看我的博客
基于這個大的思路,我自己感覺 min_25 篩的思路是非常自然,很容易就能記下來。
對于式子
∑i=1nf(i)\sum_{i=1}^nf(i) i=1∑n?f(i)
先將 111 去掉,因為其不包含任何素數,計算的時候容易出現奇怪的錯誤,雖然按照積性函數的定義, f(1)=1f(1)=1f(1)=1。
于是變成
f(1)+∑i=2nf(i)f(1)+\sum_{i=2}^nf(i) f(1)+i=2∑n?f(i)
自己感覺 min_25 篩很關鍵的一點是其能夠快速求出
g(b)=∑p∈prime,p≤bpkg(b)=\sum_{p\in prime,p\le b}p^kg(b)=p∈prime,p≤b∑?pk其中 b=?na?b=\left\lfloor \frac{n}{a} \right\rfloorb=?an??,這也意味著 bbb 的個數只有 O(n0.5)O(n^{0.5})O(n0.5)
雖然只能求出若干次方的和,但只要把每一項都求一次就可以得到原函數了。
然后剩下的和數就能通過枚舉小最小的質因子來考慮
因此 min_25 篩有兩步,分別是求出質數出的函數和,求出所有的函數和
第一步:求出質數處的函數和
這一步的思路就是像我剛才說的,先求出所有的函數和,然后通過枚舉最小的質因子把和數的貢獻剪掉即可。
我們從小到大枚舉素數,并且同時維護所有的 g(b)g(b)g(b),假設當前的素數為 ppp,假設其為第 iii 個素數。那么顯然有 p≤n0.5p\le n^{0.5}p≤n0.5。 我們記第 iii 個素數為 pip_ipi?
對于 g(b)g(b)g(b),我們應該減去 111 ~ bbb 中最小質因子為 ppp 的和數,如果我們直接固定 ppp,也就是只需要考慮 111 ~ ?bp?\left\lfloor \frac{b}{p} \right\rfloor?pb?? 中最小質因子 ≥p\ge p≥p 的數,然后你就會發現這個數剛好就是 g(?bp?)?∑j=1i?1pjkg(\left\lfloor \frac{b}{p} \right\rfloor)-\sum_{j=1}^{i-1}p_j^kg(?pb??)?∑j=1i?1?pjk?,(因為 ggg 函數中包含 <p<p<p 的素數)后者只需要線性篩的時候預處理即可。
然后容斥完以后我們就可以得到所有的 g(b)g(b)g(b) 了。
第二步:求出原函數
這一步的思路是也是拆分成質數貢獻與和數貢獻,質數貢獻可以直接通過前面的 ggg 函數得到,和數貢獻可以通過枚舉最小質因子不斷遞歸求解。
我們另 S(n,x)S(n,x)S(n,x) 表示 111 ~ nnn 中最小質因子 >px>p_x>px? 的數的貢獻之和,我們認為質數本身就是其最小質因子。
然后有
S(n,x)=g(n)?∑i=1xf(pi)+∑pic≤n,i>xf(pic)(S(?npic?,i+1)+[c>1])S(n,x)=g(n)-\sum_{i=1}^xf(p_i)+\sum_{p_i^c\le n,i>x}f(p_i^c)(S(\left\lfloor\frac{n}{p_i^c}\right\rfloor,i+1)+[c>1]) S(n,x)=g(n)?i=1∑x?f(pi?)+pic?≤n,i>x∑?f(pic?)(S(?pic?n??,i+1)+[c>1])
因為 c>1c>1c>1 的時候 picp_i^cpic? 本身也能夠產生貢獻。
以下是我洛谷模板的代碼
#include <bits/stdc++.h>
#define ll long long
using namespace std;const int mod = 1e9 + 7;int power(int a, int b) {int ret = 1;while (b) {if (b & 1) ret = 1ll * ret * a % mod;a = 1ll * a * a % mod; b >>= 1;}return ret;
}const int inv2 = power(2, mod - 2), inv3 = power(3, mod - 2);
const int N = 1e6 + 10;int cnt, p[N]; bool v[N];
int sp1[N], sp2[N];
ll n, Sqr, w[N];
int tot, g1[N], g2[N], ind1[N], ind2[N];void pre(int n) {v[1] = 1;for (int i = 2; i <= n; i++) {if (!v[i]) {p[++cnt] = i;sp1[cnt] = (sp1[cnt - 1] + i) % mod;sp2[cnt] = (sp2[cnt - 1] + 1ll * i * i) % mod;}for (int j = 1; j <= cnt && i * p[j] <= n; j++) {v[i * p[j]] = 1;if (i % p[j] == 0) break;}}
}int S(ll x, int y) {if (p[y] >= x) return 0;ll k = x <= Sqr ? ind1[x] : ind2[n / x];int ans = (1ll * g2[k] - g1[k] + mod - (sp2[y] - sp1[y]) + mod) % mod;for (int i = y + 1; i <= cnt && 1ll * p[i] * p[i] <= x; i++) {ll pe = p[i];for (int e = 1; pe <= x; e++, pe *= p[i]) {ll xx = pe % mod;ans = (ans + xx * (xx - 1) % mod * (S(x / pe, i) + (e != 1)) % mod) % mod;}}return ans % mod;
}int main() {// freopen("in.in", "r", stdin);ios::sync_with_stdio(false);cin.tie(nullptr);cin >> n;Sqr = sqrt((long double)n);pre(Sqr);for (ll i = 1, j; i <= n; i = j + 1) {j = n / (n / i);w[++tot] = n / i;int now = w[tot] % mod;g1[tot] = 1ll * now * (now + 1) / 2 % mod - 1;g2[tot] = 1ll * now * (now + 1) / 2 % mod * (2 * now + 1) % mod * inv3 % mod - 1;if (n / i <= Sqr) ind1[n / i] = tot;else ind2[n / (n / i)] = tot;}for (int i = 1; i <= cnt; i++) {for (int j = 1; j <= tot && 1ll * p[i] * p[i] <= w[j]; j++) {ll k = w[j] / p[i] <= Sqr ? ind1[w[j] / p[i]] : ind2[n / (w[j] / p[i])];g1[j] = (g1[j] - 1ll * p[i] * (g1[k] - sp1[i - 1] + mod) % mod + mod) % mod;g2[j] = (g2[j] - 1ll * p[i] * p[i] % mod * (g2[k] - sp2[i - 1] + mod) % mod + mod) % mod;}}cout << (S(n, 0) + 1) % mod << "\n";return 0;
}
時間復雜度
第一步的時間復雜度是 O(n0.75ln?n)O(\frac{n^{0.75}}{\ln n})O(lnnn0.75?) 是沒有爭議的,有一些人底下寫的是 log?\loglog 也是對的,因為只有常數倍的差別
對于第一重循環,因為素數的密度的是 1ln?n\frac{1}{\ln n}lnn1?,所以可以提出一個 1ln?n\frac{1}{\ln n}lnn1?
然后變為這個式子 O(∑i=1ni+ni)=O(∑i=1nni)=O(n∑i=1n1i)=O(n∫1n1xdx)=O(nn∣1n)=O(n0.75)O(\sum_{i=1}^{\sqrt n}\sqrt i+\sqrt \frac{n}{i})=O(\sum_{i=1}^{\sqrt n}\sqrt \frac{n}{i})=O(\sqrt n\sum_{i=1}^{\sqrt n}\sqrt \frac{1}{i})=O(\sqrt n\int_{1}^{n} \frac{1}{\sqrt x}\, dx)=O(\sqrt n\sqrt n|_{1}^{\sqrt n})=O(n^{0.75})O(∑i=1n??i?+in??)=O(∑i=1n??in??)=O(n?∑i=1n??i1??)=O(n?∫1n?x?1?dx)=O(n?n?∣1n??)=O(n0.75)
第二步我在網上沒有找到具體的證明,自己也感覺比較難證明,但是聽說是一般情況是 O(n1?δ)O(n^{1-\delta})O(n1?δ),但是如果 n≤1013n\le 10^{13}n≤1013,就滿足 O(n0.75ln?n)O(\frac{n^{0.75}}{\ln n})O(lnnn0.75?),基本適合OI的范圍。
學完 min_25 篩,就會發現前面那個求素數個數的問題實在是太簡單了,連 SSS 函數都不用算,直接把 ggg 函數計算以下就行了,然后把多項式設置為 f(x)=1f(x)=1f(x)=1 即可。