min_25篩學習筆記+牛客多校02E

本來沒有學習這種較難的算法的想法的，因為比賽也做不到這種難度的題，但是最近打牛客多校02，有一題要求 $[1, n]$ 中素數的個數，我以為是像莫反一樣容斥，但是后面感覺不行。賽后知道是用 min_25 篩來求，賽時過了一車，因此我也不得不學習這個算法了。

我打算拿洛谷里面的模板來舉例。

就是給你積性函數
$f(x)={kx=1g(x)=∑i=0kaixix=pc,p∈prime,c≥1f(x1)f(x2)(x1,x2)=1f(x)=\begin{cases} k & x=1 \\ g(x)=\sum_{i=0}^ka_ix^i & x=p^c,p\in prime,c\ge 1 \\ f(x_1)f(x_2) & (x_1,x_2)=1 \end{cases}$

然后讓你求
$∑i=1nf(i)\sum_{i=1}^nf(i)$

其中 $n≤1013n\le10^{13}$

在牛客多校的那個題中，也有 $n≤109n\le 10^9$

一般來講，想解決這種問題都要從 $i$ 最小的質因子入手，因為一個數要么是質數，要么最小的質因子 $≤n0.5\le n^{0.5}$ ，而 $n^{0.5}$ 一般都是 $10^6$ ~ $10^7$ 數量級，可以直接用線性篩得到，也能全部枚舉一次。因此總的思路大概就是先求出 $∑i=1ng(i)\sum_{i=1}^ng(i)$ 然后通過枚舉最小的質因子來修正有超過一個質因子的數的貢獻，這樣能夠很好的解決大質數無法直接得到的問題。

如果沒有學過要怎么求 $∑i=1nik\sum_{i=1}^ni^k$ ，可以看我的博客

基于這個大的思路，我自己感覺 min_25 篩的思路是非常自然，很容易就能記下來。

對于式子
$∑i=1nf(i)\sum_{i=1}^nf(i)$

先將 $1$ 去掉，因為其不包含任何素數，計算的時候容易出現奇怪的錯誤，雖然按照積性函數的定義， $f (1) = 1$ 。

于是變成
$f(1)+∑i=2nf(i)f(1)+\sum_{i=2}^nf(i)$

自己感覺 min_25 篩很關鍵的一點是其能夠快速求出
$g(b)=∑p∈prime,p≤bpkg(b)=\sum_{p\in prime,p\le b}p^k$ 其中 $b=?na?b=\left\lfloor \frac{n}{a} \right\rfloor$ ，這也意味著 $b$ 的個數只有 $O(n^{0.5})$

雖然只能求出若干次方的和，但只要把每一項都求一次就可以得到原函數了。

然后剩下的和數就能通過枚舉小最小的質因子來考慮

因此 min_25 篩有兩步，分別是求出質數出的函數和，求出所有的函數和

第一步：求出質數處的函數和

這一步的思路就是像我剛才說的，先求出所有的函數和，然后通過枚舉最小的質因子把和數的貢獻剪掉即可。

我們從小到大枚舉素數，并且同時維護所有的 $g (b)$ ，假設當前的素數為 $p$ ，假設其為第 $i$ 個素數。那么顯然有 $p≤n0.5p\le n^{0.5}$ 。我們記第 $i$ 個素數為 $p_i$

對于 $g (b)$ ，我們應該減去 $1$ ~ $b$ 中最小質因子為 $p$ 的和數，如果我們直接固定 $p$ ，也就是只需要考慮 $1$ ~ $?bp?\left\lfloor \frac{b}{p} \right\rfloor$ 中最小質因子 $≥p\ge p$ 的數，然后你就會發現這個數剛好就是 $g(?bp?)?∑j=1i?1pjkg(\left\lfloor \frac{b}{p} \right\rfloor)-\sum_{j=1}^{i-1}p_j^k$ ，（因為 $g$ 函數中包含 $< p$ 的素數）后者只需要線性篩的時候預處理即可。

然后容斥完以后我們就可以得到所有的 $g (b)$ 了。

第二步：求出原函數

這一步的思路是也是拆分成質數貢獻與和數貢獻，質數貢獻可以直接通過前面的 $g$ 函數得到，和數貢獻可以通過枚舉最小質因子不斷遞歸求解。

我們另 $S (n, x)$ 表示 $1$ ~ $n$ 中最小質因子 $p_x$ 的數的貢獻之和，我們認為質數本身就是其最小質因子。

然后有
$S(n,x)=g(n)?∑i=1xf(pi)+∑pic≤n,i>xf(pic)(S(?npic?,i+1)+[c>1])S(n,x)=g(n)-\sum_{i=1}^xf(p_i)+\sum_{p_i^c\le n,i>x}f(p_i^c)(S(\left\lfloor\frac{n}{p_i^c}\right\rfloor,i+1)+[c>1])$

因為 $c > 1$ 的時候 $p_i^c$ 本身也能夠產生貢獻。

以下是我洛谷模板的代碼

#include <bits/stdc++.h>
#define ll long long
using namespace std;const int mod = 1e9 + 7;int power(int a, int b) {int ret = 1;while (b) {if (b & 1) ret = 1ll * ret * a % mod;a = 1ll * a * a % mod; b >>= 1;}return ret;
}const int inv2 = power(2, mod - 2), inv3 = power(3, mod - 2);
const int N = 1e6 + 10;int cnt, p[N]; bool v[N];
int sp1[N], sp2[N];
ll n, Sqr, w[N];
int tot, g1[N], g2[N], ind1[N], ind2[N];void pre(int n) {v[1] = 1;for (int i = 2; i <= n; i++) {if (!v[i]) {p[++cnt] = i;sp1[cnt] = (sp1[cnt - 1] + i) % mod;sp2[cnt] = (sp2[cnt - 1] + 1ll * i * i) % mod;}for (int j = 1; j <= cnt && i * p[j] <= n; j++) {v[i * p[j]] = 1;if (i % p[j] == 0) break;}}
}int S(ll x, int y) {if (p[y] >= x) return 0;ll k = x <= Sqr ? ind1[x] : ind2[n / x];int ans = (1ll * g2[k] - g1[k] + mod - (sp2[y] - sp1[y]) + mod) % mod;for (int i = y + 1; i <= cnt && 1ll * p[i] * p[i] <= x; i++) {ll pe = p[i];for (int e = 1; pe <= x; e++, pe *= p[i]) {ll xx = pe % mod;ans = (ans + xx * (xx - 1) % mod * (S(x / pe, i) + (e != 1)) % mod) % mod;}}return ans % mod;
}int main() {// freopen("in.in", "r", stdin);ios::sync_with_stdio(false);cin.tie(nullptr);cin >> n;Sqr = sqrt((long double)n);pre(Sqr);for (ll i = 1, j; i <= n; i = j + 1) {j = n / (n / i);w[++tot] = n / i;int now = w[tot] % mod;g1[tot] = 1ll * now * (now + 1) / 2 % mod - 1;g2[tot] = 1ll * now * (now + 1) / 2 % mod * (2 * now + 1) % mod * inv3 % mod - 1;if (n / i <= Sqr) ind1[n / i] = tot;else ind2[n / (n / i)] = tot;}for (int i = 1; i <= cnt; i++) {for (int j = 1; j <= tot && 1ll * p[i] * p[i] <= w[j]; j++) {ll k = w[j] / p[i] <= Sqr ? ind1[w[j] / p[i]] : ind2[n / (w[j] / p[i])];g1[j] = (g1[j] - 1ll * p[i] * (g1[k] - sp1[i - 1] + mod) % mod + mod) % mod;g2[j] = (g2[j] - 1ll * p[i] * p[i] % mod * (g2[k] - sp2[i - 1] + mod) % mod + mod) % mod;}}cout << (S(n, 0) + 1) % mod << "\n";return 0;
}

時間復雜度

第一步的時間復雜度是 $O(n0.75ln?n)O(\frac{n^{0.75}}{\ln n})$ 是沒有爭議的，有一些人底下寫的是 $log?\log$ 也是對的，因為只有常數倍的差別

對于第一重循環，因為素數的密度的是 $1ln?n\frac{1}{\ln n}$ ，所以可以提出一個 $1ln?n\frac{1}{\ln n}$

然后變為這個式子 $O(∑i=1ni+ni)=O(∑i=1nni)=O(n∑i=1n1i)=O(n∫1n1xdx)=O(nn∣1n)=O(n0.75)O(\sum_{i=1}^{\sqrt n}\sqrt i+\sqrt \frac{n}{i})=O(\sum_{i=1}^{\sqrt n}\sqrt \frac{n}{i})=O(\sqrt n\sum_{i=1}^{\sqrt n}\sqrt \frac{1}{i})=O(\sqrt n\int_{1}^{n} \frac{1}{\sqrt x}\, dx)=O(\sqrt n\sqrt n|_{1}^{\sqrt n})=O(n^{0.75})$

第二步我在網上沒有找到具體的證明，自己也感覺比較難證明，但是聽說是一般情況是 $O(n1?δ)O(n^{1-\delta})$ ，但是如果 $n≤1013n\le 10^{13}$ ，就滿足 $O(n0.75ln?n)O(\frac{n^{0.75}}{\ln n})$ ，基本適合OI的范圍。

學完 min_25 篩，就會發現前面那個求素數個數的問題實在是太簡單了，連 $S$ 函數都不用算，直接把 $g$ 函數計算以下就行了，然后把多項式設置為 $f (x) = 1$ 即可。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/89622.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/89622.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/89622.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！