KMP 字符串hash算法

kmp算法

最大相同真前后綴:

如?ababa的最大真前后綴為aba, 而不是ababa(真前后綴與真子集類似,不可是本身,不然沒意義)

所以next[1]? = 0;//string的下標從1開始

kmp模擬

next初始化:

注意:下標從1開始

KMP用法示例code

例題1:斤斤計較的小z

link:1.斤斤計較的小Z - 藍橋云課

code

#include "bits/stdc++.h"
using namespace std;
using ll = long long;
const ll MAXN = 1e6 + 7;
char p[MAXN], s[MAXN];
ll n, m;
ll nex[MAXN];int main()
{ll ans = 0;cin>>p+1>>s+1;// 保證字符串下標從1開始m = strlen(p + 1);n = strlen(s + 1);// init nexnex[0] = nex[1] = 0;for(int i = 2, j = 0; i <= m; i++){while(j && p[i] != p[j + 1]) j = nex[j];if(p[i] == p[j + 1]) j++;nex[i] = j;}// KMPfor(int i = 1, j = 0; i <= n; i++){while(j && s[i] != p[j + 1]) j = nex[j];if(s[i] == p[j + 1]) j++;if(j == m) ans++;}cout<<ans<<endl;return 0;
}

字符串hash

字符串hash初始化

使用ull類型,不用擔心溢出(溢出時自動取模,不會影響結果)

tips:
  • s[i] - 'A' + 1是為了保證其不為0,如字符串為AAA時,不加1的話,其哈希值為0,與A,AA哈希值相同,這是我們不希望的
  • 更方便地,我們直接令h[i] = h[i-1] * base + s[i]即可
  • 注意base值要比字符值的范圍更大,以降低hash沖突的概率(一般設置為131)

獲取字串s[l] ~ s[r]的hash

例題1的字符串hash解法

#include "bits/stdc++.h"
using namespace std;
using ll = long long;
using ull = unsigned long long;
const ll MAXN = 1e6 + 7;
ull hp[MAXN], hs[MAXN], b[MAXN];// hs[i]:s[1]~s[i]對應的hash值;  b[i]:base的i次方
ull base = 131;
char p[MAXN], s[MAXN];
ll n, m;ull getHash(ull* h, ull bg, ull ed)
{return h[ed] - h[bg] * b[ed - bg];// ull溢出相當于自動取模, 所以不用擔心溢出
}int main()
{ll ans = 0;cin>>p+1>>s+1;// 保證字符串下標從1開始m = strlen(p + 1);n = strlen(s + 1);// init hp, hs, bb[0] = 1;for(int i = 1; i <= n; i++){b[i] = base * b[i-1];hp[i] = hp[i-1] * base + p[i];hs[i] = hs[i-1] * base + s[i];}// 匹配相同字符串(利用hash值)for(int i = 1; i + m - 1 <= n; i++){if(getHash(hp, 1, m) == getHash(hs, i, i + m - 1)) ans++;}cout<<ans<<endl;return 0;
}

總結

KMP與字符串hash都是用于字符串匹配的算法,字符串hash非常簡單(雖然有極小概率的hash沖突導致判斷失誤,匹配失敗),KMP算法更加嚴謹;

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/96772.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/96772.shtml
英文地址,請注明出處:http://en.pswp.cn/web/96772.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

HOT100--Day22--74. 搜索二維矩陣,34. 在排序數組中查找元素的第一個和最后一個位置,33. 搜索旋轉排序數組

HOT100–Day22–74. 搜索二維矩陣&#xff0c;34. 在排序數組中查找元素的第一個和最后一個位置&#xff0c;33. 搜索旋轉排序數組 每日刷題系列。今天的題目是《力扣HOT100》題單。 題目類型&#xff1a;二分查找。 關鍵&#xff1a; 今天的題目都是“多次二分” 74題&#xf…

Java分布式鎖實戰指南:從理論到實踐

Java分布式鎖實戰指南&#xff1a;從理論到實踐 前言 在分布式系統中&#xff0c;傳統的單機鎖機制無法滿足跨進程、跨機器的同步需求。分布式鎖應運而生&#xff0c;成為保證分布式系統數據一致性的關鍵技術。本文將全面介紹Java中分布式鎖的實現方式和最佳實踐。 1. 分布式鎖…

(二叉樹) 本節目標 1. 掌握樹的基本概念 2. 掌握二叉樹概念及特性 3. 掌握二叉樹的基本操作 4. 完成二叉樹相關的面試題練習

二叉樹1. 樹型結構&#xff08;了解&#xff09;1.1 概念1.2 概念&#xff08;重要&#xff09;1.3 樹的表示形式&#xff08;了解&#xff09;1.4 樹的應用2. 二叉樹&#xff08;重點&#xff09;2.1 概念2.2 兩種特殊的二叉樹2.3 二叉樹的性質2.4 二叉樹的存儲2.5 二叉樹的基…

【Zephyr電源與功耗專題】13_PMU電源驅動介紹

文章目錄前言一、PMU系統介紹二、Zephyr系統下驅動PMU的組成2.1&#xff1a;PMU系統在Zephyr上包括五大部分&#xff1a;2.2&#xff1a;功能說明2.3&#xff1a;B-core功能說明(Freertos)三、PMU各驅動API詳解3.1:Power_domain3.1.1&#xff1a;初始化3.1.2&#xff1a;rpmsg回…

華清遠見25072班網絡編程學習day5

作業0> 將IO多路復用實現TCP并發服務器實現一遍程序源碼&#xff1a;#include <25072head.h> #define SER_IP "192.168.153.128" //服務器ip地址 #define SER_PORT 8888 //服務器端口號 int main(int argc, const char *argv[]) {//1、創建一個…

【數據結構--順序表】

順序表和鏈表 1.線性表&#xff1a; 線性表是n個具有相同特性&#xff08;相同邏輯結構&#xff0c;物理結構&#xff09;的數據元素的有限序列。常見的線性表有&#xff1a;順序表&#xff0c;鏈表&#xff0c;棧&#xff0c;隊列&#xff0c;字符串…線性表在邏輯上是線性結構…

【PyTorch】圖像多分類部署

如果需要在獨立于訓練腳本的新腳本中部署模型&#xff0c;這種情況模型和權重在內存中不存在&#xff0c;因此需要構造一個模型類的對象&#xff0c;然后將存儲的權重加載到模型中。加載模型參數&#xff0c;驗證模型的性能&#xff0c;并在測試數據集上部署模型from torch imp…

FS950R08A6P2B 雙通道汽車級IGBT模塊Infineon英飛凌 電子元器件核心解析

一、核心解析&#xff1a;FS950R08A6P2B 是什么&#xff1f;1. 電子元器件類型FS950R08A6P2B 是英飛凌&#xff08;Infineon&#xff09; 推出的一款 950A/800V 雙通道汽車級IGBT模塊&#xff0c;屬于功率半導體模塊。它采用 EasyPACK 2B 封裝&#xff0c;集成多個IGBT芯片和二…

【系列文章】Linux中的并發與競爭[05]-互斥量

【系列文章】Linux中的并發與競爭[05]-互斥量 該文章為系列文章&#xff1a;Linux中的并發與競爭中的第5篇 該系列的導航頁連接&#xff1a; 【系列文章】Linux中的并發與競爭-導航頁 文章目錄【系列文章】Linux中的并發與競爭[05]-互斥量一、互斥鎖二、實驗程序的編寫2.1驅動…

TensorRT 10.13.3: Limitations

Limitations Shuffle-op can not be transformed to no-op for perf improvement in some cases. For the NCHW32 format, TensorRT takes the third-to-last dimension as the channel dimension. When a Shuffle-op is added like [N, ‘C’, H, 1] -> [‘N’, C, H], the…

Python與Go結合

Python與Go結合的方法Python和Go可以通過多種方式結合使用&#xff0c;通常采用跨語言通信或集成的方式。以下是幾種常見的方法&#xff1a;使用CFFI或CGO進行綁定Python可以通過CFFI&#xff08;C Foreign Function Interface&#xff09;調用Go編寫的庫&#xff0c;而Go可以通…

C++ 在 Visual Studio Release 模式下,調試運行與直接運行 EXE 的區別

前言 在 Visual Studio (以下簡稱 VS) 中開發 C 項目時&#xff0c;我們常常需要在 Debug 和 Release 兩種構建模式之間切換。Debug 模式適合開發和調試&#xff0c;而 Release 模式則針對生產環境&#xff0c;進行代碼優化以提升性能。然而&#xff0c;即使在 Release 模式下&…

南京方言數據集|300小時高質量自然對話音頻|專業錄音棚采集|方言語音識別模型訓練|情感計算研究|方言保護文化遺產數字化|語音情感識別|方言對話系統開發

引言與背景 隨著人工智能技術的快速發展&#xff0c;語音識別和自然語言處理領域對高質量方言數據的需求日益增長。南京方言作為江淮官話的重要分支&#xff0c;承載著豐富的地域文化和語言特色&#xff0c;在語言學研究和方言保護方面具有重要價值。本數據集精心采集了300小時…

基于LSTM深度學習的電動汽車電池荷電狀態(SOC)預測

基于LSTM深度學習的電動汽車電池荷電狀態&#xff08;SOC&#xff09;預測 摘要 電動汽車&#xff08;EV&#xff09;的普及對電池管理系統&#xff08;BMS&#xff09;提出了極高的要求。電池荷電狀態&#xff08;State of Charge, SOC&#xff09;作為BMS最核心的參數之一&am…

Golang語言之數組、切片與子切片

一、數組先記住數組的核心特點&#xff1a;盒子大小一旦定了就改不了&#xff08;長度固定&#xff09;&#xff0c;但盒子里的東西能換&#xff08;元素值可變&#xff09;。就像你買了個能裝 3 個蘋果的鐵皮盒&#xff0c;想多裝 1 個都不行&#xff0c;但里面的蘋果可以換成…

速通ACM省銅第四天 賦源碼(G-C-D, Unlucky!)

目錄 引言&#xff1a; G-C-D, Unlucky! 題意分析 邏輯梳理 代碼實現 結語&#xff1a; 引言&#xff1a; 因為今天打了個ICPC網絡賽&#xff0c;導致坐牢了一下午&#xff0c;沒什么時間打題目了&#xff0c;就打了一道題&#xff0c;所以&#xff0c;今天我們就只講一題了&…

數據鏈路層總結

目錄 &#xff08;一&#xff09;以太網&#xff08;IEEE 802.3&#xff09; &#xff08;1&#xff09;以太網的幀格式 &#xff08;2&#xff09;幀協議類型字段 ①ARP協議 &#xff08;橫跨網絡層和數據鏈路層的協議&#xff09; ②RARP協議 &#xff08;二&#xff…

Scala 新手實戰三案例:從循環到條件,搞定基礎編程場景

Scala 新手實戰三案例&#xff1a;從循環到條件&#xff0c;搞定基礎編程場景 對 Scala 新手來說&#xff0c;單純記語法容易 “學完就忘”&#xff0c;而通過小而精的實戰案例鞏固知識點&#xff0c;是掌握語言的關鍵。本文精選三個高頻基礎場景 ——9 乘 9 乘法口訣表、成績等…

java學習筆記----標識符與變量

1.什么是標識符?Java中變量、方法、類等要素命名時使用的字符序列&#xff0c;稱為標識符。 技巧:凡是自己可以起名字的地方都叫標識符。 比如:類名、方法名、變量名、包名、常量名等 2.標識符的命名規則由26個英文字母大小寫&#xff0c;0-9&#xff0c;或$組成 數字不可以開…

AI產品經理面試寶典第93天:Embedding技術選型與場景化應用指南

1. Embedding技術演進全景解析 1.1 稀疏向量:關鍵詞匹配的基石 1.1.1 問:請說明稀疏向量的適用場景及技術特點 答:稀疏向量適用于關鍵詞精確匹配場景,典型實現包括TF-IDF、BM25和SPLADE。其技術特征表現為50,000+高維向量且95%以上位置為零值,通過余弦或點積計算相似度…