KMP算法的舉例加圖解

文章出處:阮一峰,進行重新排版整理

舉例來說,有一個字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一個字符串"ABCDABD"?

在這里插入圖片描述

首先,字符串"BBC ABCDAB ABCDABCDABDE"的第一個字符與搜索詞"ABCDABD"的第一個字符,進行比較。因為B與A不匹配,所以搜索詞后移一位。
在這里插入圖片描述

因為B與A不匹配,搜索詞再往后移。
在這里插入圖片描述
就這樣,直到字符串有一個字符,與搜索詞的第一個字符相同為止。

在這里插入圖片描述

直到字符串有一個字符,與搜索詞對應的字符不相同為止。
在這里插入圖片描述
一個基本事實是,當空格與D不匹配時,你其實知道前面六個字符是"ABCDAB"。KMP算法的想法是,設法利用這個已知信息,不要把"搜索位置"移回已經比較過的位置,繼續把它向后移,這樣就提高了效率。
在這里插入圖片描述

怎么做到這一點呢?可以針對搜索詞,算出一張《部分匹配表》(Partial Match Table)。這張表是如何產生的,后面再介紹,這里只要會用就可以了。
在這里插入圖片描述
已知空格與D不匹配時,前面六個字符"ABCDAB"是匹配的。查表可知,最后一個匹配字符B對應的"部分匹配值"為2,因此按照下面的公式算出向后移動的位數:

移動位數 = 已匹配的字符數 - 對應的部分匹配值

因為 6 - 2 等于4,所以將搜索詞向后移動4位。在這里插入圖片描述
因為空格與C不匹配,搜索詞還要繼續往后移。這時,已匹配的字符數為2(“AB”),對應的"部分匹配值"為0。所以,移動位數 = 2 - 0,結果為 2,于是將搜索詞向后移2位。

在這里插入圖片描述
因為空格與A不匹配,繼續后移一位。
在這里插入圖片描述
逐位比較,直到發現C與D不匹配。于是,移動位數 = 6 - 2,繼續將搜索詞向后移動4位。

在這里插入圖片描述

逐位比較,直到搜索詞的最后一位,發現完全匹配,于是搜索完成。如果還要繼續搜索(即找出全部匹配),移動位數 = 7 - 0,再將搜索詞向后移動7位,這里就不再重復了。

下面介紹《部分匹配表》是如何產生的。

首先,要了解兩個概念:“前綴"和"后綴”。 "前綴"指除了最后一個字符以外,一個字符串的全部頭部組合;"后綴"指除了第一個字符以外,一個字符串的全部尾部組合。
在這里插入圖片描述

"部分匹配值"就是"前綴"和"后綴"的最長的共有元素的長度。以"ABCDABD"為例,

- "A"的前綴和后綴都為空集,共有元素的長度為0;

- "AB"的前綴為[A],后綴為[B],共有元素的長度為0;

- "ABC"的前綴為[A, AB],后綴為[BC, C],共有元素的長度0;

- "ABCD"的前綴為[A, AB, ABC],后綴為[BCD, CD, D],共有元素的長度為0;

- “ABCDA"的前綴為[A, AB, ABC, ABCD],后綴為[BCDA, CDA, DA, A],共有元素為"A”,長度為1;

- “ABCDAB"的前綴為[A, AB, ABC, ABCD, ABCDA],后綴為[BCDAB, CDAB, DAB, AB, B],共有元素為"AB”,長度為2;

- "ABCDABD"的前綴為[A, AB, ABC, ABCD, ABCDA, ABCDAB],后綴為[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的長度為0。
在這里插入圖片描述

"部分匹配"的實質是,有時候,字符串頭部和尾部會有重復。比如,“ABCDAB"之中有兩個"AB”,那么它的"部分匹配值"就是2("AB"的長度)。搜索詞移動的時候,第一個"AB"向后移動4位(字符串長度-部分匹配值),就可以來到第二個"AB"的位置。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/382580.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/382580.shtml
英文地址,請注明出處:http://en.pswp.cn/news/382580.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

C++ STL 容器之 deque簡單使用

#define _CRT_SECURE_NO_WARNINGS #include<iostream> using namespace std; #include <deque> #include <algorithm> /* deque構造函數 deque<T> deqT;//默認構造形式 deque(beg, end);//構造函數將[beg, end)區間中的元素拷貝給本身。 deque(n, elem…

進程間通訊的四種方式

文章目錄共享內存信號管道消息隊列通信方法 無法介于內核態與用戶態的原因 管道&#xff08;不包括命名管道&#xff09; 局限于父子進程間的通信。 消息隊列 在硬、軟中斷中無法無阻塞地接收數據。 信號量 無法介于內核態和用戶態使用。 共享內存 需要信號量輔助&#xff0c;而…

TCP/IP四層模型

文章目錄TCP/IP協議族體系結構以及主要協議數據鏈路層網絡層傳輸層應用層TCP/IP協議族體系結構以及主要協議 TCP/IP協議族是一個四層協議系統&#xff0c;自底而上分別是數據鏈路層、網絡層、傳輸層和應用層。每一層完成不同 的功能&#xff0c;且通過若干協議來實現&#xff…

C++ STL 容器之stack簡單使用

#include <iostream> #include <stack> #include <string> using namespace std; void test1() {stack<int> s;s.push(10);s.push(20);s.push(30);while (s.size()) {cout << "stack top is" << s.top() << endl; // 棧頂…

LRU緩存算法緩存設計和實現

什么是緩存&#xff1f; 舉個例子&#xff0c;去圖書館查資料&#xff0c;一般情況下我們會集中把我們有可能查閱的幾本書從書架取下來&#xff0c;放在我們的桌面上&#xff0c;以便交叉查閱&#xff0c;從而避免頻繁的從座位上跑到書架旁去取書。在這個例子里&#xff0c;書…

C++ STL 容器之queue

#define _CRT_SECURE_NO_WARNINGS #include<iostream> #include<queue> using namespace std;/*Queue所有元素的進出都必須符合”先進先出”的條件&#xff0c; 只有queue的頂端元素&#xff0c; 才有機會被外界取用。 Queue不提供遍歷功能&#xff0c; 也不提供迭…

牛客網選擇題之并發

在分時操作系統中&#xff0c;進程調度采用&#xff08;&#xff09;算法 時間片輪轉某系統中有 3 個并發進程&#xff0c;都需要同類資源 4 個&#xff0c;試問該系統不會發生死鎖的最少資源數是&#xff1a;9 有n個進程&#xff0c;共享的同類資源數為m&#xff0c;則避免死鎖…

牛客網選擇題之linux

1.在RHEL5系統中&#xff0c;小王希望將他執行的ls命令的輸出結果保存在當前目錄下文件output.ls中&#xff0c;以供日后進行分析和使用&#xff0c;但要求不覆蓋原文件的內容&#xff0c;他應該使用的命令是&#xff08; &#xff09; ls>>output.ls > …

C++ STL容器之 list 初步

#include <iostream> #include<algorithm> #include <string> #include <list> using namespace std;//3.6.4.1 list構造函數 //list<T> lstT;//list采用采用模板類實現,對象的默認構造形式&#xff1a; //list(beg, end);//構造函數將[beg, end…

C++ STL容器值set

/* 3.7.2 set常用API 3.7.2.1 set構造函數 set<T> st;//set默認構造函數&#xff1a; mulitset<T> mst; //multiset默認構造函數: set(const set& st);//拷貝構造函數 3.7.2.2 set賦值操作 set & operator(const set & st);//重載等號操作符 swap(st)…

C++ STL容器之map 簡單使用

3.8.2.1 map構造函數 map<T1, T2> mapTT;//map默認構造函數: map(const map &mp);//拷貝構造函數3.8.2.2 map賦值操作 map& operator(const map &mp);//重載等號操作符 swap(mp);//交換兩個集合容器3.8.2.3 map大小操作 size();//返回容器中元素的數目 empty…

Manacher算法圖解

看了好久的Manacher算法&#xff0c;覺得還是要自己畫一遍&#xff0c;自己把代碼寫一遍才能理解 下面分享一下&#xff0c;如果有錯&#xff0c;希望指正 簡陋版本的&#xff0c;但是他基本只是做到了求取最長回文字符串&#xff0c;嚴格來說它并不是Manacher’s Algorithm-…

Flink 客戶端操作命令及可視化工具

Flink提供了豐富的客戶端操作來提交任務和與任務進行交互。下面主要從Flink命令行、Scala Shell、SQL Client、Restful API和 Web五個方面進行整理。 在Flink安裝目錄的bin目錄下可以看到flink&#xff0c;start-scala-shell.sh和sql-client.sh等文件&#xff0c;這些都是客戶…

ySQL挑戰搭建一個簡易的成績管理系統的數據庫

文章為自己搜索網上資源&#xff0c;再在這里進行整理&#xff0c;所以標注為轉載 [實驗步驟](https://www.shiyanlou.com/courses/reports/1347700) 總結做實驗注意事項&#xff1a; 1.添加主鍵 2.主鍵和外鍵的關系 3.注意自增的書寫添加 mysql 如何修改、添加、刪除表主鍵…

網絡之DNS協議圖解

DNS是計算機域名系統 (Domain Name System) 域名系統采用類似目錄樹的等級結構。 域名服務器是指保存有該網絡中所有主機的域名和對應IP地址&#xff0c;并具有將域名轉換為IP地址功能的服務器。 域名服務器為客戶機/服務器模式中的服務器方&#xff0c;它主要有兩種形式&am…

C++ 謂詞,

#define _CRT_SECURE_NO_WARNINGS #include<iostream> #include <vector> #include <algorithm> using namespace std;class GreaterThen20 { public:bool operator()(int val){return val > 20;} };//一元謂詞 void test01() {vector<int>v;v.push…

網絡之ARP

地址解析協議&#xff0c;即ARP&#xff08;Address Resolution Protocol&#xff09;&#xff0c;是根據IP地址獲取物理地址的一個TCP/IP協議。 主機發送信息時將包含目標IP地址的ARP請求廣播到網絡上的所有主機&#xff0c;并接收返回消息&#xff0c;以此確定目標的物理地址…

C++ 內建函數對象

STL內建了一些函數對象。分為:算數類函數對象,關系運算類函數對象&#xff0c;邏輯運算類仿函數。這些仿函數所產生的對象&#xff0c;用法和一般函數完全相同&#xff0c;當然我們還可以產生無名的臨時對象來履行函數功能。使用內建函數對象&#xff0c;需要引入頭文件 functi…

網絡之ICMP協議

ICMP 主要功能&#xff1a; 確認IP包是否成功送達目標地址通知在發送過程當中IP包被廢棄的具體原因改善網絡設置等 在IP通信中如果某個IP包因為某種原因未到達目標地址&#xff0c;那么這個原因由ICMP通知。 過程&#xff08;圖解TCP/IP&#xff09; ICMP類型 常見的&am…

C++ 常用算法之遍歷

#define _CRT_SECURE_NO_WARNINGS #include<iostream> #include <algorithm> #include <vector> #include <functional> using namespace std;/* 遍歷算法 遍歷容器元素 param beg 開始迭代器 param end 結束迭代器 param _callback 函數回調或者函數…