正則表達式匹配(動規)

文章目錄

  • 題目
  • 思路
    • 轉移方程
    • 特征
    • 再探 i 和 j
  • 代碼


題目

請實現一個函數用來匹配包含 .* 的正則表達式。模式中的字符 . 表示任意一個字符,而 * 表示它前面的字符可以出現任意次(含0次)。在本題中,匹配是指字符串的所有字符匹配整個模式。例如,字符串 aaa 與模式 a.aab*ac*a 匹配,但與 aa.aab*a 均不匹配。

來源:力扣(LeetCode)


思路

再一次膜拜大佬 作者:jyd
本文基于大佬的思路做自己的細節解析。

其實動規的難點一直在于“找規律”。(恐怕這也是所有算法題的難點,哈哈)

本題其實就是在考察程序員思考問題的全面性。

轉移方程

先建立這道題的轉移方程:

f[i][j] 代表 s 的前 i 個和 p 的前 j 個能否匹配。

當正則表達式中為 正常字符. 時,問題是很好解決的:

f[i][j]=f[i?1][j?1]

前 i 個 s前 j 個 p 是否匹配還要看 前 i-1 個 s前 j-1 個 p 是否匹配。

難點就在于是 字符 + * 時該怎么處理:

分為將字符看成 出現0次(也就是不看這兩位)和 出現多次(看這個組合):

  • 不看:直接砍掉正則串的后面兩個, f[i][j] = f[i][j-2]
  • 看:正則串不動,主串前移一個,f[i][j] = f[i-1][j]

上面兩點,大部分題解已經說的很明白了,但其實又很抽象。我們不妨用例子來看一下:

  • 第一種比較好理解 —— f[i][j] = f[i][j-2]

s=abcd
p=abcde*

將主串的最后一位視為 i(a),正則串最后一位視為 j(*)。顯而易見兩個字符串是完全匹配的。只需要 * 前面的 e(j-1) 出現0次就可(正則串里面的 d 就是 j-2)。

  • 第二種理解起來可能有點抽象 —— f[i][j] = f[i-1][j]

s=abccc
p=abc*

此時 i為cj為*,因為 *前面的字符 可以 出現多次,也就是出現1次的遞歸操作。因此此時我們做的操作就是:

  • 已經知道了 ij(也就是*前的字符) ,那么再試著看看 i-1 還是不是 j

也就是原本相互匹配的字符我們不看了(都做-1操作),ij 彼此是匹配的,理應再看 i-1j-1,但是我們想要 j 多出現幾次,因此 j-1 的操作沒有執行。這就是下圖中,jyd大佬所說的 p[j-2]多出現1次
在這里插入圖片描述
圖中總說 s[i-1] p[j-1] 為什么不是直接用 s[i] p[j] 呢?這個問題講完初始化dp數組首行我們再細說。

特征

弄懂了主要的驗證是否匹配的操作,接下來我們需要弄懂一些特例:

首先明晰一點:正則串和主串都是可以為空串的。

  • 空主串空正則是匹配的。
  • 非空串空正則必不匹配。
  • 空主串非空正則,不能直接判定匹配與否。
  • 非空串非空正則,那肯定是需要計算的了。

我們可以根據上面的特征,來初始化dp二維數組。

行代表s,列代表p,dp[0][j] 代表s為空,dp[i][0]代表p為空。

第四點其實就是我們的轉移方程。因此我們來詳解一下第三點:

s= '' '' 時,p=a*b*c*p=ab* 前者可以做到和空主串完美匹配,后者卻不行。因此我們可以得出以下規律:

在這里插入圖片描述
因此可以得到初始化dp首行的代碼(首列無需做多余更改,空正則除了匹配空主串,其余皆不匹配):

// 初始化dp首行
dp[0][0] = 1;
for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*';
}

再探 i 和 j

我讀完大佬寫的題解的時候其實還是很懵懂的,真正豁然開朗是看了大佬的圖解。大佬做圖解一直有一手的~

下面結合圖解來講一下我們遺留的問題,dp[i][j] 和與之相對應的 s[i-1] p[j-1]

我們借用一下大佬的圖來看一下:
在這里插入圖片描述
我們會發現,前面提到:

  • 第一行,也就是下標為0的那行,代表 s 為空串
  • 第一列,也就是下標為0的那列,代表 p 為空串

我們是從第二行(下標為1的行)和第二列(下標為1的列)開始保存 s 和 p 的非空部分的

因此,舉個具體的例子:dp[1][1]其邏輯含義是,保存的值表示 前1個s前1個p 是否匹配。在物理上代表 s[0]p[0] 組成的點。因此我們也就不難理解大佬圖解中頻繁出現的 dp[i][j]s[i-1] p[j-1] 之間的關系了。


代碼

class Solution {
public:bool isMatch(string s, string p) {int rows = s.size()+1;int cols = p.size()+1;vector<vector<int>> dp(rows, vector<int>(cols, 0));// 初始化dp首行dp[0][0] = 1;for(size_t i = 2; i < cols; i += 2){dp[0][i] = dp[0][i-2] && p[i-1] =='*';}// 動規for(size_t i = 1; i < rows; i++){for(size_t j = 1; j < cols; j++){if(p[j-1] != '*'){if(dp[i-1][j-1] && (s[i-1]==p[j-1] || p[j-1] == '.')){dp[i][j] = 1;}}else{if(dp[i][j-2] || (dp[i-1][j] && (s[i-1] == p[j-2] || p[j-2] == '.'))){dp[i][j] = 1;}}}}return dp[rows-1][cols-1];}
};

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/443796.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/443796.shtml
英文地址,請注明出處:http://en.pswp.cn/news/443796.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

在循環遞增一次的數組中插入元素

文章目錄題目思路如何建立左右區間&#xff1f;如何查找最高點&#xff1f;那我們怎么判斷 num 到底處于什么樣的位置呢&#xff1f;如何確定插入位置&#xff1f;插入元素代碼題目 給一個只循環遞增一次的數組 res&#xff0c;res 滿足首元素大于等于尾元素&#xff0c;形如&…

Unable to find 'struts.multipart.saveDir' property setting.

Unable to find struts.multipart.saveDir property setting. 今天在做工作的時候遇到了這個問題&#xff0c;后來經過百度&#xff0c;終于知道了原因&#xff0c;現在記錄下來&#xff0c;以備以后查看。 1.struts.multipart.saveDir沒有配置 2.struts.multipart.saveDir用…

表示數值的字符串(有限狀態自動機與搜索)

文章目錄題目思路一代碼一思路二代碼二題目 思路一 考察有限狀態自動機&#xff08;參考jyd&#xff09;&#xff1a; 字符類型&#xff1a; 空格 「 」、數字「 0—9 」 、正負號 「 」 、小數點 「 . 」 、冪符號 「 eE 」 。 狀態定義&#xff1a; 按照字符串從左到右的…

樹的子結構

文章目錄題目深搜深搜代碼廣搜廣搜代碼題目 輸入兩棵二叉樹A和B&#xff0c;判斷B是不是A的子結構。(約定空樹不是任意一個樹的子結構) B是A的子結構&#xff0c; 即 A中有出現和B相同的結構和節點值。 例如: 給定的樹 A: 給定的樹 B&#xff1a; 返回 true&#xff0c;因為…

寫題過程中碰見的小問題

文章目錄和--vector二維vector的初始化數組中最大的數max_element()數組所有元素之和accumulate()vector數組去重對pair類型的vector排序對元素都為正整數的vector利用sort默認的升序排列進行降序排列一維數組轉二維數組size_t和int如何不用臨時變量交換兩個數?將類函數的形參…

LeetCode——二叉樹序列化與反序列化

文章目錄題目思路問題一問題二代碼實現題目 請實現兩個函數&#xff0c;分別用來序列化和反序列化二叉樹。 設計一個算法來實現二叉樹的序列化與反序列化。不限定序列 / 反序列化算法執行邏輯&#xff0c;你只需要保證一個二叉樹可以被序列化為一個字符串并且將這個字符串反序…

jsp中生成的驗證碼和存在session里面的驗證碼不一致的處理

今天在調試項目的時候發現&#xff0c;在提交表單的時候的驗證碼有問題&#xff0c;問題是這樣的&#xff1a;就是通過debug模式查看得知&#xff1a;jsp頁面生成的驗證碼和表單輸入的頁面輸入的一樣&#xff0c;但是到后臺執行的時候&#xff0c;你會發現他們是不一樣的&#…

求1~n這n個整數十進制表示中1出現的次數

文章目錄題目思路代碼復雜度分析題目 輸入一個整數 n &#xff0c;求1&#xff5e;n這n個整數的十進制表示中1出現的次數。 例如&#xff0c;輸入12&#xff0c;那么1&#xff5e;12這些整數中包含1 的數字有1、10、11和12。可得1一共出現了5次。 思路 將個位、十位……每位…

求數字序列中的第n位對應的數字

文章目錄題目思路代碼復雜度分析致謝題目 數字以0123456789101112131415…的格式序列化到一個字符序列中。在這個序列中&#xff0c;第5位&#xff08;從下標0開始計數&#xff09;是5&#xff0c;第13位是1&#xff0c;第19位是4&#xff0c;等等。 請寫一個函數&#xff0c…

一學就廢的歸并排序

文章目錄其他與排序有關的文章原理代碼實現復雜度分析其他與排序有關的文章 一學就廢的三種簡單排序【冒泡、插入、選擇】 原理 歸并排序&#xff08;Merge sort&#xff09;&#xff1a; 歸并排序對元素 遞歸地 進行 逐層折半分組&#xff0c;然后從最小分組開始&#xff0c…

神奇的x -x,Lowbit函數的實現方式!

文章目錄-xx & -x&#xff0c;當x為偶數時x & -x&#xff0c;當x為奇數時x&-x 的實際用途-x -x 在二進制里表示對 x 的二進制按位取反(~x)之后再加 1 &#xff0c;即 -x ~x1x & -x&#xff0c;當x為偶數時 在執行 x & -x 時&#xff0c;若 x 為偶數&am…

JAVA實現把指定文件夾下的所有文件壓縮成zip包

1.代碼如下&#xff1a; package cn.gov.csrc.base.util;import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import…

樹狀數組的相關知識 及 求逆序對的運用

文章目錄樹狀數組概念前綴和和區間和樹狀數組原理區間和——單點更新前綴和——區間查詢完整代碼離散化sort函數unique函數去重erase函數僅保留不重復元素通過樹狀數組求逆序對樹狀數組概念 樹狀數組又名二叉索引樹&#xff0c;其查詢與插入的復雜度都為 O(logN)&#xff0c;其…

二叉搜索樹相關知識及應用操作

文章目錄概念查找二叉搜索樹的第k大節點概念 二叉查找樹&#xff08;Binary Search Tree&#xff09;&#xff0c;&#xff08;又名&#xff1a;二叉搜索樹&#xff0c;二叉排序樹&#xff09;——它或者是一棵空樹&#xff0c;或者是具有下列性質的二叉樹&#xff1a; 若它的…

二叉樹相關知識及求深度的代碼實現

文章目錄樹二叉樹滿二叉樹和完全二叉樹二叉樹的性質代碼實現求二叉樹的深度樹 樹是一種非線性的數據結構&#xff0c;它是由n個有限結點組成一個具有層次關系的集合。 樹的相關名詞&#xff1a; 根節點&#xff1a;沒有前驅結點的結點。父節點&#xff0c;子節點&#xff1a…

平衡樹相關知識及如何判斷一棵樹是否平衡

文章目錄概念代碼實現判斷一棵二叉樹是否為平衡樹概念 平衡樹(Balance Tree&#xff0c;BT) 指的是&#xff0c;任意節點的子樹的高度差都小于等于1。 常見的符合平衡樹的有&#xff1a; B樹&#xff08;多路平衡搜索樹&#xff09;AVL樹&#xff08;二叉平衡搜索樹&#xf…

大端小端存儲模式詳解及判斷方法

文章目錄大小端模式的概念兩種模式出現原因兩種模式的優劣大小端的應用情景判斷機器的字節序大小端模式的概念 當我們查看數據在內存中的存儲情況時&#xff0c;我們經常會發現一個很奇怪的現象&#xff0c;什么現象呢&#xff1f; int main() {int i 12;return 0; }數據在內…

Linux 內存管理 | 物理內存、內存碎片、伙伴系統、SLAB分配器

文章目錄物理內存物理內存分配外部碎片內部碎片伙伴系統(buddy system)slab分配器物理內存 在Linux中&#xff0c;內核將物理內存劃分為三個區域。 在解釋DMA內存區域之前解釋一下什么是DMA&#xff1a; DMA&#xff08;直接存儲器訪問&#xff09; 使用物理地址訪問內存&am…

Linux 內存管理 | 虛擬內存管理:虛擬內存空間、虛擬內存分配

文章目錄虛擬地址空間用戶空間內核空間用戶空間內存分配malloc內核空間內存分配kmallocvmalloc虛擬地址空間 在早期的計算機中&#xff0c;程序是直接運行在物理內存上的&#xff0c;而直接使用物理內存&#xff0c;通常都會面臨以下幾種問題&#xff1a; 內存缺乏訪問控制&a…

Linux | 編譯原理、gcc的命令參數、自動化構建工具 make/Makefile

文章目錄編譯原理預處理編譯匯編鏈接gcc的常用命令參數make 和 Makefile 的概念make的運行通配符自動化變量偽目標.PHONE:【命令】編譯原理 在解釋 makefile 前&#xff0c;首先解釋一下 .c 文件變成 .exe 文件要經過的四個步驟——預處理、編譯、匯編和鏈接&#xff08;參考來…