8.動態規劃(1)——字符串的編輯距離

  動態規劃的算法題往往都是各大公司筆試題的常客。在不少算法類的微信公眾號中,關于“動態規劃”的文章屢見不鮮,都在試圖用最淺顯易懂的文字來描述講解動態規劃,甚至有的用漫畫來解釋,認真讀每一篇公眾號推送的文章實際上都能讀得懂,都能對動態規劃有一個大概了解。

  什么是動態規劃?通俗地理解來說,一個問題的解決辦法一看就知道(窮舉),但不能一個一個數啊,你得找到最優的解決辦法,換句話說題目中就會出現類似“最多”、“最少”,“一共有多少種”等提法,這些題理論上都能使用動態規劃的思想來求解。動態規劃與分治方法類似,都是通過組合子問題的解來求解原問題,但它對每個子問題只求解一次,將其保存在表格中,無需重新計算,通常用于求解最優化問題——《算法導論》

  編輯距離(Edit?Distance),在本文指的是Levenshtein距離,也就是字符串S1通過插入、修改、刪除三種操作最少能變換成字符串S2的次數。例如:S1?=?abcS2?=?abf,編輯距離d?=?1(只需將c修改為f)。在本文中將利用動態規劃的算法思想對字符串的編輯距離求解。

  定義:S1、S2表示兩個字符串S1(i)表示S1的第一個字符d[i, j]表示S1i個前綴到S2的第j個前綴(例如:S1 =?”abc”,S2 = ”def”,求解S1S2的編輯距離d[3, 3])。

  1.   若S1 = ”abc”,?S2 = ”dec”,此時它們的編輯距離為d[3,?3]?=?2,觀察兩個字符串的最后一個字符是相同的,也就是說S1(3)?=?S2(3)不需要做任何變換,故S1 =?”abc”, S2 = ”dec” <= > S1’ = ”ab”, S2’ = ”de”,即當S1[i] = S[j]d[i,?j]?=?d[i-1,j?-1]。得到公式:d[i, j]?=?d[i - 1, j - 1] (S1[i]?=?S2[j])
  2.   上面一條得出了當S1[i]?=?S2[j]的計算公式,顯然還有另一種情況就是S1[i]?≠?S2[j],若S1 = ”abc”,?S2 = ”def”。S1變換到S2的過程可以修改,但還可以通過插入刪除使得S1變換為S2

    1)在S1字符串末位插入字符“f”,此時S1 =?”abcf”,S2 = ”def”,此時即S1[i] = S2[j]的情況S1變換為S2的編輯距離為d[4, 3] = d[3, 2]。所以得出d[i,?j]=d[i,?j - 1]?+?1。(+1是因為S1新增了”f”

    2)在S2字符串末位插入字符“c”,此時S1 = ”abc”S2 = ”defc”,此時即S1[i] = S[j]的情況,S1變換為S2的編輯距離為d[3, 4] = d[2, 3]。所以得出d[i,?j]=d[i - 1, j]?+?1,實際上這是對S1做了刪除。(+1是因為S2新增了”c”

    3)將S1字符串末位字符修改”f”,此時S1 = ”abf”S2 = ”def”,此時即S1[i] = S[j]的情況,S1變換為S2的編輯距離為d[3, 3] = d[2, 2]。所以得出d[i,?j]?=?d[i?–?1,?j?-?1]?+?1。(+1是因為S1修改了“c”

  綜上,得出遞推公式:

=>

  不妨用表格表示出動態規劃對S1=”abc”S2=“def”的求解過程。

  可以看出紅色方塊即是最終所求的編輯距離,整個求解過程就是填滿這個表——二維數組。下面是JavaPython分別對字符串編輯距離的動態規劃求解。

  Java

?

  1 package com.algorithm.dynamicprogramming;
  2 
  3 /**
  4  * 動態規劃——字符串的編輯距離
  5  * s1 = "abc", s2 = "def"
  6  * 計算公式:
  7  *          | 0                                           i = 0, j = 0
  8  *          | j                                           i = 0, j > 0
  9  * d[i,j] = | i                                           i > 0, j = 0
 10  *          | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1])    s1(i) = s2(j)
 11  *          | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1]+1)  s1(i) ≠ s2(j)
 12  * 定義二維數組[4][4]:
 13  *      d e f            d e f
 14  *   |x|x|x|x|        |0|1|2|3|
 15  * a |x|x|x|x|  =>  a |1|1|2|3|  => 編輯距離d = [3][3] = 3
 16  * b |x|x|x|x|      b |2|2|2|3|
 17  * c |x|x|x|x|      c |3|3|3|3|
 18  *
 19  * Created by yulinfeng on 6/29/17.
 20  */
 21 public class Levenshtein {
 22 
 23     public static void main(String[] args) {
 24         String s1 = "abc";
 25         String s2 = "def";
 26         int editDistance = levenshtein(s1, s2);
 27         System.out.println("s1=" + s1 + "與s2=" + s2 + "的編輯距離為:" + editDistance);
 28     }
 29 
 30     /**
 31      * 編輯距離求解
 32      * @param s1 字符串s1
 33      * @param s2 字符串s2
 34      * @return 編輯距離
 35      */
 36     private static int levenshtein(String s1, String s2) {
 37         int i = 0;  //s1字符串中的字符下標
 38         int j = 0;  //s2字符串中的字符下標
 39         char s1i = 0;   //s1字符串第i個字符
 40         char s2j = 0;   //s2字符串第j個字符
 41         int m = s1.length();    //s1字符串長度
 42         int n = s2.length();    //s2字符串長度
 43         if (m == 0) {   //s1字符串長度為0,此時的編輯距離就是s2字符串長度
 44             return n;
 45         }
 46         if (n == 0) {
 47             return m;   //s2字符串長度為0,此時的編輯距離就是s1字符串長度
 48         }
 49         int[][] solutionMatrix = new int[m + 1][n + 1];     //求解矩陣
 50         /**
 51          *      d e f
 52          *   |0|x|x|x|
 53          * a |1|x|x|x|
 54          * b |2|x|x|x|
 55          * c |3|x|x|x|
 56          */
 57         for (i = 0; i < m + 1; i++) {
 58             solutionMatrix[i][0] = i;
 59         }
 60         /**
 61          *      d e f
 62          *   |0|1|2|3|
 63          * a |x|x|x|x|
 64          * b |x|x|x|x|
 65          * c |x|x|x|x|
 66          */
 67         for (j = 0; j < n + 1; j++) {
 68             solutionMatrix[0][j] = j;
 69         }
 70         /**
 71          * 上面兩個操作后,求解矩陣變為
 72          *      d e f
 73          *   |0|1|2|3|
 74          * a |1|x|x|x|
 75          * b |2|x|x|x|
 76          * c |3|x|x|x|
 77          * 接下來就是填充剩余表格
 78          */
 79         for (i = 1; i < m + 1; i++) {   //i = 1,j = 1, 2, 3,以行開始填充
 80             s1i = s1.charAt(i - 1);
 81             for (j = 1; j < n + 1; j++) {
 82                 s2j = s2.charAt(j - 1);
 83                 int flag = (s1i == s2j) ? 0 : 1;    //根據公式,如果s1[i] = s2[j],則d[i,j]=d[i-1,j-1],如果s1[i] ≠ s2[j],則其中一個公式為d[i,j]=d[i-1,j-1]+1
 84                 solutionMatrix[i][j] = min(solutionMatrix[i][j-1] + 1, solutionMatrix[i-1][j] + 1, solutionMatrix[i-1][j-1] + flag);
 85             }
 86         }
 87         return solutionMatrix[m][n];
 88     }
 89 
 90     /**
 91      * 根據公式求解編輯距離
 92      * @param insert s1插入操作
 93      * @param delete s1刪除操作
 94      * @param edit s1修改操作
 95      * @return 編輯距離
 96      */
 97     private static int min(int insert, int delete, int edit) {
 98         int tmp = insert < delete ? insert : delete;
 99         return tmp < edit ? tmp : edit;
100     }
101 }

  Python3

 1 '''
 2     動態規劃——字符串的編輯距離
 3     s1 = "abc", s2 = "def"
 4     計算公式:
 5              | 0                                           i = 0, j = 0
 6              | j                                           i = 0, j > 0
 7     d[i,j] = | i                                           i > 0, j = 0
 8              | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1])    s1(i) = s2(j)
 9              | min(d[i,j-1]+1, d[i-1,j]+1, d[i-1,j-1]+1)  s1(i) ≠ s2(j)
10     定義二維數組[4][4]:
11         d e f            d e f
12     |x|x|x|x|        |0|1|2|3|
13     a |x|x|x|x|  =>  a |1|1|2|3|  => 編輯距離d = [4][4] = 3
14     b |x|x|x|x|      b |2|2|2|3|
15     c |x|x|x|x|      c |3|3|3|3|
16 '''
17 def levenshtein(s1, s2):
18     i = 0   #s1字符串中的字符下標
19     j = 0   #s2字符串中的字符下標
20     s1i = ""    #s1字符串第i個字符
21     s2j = ""    #s2字符串第j個字符
22     m = len(s1) #s1字符串長度
23     n = len(s2) #s2字符串長度
24     if m == 0:
25         return n    #s1字符串長度為0,此時的編輯距離就是s2字符串長度
26     if n == 0:
27         return m    #s2字符串長度為0,此時的編輯距離就是s1字符串長度
28     solutionMatrix = [[0 for col in range(n + 1)] for row in range(m + 1)]  #長為m+1,寬為n+1的矩陣
29     '''
30              d e f
31           |0|x|x|x|
32         a |1|x|x|x|
33         b |2|x|x|x|
34         c |3|x|x|x|
35     '''
36     for i in range(m + 1):
37         solutionMatrix[i][0] = i
38     '''
39              d e f
40           |0|1|2|3|
41         a |x|x|x|x|
42         b |x|x|x|x|
43         c |x|x|x|x|
44         
45     '''
46     for j in range(n + 1):
47         solutionMatrix[0][j] = j
48     '''
49         上面兩個操作后,求解矩陣變為
50              d e f
51           |0|1|2|3|
52         a |1|x|x|x|
53         b |2|x|x|x|
54         c |3|x|x|x|
55         接下來就是填充剩余表格
56     '''
57     for x in range(1, m + 1):
58         s1i = s1[x - 1]
59         for y in range(1, n + 1):
60             s2j = s2[y - 1]
61             flag = 0 if s1i == s2j  else 1
62             solutionMatrix[x][y] = min(solutionMatrix[x][y-1] + 1, solutionMatrix[x-1][y] + 1, solutionMatrix[x-1][y-1] + flag)
63 
64     return solutionMatrix[m][n]
65 
66 def min(insert, delete, edit):
67     tmp = insert if insert < delete else delete
68     return tmp if tmp < edit else edit
69 
70 s1 = "abc"
71 s2 = "def"
72 distance = levenshtein(s1, s2)
73 print(distance) 

?

轉載于:https://www.cnblogs.com/yulinfeng/p/7096882.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/371821.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/371821.shtml
英文地址,請注明出處:http://en.pswp.cn/news/371821.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

更改Java包名稱如何改變我的系統架構

即使只是少量更改角度&#xff0c;也可能對您如何使用系統產生深遠影響。 假設您正在用Java編寫Web應用程序。 在系統中&#xff0c;您處理訂單&#xff0c;客戶和產品。 作為Web應用程序&#xff0c;您的類包括諸如Controller&#xff0c;PersonRepository&#xff0c;Custome…

靜態屬性_Java面試題—內部類和靜態內部類的區別

內部類和靜態內部類的區別內部類&#xff1a;1、內部類中的變量和方法不能聲明為靜態的。2、內部類實例化&#xff1a;B是A的內部類&#xff0c;實例化B&#xff1a;A.B b new A().new B()。3、內部類可以引用外部類的靜態或者非靜態屬性及方法。靜態內部類&#xff1a;1、靜態…

儲存與更新 access_token

做微信的項目&#xff0c;一開始就是 access_token 的申請&#xff0c;微信文檔上寫的比較清楚&#xff1a; 1、為了保密appsecrect&#xff0c;第三方需要一個access_token獲取和刷新的中控服務器。而其他業務邏輯服務器所使用的access_token均來自于該中控服務器&#xff0c;…

Eclipse安裝以及JDK環境變量配置

首先是下載Eclipse&#xff1b;點擊鏈接打開Eclipse官網eclipse官網點擊DownLoad Packages&#xff0c;注意是點擊“DownLoad Packages”點擊你需要的版本開始下載&#xff08;一般是64bit Eclipse IDE&#xff09;等待幾秒鐘&#xff0c;開始下載這樣Eclipse已經下載好了&…

完整的Web應用程序Tomcat JSF Primefaces JPA Hibernate –第1部分

我們創建了這篇文章&#xff0c;將展示如何使用以下工具創建完整的Web應用程序&#xff1a;Tomcat7&#xff0c;帶有Primefaces的JSF2&#xff08;Facelets和Libraries&#xff09;&#xff08;具有AutoComplete&#xff09;&#xff0c;JPA / Hibernate&#xff08;具有NxN關系…

mysql主從架構升級_實戰項目——mysql主從架構的實現

一主一從1.1 環境準備&#xff1a;centos系統服務器2臺、 一臺用戶做Mysql主服務器&#xff0c; 一臺用于做Mysql從服務器&#xff0c; 配置好yum源、 防火墻關閉、 各節點時鐘服務同步、 各節點之間可以通過主機名互相通信1.2 準備步驟&#xff1a;1)iptables -F && s…

FastReport.Net使用:[30]對話框使用

使用對話框需要知道的地方 1.按鈕的DialogResult屬性。 假如DialogResult屬性值為OK的按鈕被點擊&#xff0c;報表將會展現后面的對話框或者報表頁&#xff1b;如果屬性值為None&#xff0c;則停留在當前窗體&#xff1b;如果為其他值&#xff0c;則直接退出報表打印&#xff0…

模擬聊天室顯示語句保持最新顯示

<!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <title>模擬聊天室顯示語句保持最新顯示</title> <style> *{ border-collapse: collapse; } .dialog_box{ width:400px; height: 600px; margin…

改善Java EE生產支持技能的8種方法

參與Java EE生產支持的每個人都知道這項工作可能很困難。 7/24傳呼機支持&#xff0c;定期處理的多個事件和錯誤修復&#xff0c;來自客戶和管理團隊的壓力&#xff0c;要求它們盡快解決生產問題并防止再次發生。 在日常工作中&#xff0c;您還必須照顧由多個IT交付團隊驅動的多…

plsql連接mysql_安裝了mysql和pl/sql,怎么配置讓pl/sql能聯接mysql數據庫

64位環境下&#xff0c;使用PL/SQL Developer連接Oracle&#xff1a;?1. 下載32位Oracle InstantClient&#xff0c;并展開到某目錄&#xff0c;例如C:\instantclient-basic-nt-11.2.0.2.0&#xff1b;?2. 將系統的tnsnames.ora拷貝到該目錄下&#xff1b;?3. 在PLSQL Devel…

varnish基礎

varnish概念 初步認識 首先來跟我學習&#xff0c;v~a~r~n~i~s~h~~ &#xff0c;學會了沒有~ 當然還有很重要的一個概念&#xff0c;它是高性能緩存服務器&#xff0c;舉個例子。 好比我們要去買東西&#xff0c;所有的我們需要的東西是在超市廠家生產出來的&#xff0c;我們需…

引入Spring集成

在本文中&#xff0c;我們介紹Spring Integration 。 如果您以前沒有使用過Spring Integration&#xff0c;那么可能會幫助您復習Gregor Hohpe的Enterprise Integration Patterns 。 我還將推薦Josh Long 撰寫的這篇出色的介紹性文章 。 上下文設置 簡而言之&#xff0c; 企業…

PAT 1024. 科學計數法 (20)

科學計數法是科學家用來表示很大或很小的數字的一種方便的方法&#xff0c;其滿足正則表達式[-][1-9]"."[0-9]E[-][0-9]&#xff0c;即數字的整數部分只有1位&#xff0c;小數部分至少有1位&#xff0c;該數字及其指數部分的正負號即使對正數也必定明確給出。 現以科…

Mac上Hive環境搭建

本文介紹在Mac上搭建Hive環境。 建議首先配置好Hadoop&#xff0c;搭建與配置可以參考我之前的博文Mac Hadoop的安裝與配置。 當然你也可以選擇使用Docker搭建環境&#xff0c;本文不作介紹。 安裝 對于MacOs&#xff0c;推薦使用HomeBrew安裝hive&#xff0c;一步到位。 $ bre…

mysql+創建備份賬戶_mysql 添加用戶,授予權限,數據庫備份等 (轉載)

一&#xff0c;連接MySQL格式&#xff1a;mysql -h 遠程主機地址 -u 用戶名 -p 回車輸入密碼進入&#xff1a;mysql -u root -p 回車Enter password: ,輸入密碼就可以進入mysql> 進入了退出命令:>exit 或者ctrlD二&#xff0c;MySQL管理與授權1.修改密碼&#xff1a;格式…

分代緩存和轉換

康拉德&#xff08;Konrad&#xff09;最近在我們公司的技術室中分享了有關如何完成緩存的有趣文章&#xff0c;這是一個大型的波蘭社交網絡nk.pl。 算法中的核心概念之一是分代緩存 &#xff08;請參閱此處或此處 &#xff09;。 基本思想是&#xff0c;對于緩存鍵&#xff0c…

css精靈

○ css 精靈&#xff08;Sprites&#xff09;技術利用photoshop將圖片整合&#xff0c;然后用background-images&#xff0c;background-position&#xff0c;background-repeat技術&#xff0c;對圖片進行精確定位。 ○ 優點&#xff1a;減少http請求數量&#xff0c;減少服務…

基于Jenkins+Gitlab的自動化部署實戰

故事背景 一個中小型企業&#xff0c;是典型的互聯網公司&#xff0c;當初期的時候可能運維只能標配到2~3人&#xff0c;此時隨著公司的發展&#xff0c;項目會逐漸增多。前期部署項目可能都是手動的&#xff0c; 俗稱“人肉部署”&#xff0c;這簡直是無比的痛苦&#xff0c;不…

cmd如何刷新MySQL數據庫_怎樣在cmd中用命令操作MySQL數據庫 需要技巧

用命令來操作MySQL是工作必備的&#xff0c;今天我就來分享一下cmd命令操作MySQL數據庫的方法&#xff0c;希望有幫助。工具/材料電腦xampp操作方法01首先&#xff0c;啟動MySQL服務才行哦。這里我是用xampp集成的數據庫&#xff0c;方便&#xff0c;點擊‘start’。02如圖&…

Java順序IO性能

許多應用程序將一系列事件記錄到基于文件的存儲中&#xff0c;以供以后使用。 從日志記錄和審核&#xff0c;直到在事件源設計或其緊密相關的CQRS中保留事務重做日志&#xff0c;這都可以是任何東西。 Java具有多種方法&#xff0c;可以通過這些方法將文件順序寫入或重新讀取。…