函數解釋:
Levenshtein距離又稱作編輯距離(Edit Distance),是指兩個字符之間,由一個字符轉變成另一個字符所需的最少編輯操作次數。被允許的操作有以下幾種:
a. Replace替換,將一個字符替換成另一個字符
b. Insert插入,插入一個字符
c. Delete刪除,刪除一個字符
一般來說,編輯的距離越小,兩個字符的相似度越大。不難分析出,兩個字符串的編輯距離肯定不超過它們的最大長度(可以通過先把短串的每一位都修改成長串對應位置的字符,然后插入長串中的剩下字符)。
函數調用:
注: 在導包的時候,是pip install python-Levenshtein, 而不是pip install Levenshtein
#pip install python-Levenshteinimport Levenshteinstr1 = 'kitten'
str2 = 'sitting'Levenshtein.distance(str1, str2)# output: 3