python動態規劃及編輯距離計算實例

動態規劃的三要素:最優子結構,邊界和狀態轉移函數,最優子結構是指每個階段的最優狀態可以從之前某個階段的某個或某些狀態直接得到(子問題的最優解能夠決定這個問題的最優解),邊界指的是問題最小子集的解(初始范圍),狀態轉移函數是指從一個階段向另一個階段過度的具體形式,描述的是兩個相鄰子問題之間的關系(遞推式)

  重疊子問題,對每個子問題只計算一次,然后將其計算的結果保存到一個表格中,每一次需要上一個子問題解時,進行調用,只要o(1)時間復雜度,準確的說,動態規劃是利用空間去換取時間的算法.

  判斷是否可以利用動態規劃求解,第一個是判斷是否存在重疊子問題。

爬樓梯

假設你正在爬樓梯。需要 n 階你才能到達樓頂。

每次你可以爬 1 或 2 個臺階。你有多少種不同的方法可以爬到樓頂呢?

注意:給定 n 是一個正整數。

示例 1:

輸入: 2

輸出: 2

解釋: 有兩種方法可以爬到樓頂。

1. ?1 階 + 1 階

2. ?2 階

示例 2:

輸入: 3

輸出: 3

解釋: 有三種方法可以爬到樓頂。

1. ?1 階 + 1 階 + 1 階

2. ?1 階 + 2 階

3. ?2 階 + 1 階

分析:

假定n=10,首先考慮最后一步的情況,要么從第九級臺階再走一級到第十級,要么從第八級臺階走兩級到第十級,因而,要想到達第十級臺階,最后一步一定是從第八級或者第九級臺階開始.也就是說已知從地面到第八級臺階一共有X種走法,從地面到第九級臺階一共有Y種走法,那么從地面到第十級臺階一共有X+Y種走法.

即F(10)=F(9)+F(8)

分析到這里,動態規劃的三要素出來了.

邊界:F(1)=1,F(2)=2

最優子結構:F(10)的最優子結構即F(9)和F(8)

狀態轉移函數:F(n)=F(n-1)+F(n-2)

class Solution(object):

? ? def climbStairs(self, n):

? ? ? ? """

? ? ? ? :type n: int

? ? ? ? :rtype: int

? ? ? ? """

? ? ? ? if n<=2:

? ? ? ? ? ? return n

? ? ? ? a=1  #邊界

? ? ? ? b=2  #邊界

? ? ? ? temp=0

? ? ? ? for i in range(3,n+1):

? ? ? ? ? ? temp=a+b    #狀態轉移

? ? ? ? ? ? a=b        #最優子結構

? ? ? ? ? ? b=temp      #最優子結構

? ? ? ? return temp

利用動態規劃的思想計算編輯距離。

編輯距離是指兩個字串之間,由一個轉成另一個所需的最少編輯操作次數。通常來說,編輯距離越小,兩個文本的相似性越大。這里的編輯操作主要包括三種:

插入:將一個字符插入某個字符串;

刪除:將字符串中的某個字符刪除;

替換:將字符串中的某個字符替換為另外一個字符。

那么,如何用Python計算編輯距離呢?我們可以從較為簡單的情況進行分析。

當兩個字符串都為空串,那么編輯距離為0;

當其中一個字符串為空串時,那么編輯距離為另一個非空字符串的長度;

當兩個字符串均為非空時(長度分別為 i 和 j ),取以下三種情況最小值即可:

1、長度分別為 i-1 和 j 的字符串的編輯距離已知,那么加1即可;

2、長度分別為 i 和 j-1 的字符串的編輯距離已知,那么加1即可;

3、長度分別為 i-1 和 j-1 的字符串的編輯距離已知,此時考慮兩種情況,若第i個字符和第j個字符不同,那么加1即可;如果相同,那么不需要加1。

很明顯,上述算法的思想即為動態規劃

求長度為m和n的字符串的編輯距離,首先定義函數——edit(i, j),它表示第一個長度為i的字符串與第二個長度為j的字符串之間的編輯距離。動態規劃表達式可以寫為:

if i == 0 且 j == 0,edit(i, j) = 0

if (i == 0 且 j > 0 )或者 (i > 0 且j == 0),edit(i, j) = i + j

if i ≥ 1 且 j ≥ 1 ,edit(i, j) == min{ edit(i-1, j) + 1, edit(i, j-1) + 1, edit(i-1, j-1) + d(i, j) },當第一個字符串的第i個字符不等于第二個字符串的第j個字符時,d(i, j) = 1;否則,d(i, j) = 0。

def edit_distance(word1, word2):

? ? len1 = len(word1)

? ? len2 = len(word2)

? ? dp = np.zeros((len1 + 1,len2 + 1))

? ? for i in range(len1 + 1):

? ? ? ? dp[i][0] = i? ?

? ? for j in range(len2 + 1):

? ? ? ? dp[0][j] = j


? ? for i in range(1, len1 + 1):

? ? ? ? for j in range(1, len2 + 1):

? ? ? ? ? ? delta = 0 if word1[i-1] == word2[j-1] else 1

? ? ? ? ? ? dp[i][j] = min(dp[i - 1][j - 1] + delta, min(dp[i-1][j] + 1, dp[i][j - 1] + 1))

? ? return dp[len1][len2]

edit_distance('牛奶','華西奶')

結果:2

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • LIS問題 連續子數組最大和[https://leetcode-cn.com/problems/lian-xu-z...
    做一只有趣的蘆葦閱讀 282評論 0 0
  • 一 、動態規劃(Dynamic Programming) 動態規劃是解決優化問題的最強大的設計技術。 分治法將問題...
    leon_kbl閱讀 435評論 0 0
  • 32.真情無價 和阿寧的事情似乎是草率的,不合情理的分離。這怎能不讓人傷感萬分。 為了調整自己,也是為了寶姍,我終...
    華芳國閱讀 377評論 0 0
  • 前言 今天看了Stanford編輯距離代碼,感覺寫得不錯,寫一篇博客記錄下。 編輯距離的定義是:從字符串A到字符串...
    nlpjoe閱讀 7,597評論 2 5
  • 推薦指數: 6.0 書籍主旨關鍵詞:特權、焦點、注意力、語言聯想、情景聯想 觀點: 1.統計學現在叫數據分析,社會...
    Jenaral閱讀 5,742評論 0 5