問題描述:
求兩個字符序列的公共最長子序列。
最長公共子串
在回到子序列問題之前,先來了解一下子串的問題。
例如,HISH和FISH兩個字符序列的公共最長子串就是:ISH。很容易理解。
繪制網格
通過上一次背包問題的學習,給了我一些很重要的啟示:
- 每種動態規劃解決方案都設計網格。
- 動態規劃可以幫助你在給定約束條件下找到最優解。
- 問題可分解為彼此獨立且離散的子問題時,就可以使用動態規劃法來解決。
那么,要解決這個問題的網格長什么樣呢?要確定這一點,你首先得回答:
- 1.單元格中的值是什么?
- 2.如何將這個問題劃分成子問題?
- 3.網格的坐標軸是什么?
在動態規劃中,你要將某個指標最大化。在這個例子中,你要找出兩個單詞的最長公共子序列。hish和fish都包含的最長子序列是什么?hish和vista呢?這就是你要計算的值。
別忘了,單元格中的值通常就是你要優化的值。在這個例子中,這很可能是一個數字:兩個字符串都包含的最長子串的長度。
如何把這個問題劃分成子問題呢?你可能需要比較字符串:不是比較hish和fish,而是先比較his和fis。每個單元格都將包含著兩個字符串的最長公共字符串的長度。或許有了一些線索:
填充網格
現在,你很清楚網格應是怎么樣的。填充該網格的每個單元格時,該使用什么樣的公式呢?由于你已經知道了答案——hish和fish的最長子序列為ish,所以可以作點弊。
幾遍如此,你還是不能確定該使用什么樣的公式。計算機科學家有時會開玩笑說,那就使用費曼算法(Feynman algorithm)。這個算法是以注明物理學家理查德·費曼命名的,其步驟如下:
實際上,根本沒有找出計算公式的簡單辦法,你必須通過嘗試才能找出管用的公式。有些算法并非精確的解決步驟,而只是幫助你理清思路的框架。
最終的網格
可以從其中總結出以下的規律:
實現這個公式的偽代碼大概長這樣:
if (chars1[i - 1] == chars2[j - 1]) {
array[i][j] = array[i - 1][j - 1] + 1;
} else {
array[i][j] = 0
}
需要注意的一點是,這個問題的最終答案并不一定在最后一個單元格中!對于前面的背包問題,最終答案總是在最后的單元格中。單對于LCS問題來說,答案為網格中最大的數字——它可能并不位于最后的單元格中。例如單詞hish和vista的最長公共子串時,網格如下:
最長公共子序列
假設Alex不小心輸入了fosh,那么它原本是想輸入fish還是fort呢?我們使用最長子序列來比較它們。
最長公共個子串的長度相同,都包含兩個字母。但fosh與fish更像。
這里比較的是最長公共子串,但其實應該比較最長子序列:兩個單詞中都有的序列包含的字數。如何計算最長公共子序列呢?
下面是用于計算fish和fosh的最長公共子序列的網格:
下面是填寫這個網格的公式:
偽代碼大概長這樣:
if (chars1[i - 1] == chars2[j - 1]) {
array[i][j] = array[i - 1][j - 1] + 1;
} else {
array[i][j] = max{array[i -1][j] , array[i][j - 1] };
}
代碼實現:
整個程序是從自己的算法學習程序中直接扒下來的,inputList保存的是從文本文件中一行一行讀取到的數值,outputList保存的是要輸出到文本文件中的數據。由于要輸出,所以定義了一個boolean類型的isRowBig標志位,用來判斷哪一個字符串的長度更長,然后獲取更長的那個輸出。雖然實現了代碼,但是感覺自己寫得很丑陋。
/**
* 獲取數據之后返回數據到輸出Array中
*/
private void getResult() {
// 獲取數值
int rowSize = inputList.get(0).length();
int colSize = inputList.get(1).length();
int[][] array = new int[rowSize + 1][colSize + 1];
char[] chars1 = inputList.get(0).toCharArray();
char[] chars2 = inputList.get(1).toCharArray();
String temp = new String();
// 初始化數組
for (int i = 0; i < rowSize; i++) array[i][0] = 0;
for (int i = 0; i < colSize; i++) array[0][i] = 0;
// 填空
boolean isRowBig = true;
if (rowSize >= colSize) {
isRowBig = true;
} else {
isRowBig = false;
} // 雖然實現了代碼,但是感覺寫得特別丑陋。
for (int i = 1; i <= rowSize; i++) {
for (int j = 1; j <= colSize; j++) {
if (chars1[i - 1] == chars2[j - 1]) {
array[i][j] = array[i - 1][j - 1] + 1;
if (isRowBig) {
temp += chars2[j - 1];
} else {
temp += chars1[i - 1];
} // end if:正確向temp中添加了字符
} else if (array[i - 1][j] >= array[i][j - 1]) {
array[i][j] = array[i - 1][j];
} else {
array[i][j] = array[i][j - 1];
}
}
} // end for:array和temp中已經保存了正確的數據
outputList.add(temp);
}
歡迎轉載,轉載請注明出處!
簡書ID:@我沒有三顆心臟
github:wmyskxz
歡迎關注公眾微信號:wmyskxz_javaweb
分享自己的Java Web學習之路以及各種Java學習資料