问题描述:给定两个序列,例如 X = “ABCBDAB”、Y = “BDCABA”,求它们的最长公共子序列的长度。
下面是求解时的动态规划表,可以看出 X 和 Y 的最长公共子序列的长度为4:
输出一个最长公共子序列并不难(网上很多相关代码),难点在于输出所有的最长公共子序列,因为 LCS 通常不唯一。
我们需要在动态规划表上进行回溯 —— 从c[m][n],即右下角的格子,开始进行判断: 如果格子c[i][j]对应的X[i-1] == Y[j-1]
,则把这个字符放入 LCS 中,并跳入c[i-1][j-1]中继续进行判断; 如果格子c[i][j]对应的 X[i-1] ≠ Y[j-1],则比较c[i-1][
j]和c[i][j-1]的值,跳入值较大的格子继续进行判断; 如果出现c[i-1][j]等于c[i][j-1]
的情况,说明最长公共子序列有多个,故两边都要进行回溯(这里用到递归)。 直到 i 或 j 小于等于零为止,倒序输出 LCS 。
从上图的红色路径显示,X 和 Y 的最长公共子序列有 3 个,分别为 “BDAB”、“BCAB”、“BCBA”。
C++代码:
#include<bits/stdc++.h> using namespace std; string X ; string Y ; vector<
vector<int> > c; // 动态规划表 set<string> lcs; // set保存所有的LCS int lcs_length(int m,
int n) { // 表的大小为(m+1)*(n+1) c = vector<vector<int> >(m+1,vector<int>(n+1)); for
(int i=0; i<m+1; ++i) { for(int j=0; j<n+1; ++j) { // 第一行和第一列置0 if (i == 0 || j
== 0) c[i][j] = 0; else if(X[i-1] == Y[j-1]) c[i][j] = c[i-1][j-1] + 1; else c[i
][j] = max(c[i-1][j], c[i][j-1]); } } return c[m][n]; } void lcs_print(int i,
int j, string lcs_str) { while (i>0 && j>0) { if (X[i-1] == Y[j-1]) { lcs_str.
push_back(X[i-1]); // cout<<X[i-1]<<endl; --i; --j; } else { if (c[i-1][j] > c[i
][j-1]) --i; else if (c[i-1][j] < c[i][j-1]) --j; else { lcs_print(i-1, j,
lcs_str); lcs_print(i, j-1, lcs_str); return; } } } // cout<<lcs_str<<endl;
reverse(lcs_str.begin(),lcs_str.end()); lcs.insert(lcs_str); } int main() { cin
>>X>>Y; int m = X.length(); int n = Y.length(); int length = lcs_length(m, n);
cout<< "The length of LCS is " << length << endl; string str; lcs_print(m, n,
str); set<string>::iterator it = lcs.begin(); for( ; it!=lcs.end(); it++) cout
<< *it << endl; return 0; }
运行效果: