打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
最长公共子串问题的实现

最长公共子串问题的实现

    最长公共子串问题:一个给定序列的子序列是在该序列中删去若干元素后得到的序列。给定两个序列X和Y,当另一序列Z既是X的子序列又是Y的子序列时,称Z是序列X和Y的公共子序列。最长公共子串就是求给定两个序列的一个最长公共子序列。例如,X=“ABCBDAB”,Y=“BCDB”是X的一个子序列。

    问题分析:

    给定两个序列A和B,称序列Z是A和B的公共子序列,是指Z同是A和B的子序列。问题要求已知两序列A和B的最长公共子序列。如采用列举A的所有子序列,并一一检查其是否又是B的子序列,并随时记录所发现的子序列,最终求出最长公共子序列。这种方法因耗时太多而不可取。

    考虑最长公共子序列问题如何分解成子问题,设A=“a0,a1,…,am-1”,B=“b0,b1,…,bm-1”,并Z=“z0,z1,…,zk-1”为它们的最长公共子序列。不难证明有以下性质:

    (1) 如果am-1=bn-1,则zk-1=am-1=bn-1,且“z0,z1,…,zk-2”是“a0,a1,…,am-2”和“b0,b1,…,bn-2”的一个最长公共子序列;

    (2) 如果am-1!=bn-1,则若zk-1!=am-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列;

    (3) 如果am-1!=bn-1,则若zk-1!=bn-1,蕴涵“z0,z1,…,zk-1”是“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列。

    这样,在找A和B的公共子序列时,如有am-1=bn-1,则进一步解决一个子问题,找“a0,a1,…,am-2”和“b0,b1,…,bm-2”的一个 最长公共子序列;如果am-1!=bn-1,则要解决两个子问题,找出“a0,a1,…,am-2”和“b0,b1,…,bn-1”的一个最长公共子序列 和找出“a0,a1,…,am-1”和“b0,b1,…,bn-2”的一个最长公共子序列,再取两者中较长者作为A和B的最长公共子序列。

    为了节约重复求相同子问题的时间,引入一个数组,不管它们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划法所采用的基本方法,具体说明如下。

    定义c[i][j]为序列“a0,a1,…,ai-2”和“b0,b1,…,bj-1”的最长公共子序列的长度,计算c[i][j]可递归地表述如下:

    (1)c[i][j] = 0                         如果i=0或j=0;

    (2)c[i][j] = c[i-1][j-1]+1             如果i,j>0,且a[i-1] = b[j-1];

    (3)c[i][j] = max{c[i][j-1], c[i-1][j]} 如果i,j>0,且a[i-1] != b[j-1]。

    按此算式可写出计算两个序列的最长公共子序列的长度函数。由于c[i][j]的产生仅依赖于c[i-1][j-1]、c[i-1][j]和c[i][j-1],故可以从c[m][n]开始,跟踪c[i][j]的产生过程,逆向构造出最长公共子序列。细节见程序。

    #include <stdio.h>

    #include <string.h>

    #define N 100

    char a[N], b[N], str[N];

    int c[N][N];

    int lcs_len(char* a, char* b, int c[][N])

    {

    int m = strlen(a), n = strlen(b), i, j;

    for( i=0; i<=m; i++ )

    c[i][0]=0;

    for( i=0; i<=n; i++ )

    c[0][i]=0;

    for( i=1; i<=m; i++ )

    {

    for( j=1; j<=n; j++ )

    {

    if (a[i-1]==b[j-1])

    c[i][j]=c[i-1][j-1]+1;

    else if (c[i-1][j]>=c[i][j-1])

    c[i][j]=c[i-1][j];

    else

    c[i][j]=c[i][j-1];

    }

    }

    return c[m][n];

    }

    char* build_lcs(char s[], char* a, char* b)

    {

    int i = strlen(a), j = strlen(b);

    int k = lcs_len(a,b,c);

    s[k] = '\0';

    while( k>0 )

    {

    if (c[i][j]==c[i-1][j])

    i--;

    else if (c[i][j]==c[i][j-1])

    j--;

    else

    {

    s[--k]=a[i-1];

    i--; j--;

    }

    }

    return s;

    }

    void main()

    {

    printf("Enter two string (length < %d) :\n",N);

    scanf("%s%s",a,b);

    printf("LCS=%s\n",build_lcs(str,a,b));

    }

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
深入解析最长公共子串
算法42(最长公共字串)
C++ 笔试之基础 08 求两个字符串的最长公共子串,最长公共子序列,编辑距离
阿里笔试之最长公共子串
【串和序列处理 6】LCS 最长公共子序列
kmp字符串匹配算法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服