前言:
求解一个字符串(文本串)是否出现过另一个字符串(模式串),就可用到KMP
文本串M:aabaabaaf
模式串N:aabaaf
过程:从文本串中的第一个字符串(i=0;i<N.length();i++)开始,一个一个字符与模式串进行对比,遇到字符不相等的情况,就重新比较(i++)
时间复杂度:O(m*n)
m=M.length() ,n=N.length()
过程:利用前缀数组(也可称为next数组)保存模型串中下标i(包括i)之前的子串的最大相等前后缀长度,当文本串与模式串进行比较时,出现不相等的情况时,利用next数组,改变遍历模式串的指针j的值,从而继续比较
时间复杂度:O(m+n)
KMP的经典思想就是:当出现字符串不匹配时,可以记录一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配。
字符串的前缀:不包含字符串最后一个字符的所有以第一个字符开头的连续子串
字符串的后缀:不包含字符串第一个字符的所有以最后一个字符结尾的连续子串
eg:求字符串aadaaf的前缀、后缀
前缀:a aa aad aada aadaa
后缀:f af aaf daaf adaaf
可以看出字符串aadaaf的最大相等前缀后缀的长度为0
其实next[i]=模式串下标i(包括i)之前的字串的最大相等前缀后缀的长度
a a d a a f
next: 0 1 0 1 2 0
public void getNext(int[] next,String s){
int j=0;//j为前缀的末尾 字符串s前i(包含i)个字符的最长相等前后缀
next[0]=j;
for(int i=1;i<s.length();i++){
//前后缀末尾不相等的情况
while(j>0&&s.charAt(j)!=s.charAt(i)){
j=next[j-1];
}
//前后缀末尾相等的情况
if(s.charAt(j)==s.charAt(i)){
j++;
}
next[i]=j;
}
}
文本串: a a b a a b a a f
i
模式串: a a b a a f
j
下标5之前这部分的字符串(也就是字符串aabaa)的最长相等的前缀 和 后缀字符串是 子字符串aa ,因为找到了最长相等的前缀和后缀,匹配失败的位置(i)是后缀子串的后面,那么我们找到与其相同的前缀的后面(下标为2的位置)从新匹配就可以了。
public boolean isContain(String M, String N) {
int m=M.length();
int n=N.length();
if(n==0)return 0;
if(n>m)return -1;
int[] next=new int[n];
getNext(next,N);
int j=0;
for(int i=0;i<m;i++){
while(j>0&&M.charAt(i)!=N.charAt(j))j=next[j-1];
if(M.charAt(i)==N.charAt(j))j++;
if(j==n)return true;
}
return false;
}
因篇幅问题不能全部显示,请点此查看更多更全内容