KMP算法
KMP算法主要应用在字符串匹配上,当出现字符串不匹配时,可以知道一部分之前已经匹配的文本内容,可以利用这些信息避免从头再去做匹配了。
前缀表(next数组): 前缀表是用来回退的,它记录了模式串与主串(文本串)不匹配的时候,模式串应该从哪里开始重新匹配。前缀表记录下标i之前(包括i)的字符串中,有多大长度的相同前缀后缀,即最长公共前后缀。
如何计算前缀表:构造next数组其实就是计算模式串s,前缀表的过程。
主要有如下三步:
- 初始化
- 处理前后缀不相同的情况
- 处理前后缀相同的情况
- next
j是前缀末尾,i是后缀末尾
void getNext(int* next, const string& s){
int j = -1;
next[0] = j;
for(int i = 1; i < s.size(); i++) { // 注意i从1开始
while (j >= 0 && s[i] != s[j + 1]) { // 前后缀不相同了
j = next[j]; // 向前回退
}
if (s[i] == s[j + 1]) { // 找到相同的前后缀
j++;
}
next[i] = j; // 将j(前缀的长度)赋给next[i]
}
}
28. 找出字符串中第一个匹配项的下标
时间复杂度 O(n+m) 空间复杂度 O(m)
要求: 给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。如果 needle 不是 haystack 的一部分,则返回 -1 ****。
思路
/**
* @param {string} haystack
* @param {string} needle
* @return {number}
*/
var strStr = function(haystack, needle) {
let next = []
getNext(next, needle)
let j = 0
for(let i=0; i<haystack.length; i++){
while(j>0 && haystack[i]!=needle[j]){
j=next[j-1]
}
if(haystack[i] == needle[j]){
j++
}
if(j==needle.length){
//因为上一步j++,我们是用next数组当前数的前一个倒退
return i-needle.length+1
}
}
return -1
function getNext(next, s){
let j=0
next[0] = 0
for(let i=1; i<s.length; i++){
while(j>0 && s[i] != s[j]){
j = next[j-1]
}
if(s[i]==s[j]){
j++
}
next[i] = j
}
}
};
459. 重复的子字符串
要求:给定一个非空的字符串 s ,检查是否可以通过由它的一个子串重复多次构成。
思路
如果 next[len - 1] != 0,则说明字符串有最长相同的前后缀(就是字符串里的前缀子串和后缀子串相同的最长长度)。 如果len % (len - (next[len - 1])) == 0 ,则说明数组的长度正好可以被 (数组长度-最长相等前后缀的长度) 整除 ,说明该字符串有重复的子字符串。
/**
* @param {string} s
* @return {boolean}
*/
var repeatedSubstringPattern = function(s) {
//next[len-1] != 0 && len % (len -next(len-1)) == 0
if(s.length == 0) return false
let next = []
getNext(next, s)
let len = s.length
if(next[len-1]!=0 && len % (len - next[len-1]) == 0){
return true
}
return false
function getNext(next, s){
let j=0
next[0] = 0
for(let i=1; i<s.length; i++){
while(j>0 && s[i]!=s[j]){
j = next[j-1]
}
if(s[i]==s[j]){
j++
}
next[i] = j
}
}
};