算法大法好之KMP主串将对比的位置回溯到上一次（开始的位置+1）。一直到匹配成功，或者遍历完所有字符。对于正常的字符

KMP算法的主要应用场景：

在一段（主字符串）中查找是否包含某一段（子串）

举例朴素模式：

在了解KMP之前，可以想象使用最简单的方法就是，子串与主串挨个对比，当子串某一位字符对比主串字符失败后，

主串将对比的位置回溯到上一次（开始的位置+1）。

子串将对比的位置回溯到0

一直到匹配成功，或者遍历完所有字符。

对于正常的字符串模式匹配，主串长度为m，子串为n，时间复杂度会到达O（m*n）。

图例 :

S串：abcdefgab

T串：abcdex

分析：

对于要匹配的子串T来说，"abcdex" 首字母a与后面的任意一个字符都是不相等的，既然首字母a不与后面的任意字符相等（并且我们通过对比图中，已知主串的2-5位与子串的2-5位是判断相等的），那么也就意味着首字母a不可能与主串2-5的位置相等，那么朴素算法的2️⃣3️⃣4️⃣5️⃣判断对比都是多余的。

示例二：

另一种情况，如果T串后面含有与首字母"a"的字符

S = "abcabcabc"

T= "abcabx"

使用朴素算法进行对比

分析：

1，根据示例一的分析T串的首字母"a"与自己后面的第二位，第三位字符都不相等，所以2️⃣3️⃣判定为多余的对比。

2，然后发现T的首字母"a"与自己第四位字符"a"相等，第二位"b"与第五位"b"相等，观察1️⃣发现，T串的第四位"a"，第五位"b" 与 S主串中相应的位置比较过为相等。因此可以判断出T的首字符"a"，第二位字符"b" 与主串S的第四位，第五位也是相等的，所以该步骤也可以忽略。

3，也就是说，T的子串中有，与首字母相等的字符，也可以省略一部分不必要的对比判断。

4，对比以上两个例子，发现朴素匹配法主串的（角标i值），在不断的回溯，而通过对比的规律发现这些回溯是可以避免发生的。

5，通过两个示例分析发现，S串，与T串对比时，只需要关注子串（下标值K的变化）

通过示例二分析发现，可以根据T串的结构中是否有重复字符的出现，从而决定K值的变化

KMP算法能将时间复杂度降低到O（m+n）

KMP算法的核心之一（next[]数组）

next数组的作用：是将指引你下一次探深对比的位置，

搞懂next数组的第一步，必须先要知道 前缀，后缀这两个概念

示例一：

在"abc"中，

前缀就是"ab"，除去最后一个字符"c"的剩余字符串。

后缀就是"bc",除去第一个字符"a"后的面全部的字符串。

示例二：

如果子串是"abcabcdabc"

第一次拆分，前缀： abcabcdab 后缀： bcabcdabc，发现前后缀并不是一样的，那么我们需要按照前面拆分前后缀的规则继续拆分

p： abcabcda , s：cabcdabc

p： abcabcd , s：abcdabc

p： abcabc , s：bcdabc

p： abcab , s：cdabc

p： abca , s：dabc

p： abc , s：abc 成功匹配出前后缀中，最长相同子串

这里有一点要注意，前缀必须要从头开始算，后缀要从最后一个数开始算，中间截一段相同字符串是不行的。

next数组推导

根据前后缀的拆分的规则，算出当前下标k，到0，最长的重复子串长度

示例：

A B A B A C A

k = 0 及 next[k] = 0 ,因为首字符长度唯一，无法拆分出前后缀，所以= 0

k = 1 及 next[k] = 0 ，AB ，前后缀无相同所以 = 0

k= 2 及 next[k] = 1，ABA ，前缀AB ，后缀BA，继续-> (F: A ,S:A)，所以 = 1

k = 3及 next[k] = 2 ，ABAB ，前缀ABA 后缀BAB ,继续-> (F: AB ,S:AB) 所以 = 2

k = 4 及 next[k] = 3 ，ABABA (F: ABAB , S: BABA) -> (F: ABA , S: ABA) = 3

k = 5 及 next[k] = 0 ，ABABAC (F: ABABA , S: BABAC) -> (F: ABAB , S: ABAC)

-> (F: ABA , S: BAC)-> (F: AB , S: AC)-> (F: A , S: C) = 0

k = 6 及 next[k] = 1 ，ABABACA (F: ABABAC , S: BABACA) -> (F: ABABA , S: ABACA) ->(F: ABAB , S: BACA)->(F: ABA , S: ACA)->(F: AB , S: CA)->(F: A , S: A) = 1

最终得出字符串对应的next[]数组：

翻译成java代码：

private int[] getNextArray(String chs) {

    int i;//字符数组的下标指示器  

    int k;//前一个字符处的最大公共（相等）前、后缀子串的长度  

    int[] next = new int[chs.length()];

    for (i = 1, k = 0; i < chs.length(); i++) {

        while (k > 0 && chs.charAt(i) != chs.charAt(k)) { 
            k = next[k - 1]; // 这一部分是在回溯 “前缀” 的位置？？？
        }

        if (chs.charAt(i) == chs.charAt(k)) {
            k++;
        }
        next[i] = k;
    }

    return next;

}

next数组的实际应用：

当我们求出一段子串的next数组后，那么在匹配主串的时候，我们可以通过下标，使得我们知道将子串定位到主串（下一趟探深比较的位置），而没有回退过主串指针。我们希望这个相等的前缀和后缀的长度越大越好（这也是为什么我们next数组中是求相等的前缀和后缀中最长的那个相等串的值），显然这样就可以匹配更多相同的元素。

根据next对应的（下标）推算下一次右移的位数：

如果子串当前匹配失败的位置为起始点 k = 0 ，默认右移一位，

否则

下一次需要移动的位数 = （已经匹配成功的个数 - next[k-1])

KMP示例：

主串 S: deabcabcdabcabdh

子串 T: abcabd

推算出子串的next数组值如下：