算法训练1-day8-字符串-KMP

30 阅读6分钟

今天的四道题是字符串

  1. 151. 反转字符串中的单词

可以先遍历,记录每一个单词,然后倒序拼接就行,需要O(n)的空间。

若要O(1)的空间复杂度,可以使用双指针法,先将整个字符串s反转,随后反转每个单词,就能得到反转单词顺序后的结果。例如字符串a good   example,反转后为elpmaxe doog a,再反转第一个单词:example doog a,去除空格再反转第二个:example good a,然后重复上述过程直到结束。

特殊地,对于移除空格的操作,我们可以不使用库函数,而是使用两个快慢指针,通过赋值和resize操作来避免删除操作的开销。具体来说,一开始快慢指针都指向0,然后每当遇到空格,快指针移动;而当遇到单词,就将这个单词的值赋值给slow位置,然后同时移动快慢指针。要注意的一点就是,我们记得要给两个单词中间添加空格,也就是当遇到非空格且slow不为0时,我们要手动补上一个空格

AC代码:

class Solution {
public:
    string reverseWords(string s) {
        int left = 0;
        int right = s.length() - 1;
        reverse(s, left, right);
		
		//去除前导空格
        while (s[0] == ' ') s.erase(0, 1);
        //去除后置空格
        while (s[s.length() - 1] == ' ') s.erase(s.length() - 1, 1);
        for (left = 0; left < s.length(); left++) {
	        //去除多余空格
            if (s[left] == ' ') {
                int j = left + 1;
                //检查left后面是否是空格
                while (j < s.length() && s[j] == ' ')
                    j++;
                //将所有多余空格移除
                s.erase(left + 1, j - left - 1);
                continue;
            }

            right = left + 1;
            //找到单词结尾处
            while (right < s.length() && s[right] != ' ')
                right++;
            reverse(s, left, right - 1);
            //此时right指向的位置是空格,left要回退到right-1的位置
            //这样在之后left++后才不会越过空格
            left = right - 1;
        }
        return s;
    }

    void reverse(string& s, int left, int right) {
        while (left < right) {
            swap(s[left++], s[right--]);
        }
    }
};

class Solution {
public:
    void reverse(string& s, int start, int end){ //翻转,区间写法:左闭右闭 []
        for (int i = start, j = end; i < j; i++, j--) {
            swap(s[i], s[j]);
        }
    }

    void removeExtraSpaces(string& s) {//去除所有空格并在相邻单词之间添加空格, 快慢指针。
        int slow = 0;   //整体思想参考https://programmercarl.com/0027.移除元素.html
        for (int i = 0; i < s.size(); ++i) { //
            if (s[i] != ' ') { //遇到非空格就处理,即删除所有空格。
                if (slow != 0) s[slow++] = ' '; //手动控制空格,给单词之间添加空格。slow != 0说明不是第一个单词,需要在单词前添加空格。
                while (i < s.size() && s[i] != ' ') { //补上该单词,遇到空格说明单词结束。
                    s[slow++] = s[i++];
                }
            }
        }
        s.resize(slow); //slow的大小即为去除多余空格后的大小。
    }

    string reverseWords(string s) {
        removeExtraSpaces(s); //去除多余空格,保证单词之间之只有一个空格,且字符串首尾没空格。
        reverse(s, 0, s.size() - 1);
        int start = 0; //removeExtraSpaces后保证第一个单词的开始下标一定是0。
        for (int i = 0; i <= s.size(); ++i) {
            if (i == s.size() || s[i] == ' ') { //到达空格或者串尾,说明一个单词结束。进行翻转。
                reverse(s, start, i - 1); //翻转,注意是左闭右闭 []的翻转。
                start = i + 1; //更新下一个单词的开始下标start
            }
        }
        return s;
    }
};
  1. 55. 右旋字符串(第八期模拟笔试

使用一个辅助string的话,这道题很简单;如果要求只能使用常数空间,在原地操作的话,思路是先反转整个字符串,将后面k个字符移到前面,再分别将前k个字符与后s.length()-k个字符反转,使得它们分别恢复原来的顺序。 AC代码:

#include <algorithm>
#include <iostream>
#include <string>
#include <vector>
using namespace std;

void reverseStr(string &s, int left, int right) {
  while (left < right) {
    swap(s[left++], s[right--]);
  }
}

int main() {
  string s;
  int k;

  cin >> k;
  cin >> s;

  reverseStr(s, 0, s.length() - 1);
  reverseStr(s, 0, k - 1);
  reverseStr(s, k, s.length() - 1);

  cout << s << endl;
  return 0;
}

class Solution {
public:
    string reverseStr(string s, int k) {
        for (int i = 0; i < s.size(); i += (2 * k)) {
            // 1. 每隔 2k 个字符的前 k 个字符进行反转
            // 2. 剩余字符小于 2k 但大于或等于 k 个,则反转前 k 个字符
            if (i + k <= s.size()) {
                reverse(s.begin() + i, s.begin() + i + k );
            } else {
                // 3. 剩余字符少于 k 个,则将剩余字符全部反转。
                reverse(s.begin() + i, s.end());
            }
        }
        return s;
    }
};
  1. 28. 找出字符串中第一个匹配项的下标

KMP算法

AC代码:

class Solution {
public:
    vector<int> GetNext(string str) {
        // 前缀:不包含最后一个字符的子串;后缀:不包含第一个字符的子串
        // next数组代表以下标为i的字符结尾子串中,最长公共前后缀的长度
        // 显然,next[0]为0,因为一个字符没有前后缀
        vector<int> next(str.size(), 0);

        // j代表公共前缀的长度,也即公共前缀的下一个字符的位置
        int j = 0;
        for (int i = 1; i < str.size(); i++) {
            // 如果str[j]!=str[i],那么我们需要回退,
            // 回退到哪呢?
            // 当前的子串是str[0...i],我们比较的是公共前缀的下一个字符str[j]与str[i]是否相等
            // 即寻找模式串的前缀子串的最长公共前缀和后缀
            // 不相等时,我们知道,对于子串str[0...i-1],有前缀str[0..j-1]与后缀str[i-j...i-1]相同
            // 于是,我们可以基于str[0..j-1]与str[i-j...i-1]相同那部分来回退
            // 即j回退到str[0..j-1]与str[i-j...i-1]的公共前缀的下一个位置,即next[j-1]
            // 而i则是str[i-j...i-1]的公共后缀的下一个位置,即i,不变
            // 例如aabaac,到c时,next数组为[0, 1, 0, 1, 2]
            // j=2,i=5,b!=c
            // 我们知道aabaa的最长公共前后缀是aa,我们之前相当于比较aab与aac,
            // 不相等时,我们知道str1 = str[0..2-1],即aa与str2 =
            // str[5-2...5-1],即aa是相等的
            // 于是我们下一步是比较aa与ac,其中aa的第一个a对应于ac的a,
            // 或者说aa的第一个a对应于aa的前缀a,而ac的a对应于aa的后缀a
            // 也即我们将i定位到str2的最长公共后缀字符串的下一个位置,即i,不变
            // 将j单位到str1的最长公共前缀的下一个位置,即next[j-1]
            // 重复以上过程直到str[j]==str[i]或者j==0
            while (j > 0 && str[j] != str[i]) {
                j = next[j - 1];
            }

            // 如果str[j]==str[i],那么代表最长公共前后缀的长度可以在原来的基础上加一
            // 也即j移动到下一个位置
            if (str[j] == str[i])
                j++;

            next[i] = j;
        }
        return next;
    }
    int strStr(string haystack, string needle) {
        if (haystack.size() < needle.size())
            return -1;
        vector<int> next = GetNext(needle);

        int j = 0;
        for (int i = 0; i < haystack.size(); i++) {
            
            //与获取next数组的逻辑类似,
            //next数组比较str[0..j-1]与str[i-j...i-1]
            //而这里则比较needle[0...j]与haystack[i-j...i]
            //因此逻辑完全一致
            //不妨以aaaaab与aab来举例
            //aab的next数组为[0,1,0]
            //i=0,j=0,needle[j] == haystack[i],j++
            //i=1,j=1,needle[j] == haystack[i],j++
            //i=2,j=2,haystack[i] != needle[j],
            //此时,j回退,但不是回退到0,而next[1]=1
            //因为此时对于haystack[0..2]=aaa与needle[0..2]=aab
            //我们知道它们前面是匹配的,即aa,而aa有有着它自己的公共最长前后缀,即a
            //于是我们可以取aab的aa中的前缀a,取aaa的前两个aa的后缀a,我们不用再去比较它们了,
            //             ^                   ^
            //因为我们知道它们相等,我们可以直接比较它们后面的字符
            //即next[j-1]处的字符与i处的字符
            while (j > 0 && haystack[i] != needle[j]) {
                j = next[j - 1];
            }

            if (needle[j] == haystack[i])
                j++;

            if (j >= next.size())
                return i - j + 1;
        }

        return -1;
    }
};