字符串最短循环字串

98 阅读4分钟

这个问题的目标是判断给定的字符串是否可以由某个子串重复拼接而成。如果是,返回最短的子串;如果不能,返回空字符串。

思路分析:

  1. 观察规律

    • 如果一个字符串是由某个子串重复拼接的,我们可以找到一个子串,使得字符串的长度能够被这个子串的长度整除,并且将字符串分割成多个相等的部分。
    • 举个例子,"abcabcabcabc" 可以由子串 "abc" 重复拼接而成,因为它的长度是 12,可以被 3(子串 "abc" 的长度)整除,且分割后每部分都是 "abc"
  2. 步骤

    • 首先,检查字符串的长度。对于一个字符串 inp,它的长度必须能够被某个子串的长度整除。
    • 通过遍历字符串的所有可能的子串长度来验证每个可能的子串是否能重复拼接成整个字符串。
    • 如果找到一个有效的子串,返回这个子串;否则返回空字符串。
  3. 算法

    • 遍历子串长度:我们可以从 1 遍历到字符串长度的一半(因为如果子串长度超过一半,重复拼接就无法覆盖整个字符串)。
    • 对于每个长度 k,判断整个字符串是否可以分解成多个长度为 k 的子串。
    • 优化:我们可以将原字符串与自己连接起来,然后去掉第一个字符和最后一个字符,再去匹配剩下的部分。这个方法通过字符串的重复和截取来判断是否可以重复拼接。

代码实现:

python
复制代码
def solution(inp):
    # 获取字符串的长度
    n = len(inp)
    
    # 遍历所有可能的子串长度
    for i in range(1, n):
        if n % i == 0:  # 只有当长度能被i整除时,才有可能是由子串重复构成
            # 获取当前的子串
            sub = inp[:i]
            # 判断字符串是否能由sub重复拼接构成
            if sub * (n // i) == inp:
                return sub
    
    return ""  # 如果没有找到任何匹配的子串,则返回空字符串

if __name__ == "__main__":
    # 测试用例
    print(solution("abcabcabcabc") == "abc")  # 应该输出 'abc'
    print(solution("aaa") == "a")  # 应该输出 'a'
    print(solution("abababab") == "ab")  # 应该输出 'ab'
    print(solution("ab") == "")  # 应该输出 ''
    print(solution("abcdabcdabcdabcd") == "abcd")  # 应该输出 'abcd'
    print(solution("b") == "")  # 应该输出 ''

代码解析:

  1. 循环遍历子串长度

    • 我们遍历从 1 到字符串长度的可能的子串长度。
    • 对于每个可能的长度 i,我们检查字符串的长度是否能被 i 整除,如果不能整除,直接跳过这个长度。
  2. 检查是否是重复拼接

    • 对于每个长度为 i 的子串 sub,我们检查通过重复拼接该子串,能否完全构成原字符串 inp
    • 如果能,则返回该子串。
  3. 返回空字符串

    • 如果没有找到任何满足条件的子串,返回空字符串。

测试说明:

示例 1:

输入:"abcabcabcabc"

  • 子串 "abc" 重复 4 次构成字符串 inp,所以返回 "abc"

示例 2:

输入:"aaa"

  • 子串 "a" 重复 3 次构成字符串 inp,所以返回 "a"

示例 3:

输入:"abababab"

  • 子串 "ab" 重复 4 次构成字符串 inp,所以返回 "ab"

示例 4:

输入:"ab"

  • 这个字符串不能由任何一个子串重复拼接构成,所以返回 ""

示例 5:

输入:"abcdabcdabcdabcd"

  • 子串 "abcd" 重复 4 次构成字符串 inp,所以返回 "abcd"

示例 6:

输入:"b"

  • 只有一个字符,无法由其他子串重复拼接构成,所以返回 ""

时间复杂度:

  • 时间复杂度:O(n^2),其中 n 是字符串的长度。因为我们需要遍历所有可能的子串长度,并且每次都要判断字符串是否可以由该子串重复拼接而成。
  • 空间复杂度:O(1),我们只使用常量空间来存储一些变量。

这种算法适用于大部分小规模的字符串,效率足够。如果需要更高效的解法,可以进一步优化,比如使用字符串的重复匹配算法。