青训营X豆包MarsCode 技术训练营第四课 | 豆包MarsCode AI 刷题

46 阅读3分钟

程序解析

这个函数的目的是确定在给定的输入字符串中,最小的子串长度需要被替换,以便使得每个字符 'A'、'S'、'D' 和 'F' 在字符串中出现的频率相同。目标频率是根据输入字符串的总长度计算的,具体为四分之一。

代码逐步分析

  1. 输入和初始化:

    python
    n = len(input)  
    target = n // 4  
    
    • n 是输入字符串的长度。
    • target 是每个字符('A'、'S'、'D' 和 'F')理想情况下应该达到的频率。
  2. 频率统计:

    python
    freq = {'A': 0, 'S': 0, 'D': 0, 'F': 0}  
    for c in input:  
        freq[c] += 1  
    
    • freq 字典初始化了每个字符的计数。
    • 循环遍历输入字符串中的每个字符,并在 freq 中递增对应字符的计数。
  3. 检查是否已经平衡:

    python
    if all(f == target for f in freq.values()):  
        return 0  
    
    • 这个条件检查所有字符的频率是否已经匹配目标频率。如果匹配,则返回 0,表示不需要任何替换。
  4. 寻找最小的子串长度:

    • 嵌套循环结构允许函数检查每个可能的子串长度:
    python
    for length in range(1, n + 1):  
        for start in range(n - length + 1):  
            ...  
    
    • 外层循环遍历从 1 到 n 的可能子串长度。内层循环遍历该长度的子串的起始索引。
  5. 计算临时频率:

    python
    temp = freq.copy()  
    for i in range(start, start + length):  
        temp[input[i]] -= 1  
    
    • 为临时调整创建频率字典的副本。对于选定的子串中的每个字符,在 temp 中递减其计数。
  6. 检查是否能够平衡:

    python
    max_count = max(temp.values())  
    min_count = min(temp.values())  
    if max_count - min_count <= length:  
        needed = sum(max(0, target - count) for count in temp.values())  
        if needed <= length:  
            return length  
    
    • 计算调整后的频率中的最大和最小计数。
    • 如果最大计数和最小计数的差小于或等于我们正在考虑的子串的长度,则检查达到平衡所需的字符数量。
    • 如果所需的字符数可以通过当前子串长度替换,则返回该长度。
  7. 最终返回:

    python
    return n  
    
    • 如果没有找到有效的子串长度,则返回 n,表示需要替换整个字符串。

示例测试用例

在 if __name__ == "__main__": 块中的测试用例评估了各种情形:

python
print(solution("ADDF") == 1)  # True  
print(solution("ASAFASAFADDD") == 3)  # True  
print(solution("SSDDFFFFAAAS") == 1)  # True  
print(solution("AAAASSSSDDDDFFFF") == 0)  # True  
print(solution("AAAADDDDAAAASSSS") == 4)  # True  

复杂度分析

  • 时间复杂度: 在最坏的情况下,该解决方案的时间复杂度为 O(n3)O(n3)。这是因为:

    • 外层循环遍历所有子串长度,
    • 内层循环遍历可能的起始位置,
    • 内部操作涉及平衡检查和替换。
  • 空间复杂度: 空间复杂度为 O(1)O(1),用于频率表,因为它仅存储了固定数量的字符。

可能的改进

  1. 优化: 可以优化算法以降低时间复杂度,而不是显式检查所有子串,可以采用更高效的扫描方法。
  2. 边缘情况: 需要重新考虑边缘情况,例如输入为空或者字符计数不是4的倍数的情况。