数字字符串格式化 | 豆包MarsCode AI 刷题

103 阅读4分钟

问题理解

题目要求我们将一个不带千分位逗号的数字字符串转换为带千分位逗号的格式,并且保留小数部分。此外,输入的数字字符串可能包含前导零,这些前导零需要被精简掉。

解题思路

  1. 去除前导零:首先,我们需要处理输入字符串中的前导零。前导零的存在会影响后续的格式化操作,因此我们需要先去除它们。
  2. 分离整数和小数部分:接下来,我们需要将字符串分为整数部分和小数部分。如果字符串中包含小数点,我们可以通过分割操作来分离整数和小数部分。
  3. 格式化整数部分:对于整数部分,我们需要添加千分位逗号。一种常见的方法是先将整数部分反转,然后每三位添加一个逗号,最后再将整数部分反转回来。
  4. 合并整数和小数部分:最后,我们将格式化后的整数部分和小数部分合并,形成最终的结果。

数据结构与算法选择

  • 字符串操作:由于我们需要对字符串进行分割、反转和拼接操作,字符串操作是必不可少的。
  • 列表:在处理整数部分的千分位逗号时,使用列表可以方便地进行插入操作。

算法步骤

  1. 去除前导零:使用 lstrip('0') 方法去除字符串中的前导零。

  2. 分离整数和小数部分:使用 split('.') 方法将字符串分为整数部分和小数部分。

  3. 格式化整数部分

    • 反转整数部分。
    • 遍历反转后的整数部分,每三位插入一个逗号。
    • 再次反转整数部分,得到格式化后的整数。
  4. 合并整数和小数部分:将格式化后的整数部分和小数部分拼接起来。

代码详解

def solution(s: str) -> str:
    # 去除前导零
    s = s.lstrip('0')
    
    # 分离整数和小数部分
    if '.' in s:
        integer_part, fractional_part = s.split('.')
    else:
        integer_part, fractional_part = s, ''
    
    # 格式化整数部分
    if integer_part:
        # 反转整数部分
        integer_part = ''.join(reversed([x + (',' if i and i % 3 == 0 else '') for i, x in enumerate(reversed(integer_part))]))
    
    # 合并整数和小数部分
    result = integer_part
    if fractional_part:
        result += '.' + fractional_part
    
    return result

if __name__ == '__main__':
    print(solution("1294512.12412") == '1,294,512.12412')
    print(solution("0000123456789.99") == '123,456,789.99')
    print(solution("987654321") == '987,654,321')

代码分析

  1. 去除前导零s.lstrip('0') 方法用于去除字符串 s 中的前导零。如果字符串全是零,lstrip('0') 会返回空字符串,这需要我们在后续处理中进行特殊处理。

  2. 分离整数和小数部分split('.') 方法将字符串分为整数部分和小数部分。如果字符串中没有小数点,整数部分就是整个字符串,小数部分为空字符串。

  3. 格式化整数部分

    • reversed(integer_part) 将整数部分反转。
    • enumerate(reversed(integer_part)) 遍历反转后的整数部分,并记录每个字符的索引。
    • x + (',' if i and i % 3 == 0 else '') 在每三位插入一个逗号。
    • ''.join(reversed(...)) 再次反转整数部分,得到格式化后的整数。
  4. 合并整数和小数部分:将格式化后的整数部分和小数部分拼接起来,形成最终的结果。

个人思考与分析

在处理这类字符串格式化问题时,我们需要特别注意边界情况。例如,输入字符串可能全是零,或者没有小数部分。此外,字符串的反转和拼接操作可能会影响性能,尤其是在处理非常大的数字时。

为了优化性能,我们可以考虑使用更高效的字符串处理方法,例如使用 itertools 模块中的 groupby 函数来分组字符,或者使用正则表达式来插入逗号。然而,这些方法可能会增加代码的复杂性,因此在实际应用中需要权衡性能和代码可读性。