8. 字符串转换整数 (atoi)

100 阅读6分钟

题目

请你来实现一个 myAtoi(string s) 函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi 函数)。

函数 myAtoi(string s) 的算法如下:

  1. 读入字符串并丢弃无用的前导空格
  2. 检查下一个字符(假设还未到字符末尾)为正还是负号,读取该字符(如果有)。 确定最终结果是负数还是正数。 如果两者都不存在,则假定结果为正。
  3. 读入下一个字符,直到到达下一个非数字字符或到达输入的结尾。字符串的其余部分将被忽略。
  4. 将前面步骤读入的这些数字转换为整数(即,"123" -> 123, "0032" -> 32)。如果没有读入数字,则整数为 0 。必要时更改符号(从步骤 2 开始)。
  5. 如果整数数超过 32 位有符号整数范围 [−231,  231 − 1] ,需要截断这个整数,使其保持在这个范围内。具体来说,小于 −231 的整数应该被固定为 −231 ,大于 231 − 1 的整数应该被固定为 231 − 1 。
  6. 返回整数作为最终结果。

注意:

  • 本题中的空白字符只包括空格字符 ' ' 。
  • 除前导空格或数字后的其余字符串外,请勿忽略 任何其他字符。

示例 1:

输入: s = "42"
输出: 42
解释: 加粗的字符串为已经读入的字符,插入符号是当前读取的字符。
第 1 步:"42"(当前没有读入字符,因为没有前导空格)
         ^
第 2 步:"42"(当前没有读入字符,因为这里不存在 '-' 或者 '+')
         ^
第 3 步:"42"(读入 "42")
           ^
解析得到整数 42 。
由于 "42" 在范围 [-231, 231 - 1] 内,最终结果为 42

示例 2:

输入: s = "   -42"
输出: -42
解释:
第 1 步:" -42"(读入前导空格,但忽视掉)
            ^
第 2 步:"   -42"(读入 '-' 字符,所以结果应该是负数)
             ^
第 3 步:"   -42"(读入 "42")
               ^
解析得到整数 -42 。
由于 "-42" 在范围 [-231, 231 - 1] 内,最终结果为 -42

示例 3:

输入: s = "4193 with words"
输出: 4193
解释:
第 1 步:"4193 with words"(当前没有读入字符,因为没有前导空格)
         ^
第 2 步:"4193 with words"(当前没有读入字符,因为这里不存在 '-' 或者 '+')
         ^
第 3 步:"4193 with words"(读入 "4193";由于下一个字符不是一个数字,所以读入停止)
             ^
解析得到整数 4193 。
由于 "4193" 在范围 [-231, 231 - 1] 内,最终结果为 4193

提示:

  • 0 <= s.length <= 200
  • s 由英文字母(大写和小写)、数字(0-9)、' ''+''-' 和 '.' 组成

解题思路

  1. 读入字符串并丢弃无用的前导空格
  2. 检查下一个字符为正还是负号,确定最终结果的符号
  3. 读入下一个字符,直到非数字字符或到达输入的结尾,将数字字符转换为整数
class Solution:
    def myAtoi(self, s: str) -> int:
        # Define the bounds for a 32-bit signed integer
        INT_MAX = 2**31 - 1
        INT_MIN = -2**31

        # Initialize the index and sign of the answer
        i = 0
        sign = 1
        ans = 0
        length = len(s)

        # Discard whitespaces in the beginning
        while i < length and s[i] == ' ':
            i += 1

        # Check if the next character is '-' or '+'
        if i < length and (s[i] == '-' or s[i] == '+'):
            sign = -1 if s[i] == '-' else 1
            i += 1

        # Convert the digits in the string to an integer
        while i < length and s[i].isdigit():
            digit = int(s[i])
            
            # Check for overflow and underflow conditions
            if (ans > INT_MAX // 10) or (ans == INT_MAX // 10 and digit > INT_MAX % 10):
                return INT_MAX if sign == 1 else INT_MIN
            
            ans = ans * 10 + digit
            i += 1

        return sign * ans

优化方法

为了提高代码的执行速度,我们采取以下优化措施:

  1. 通过一次遍历减少字符串的重复扫描
  2. 在解析过程中,一旦遇到非法字符就终止解析
  3. 在构建整数时,避免不必要的乘法和加法操作

运行优化后的代码

class Solution:
    def myAtoi(self, s: str) -> int:
        INT_MAX, INT_MIN = 2**31 - 1, -2**31
        i, n, sign = 0, len(s), 1
        
        # Discard all spaces from the beginning
        while i < n and s[i] == ' ':
            i += 1
            
        # Check if the next character is a sign
        if i < n and s[i] in '+-':
            sign = -1 if s[i] == '-' else 1
            i += 1
        
        # Convert digits to integer until a non-digit is encountered
        num = 0
        while i < n and s[i].isdigit():
            digit = int(s[i])
            # Check for overflow and underflow before multiplying by 10
            if num > INT_MAX // 10 or (num == INT_MAX // 10 and digit > INT_MAX % 10):
                return INT_MAX if sign == 1 else INT_MIN
            num = num * 10 + digit
            i += 1
            
        return sign * num

运行

sol = Solution()
print(sol.myAtoi("42"))            # 预期输出:42
print(sol.myAtoi("   -42"))        # 预期输出:-42
print(sol.myAtoi("4193 with words"))  # 预期输出:4193

总结

初始解题方法

一开始,我们的解题方法遵循了简单直观的步骤:从字符串中读取每个字符,跳过前导空格,处理正负号,然后将连续的数字字符转换为整数。过程中,我们需要注意处理可能的整数溢出。这种方法虽然正确,但在每次迭代中进行多次操作,包括乘法和加法,这可能会导致性能下降,特别是在处理非常长的字符串时。

优化思路

优化的关键在于减少不必要的操作和提前终止。首先,我们通过一次遍历来完成所有工作,减少了字符串的重复扫描。其次,我们在确定结果为非法或完成转换后立即终止循环,避免了处理字符串剩余部分的开销。最后,我们精简了数字构造的逻辑,通过更智能的溢出检查减少了运算次数。

优化后的解题方法

优化后的方法中,我们使用单次遍历来识别并转换数字,同时在识别到第一个非数字字符时停止,从而避免了对后续字符的无效处理。我们还改进了溢出检测的逻辑,使得只在必要时才进行复杂的溢出检查。这些改进显著提高了算法的运行效率。

总的来说,优化后的算法更为高效,它不仅保留了原有方法的正确性,同时在速度和性能上都有了显著提升。这种优化技巧可以广泛应用于其他需要处理字符串和整数转换的算法中。

题目链接

leetcode.cn/problems/st…