Python seek() 操作文件光标移动到指定位置

338 阅读1分钟
  • 注意 seek() 的长度是按字节算的,字符编码存每个字符所占用的字节长度是不一样的,所以区分好自己的编码格式。

  • 比如:中国dzmutf-8 编码格式一个汉字 3 个字节,使用 seek(3) 就会将光标移动到 中|国dzm 之间,seek(6) 就会是 中国|dzm,英文字符还是一个字节,seek(7) 就会是 中国d|zm,另外 gbk2 个字节一个汉字。

  • 比如:一个汉字 utf-8 中占 3 个字节,你偏偏设置 2 ,这样就会报错 'utf-8' codec can't decode byte 0xad in position 0: invalid start byte

  • 案例

    中国dzm
    xyq
    test
    
    # 查看一个汉字占用几个字节
    print('我'.encode()) # b'\xe6\x88\x91' 也就是 3 个字节
    
    # 读取文件
    f = open('test.txt')
    # 输出一行内容
    print(f.readline()) # 中国dzm
    
    
    # 读取文件
    f = open('test.txt')
    # 移动光标到指定位置(注意:不是按字符来指定数字,而是按当前文件的编码格式来算字节数位置,如果你输入的字节数字错误会报错)
    # 比如:一个汉字 3 个字节,你偏偏设置 2 ,这样就会报错 'utf-8' codec can't decode byte 0xad in position 0: invalid start byte
    f.seek(3)
    # 输出一行内容
    print(f.readline()) # 国dzm