解决 Node.js 爬取 gb2312 网页中文乱码

270 阅读1分钟

target="_blank">2022������дӻ�

本打算写个脚本定时爬取某个网站发邮件给自己,但没想到爬取到的内容中文乱码了,经过一通搜索,用 iconv-lite 解码就好了。

image.png

简单记录下

const axios = require('axios')
const iconv = require('iconv-lite')

const res = await axios.get(
  'http://any-gb2312-site.com',
  {
    responseType: 'arraybuffer'
  }
)
iconv.decode(res.data, 'gb2312')