loading...

4

Node 小说爬虫中文乱码

其他读完大概需要1分钟

  • 发布时间:2017-07-28 00:26 星期五
  • 刘伟波
  • 154
  • 更新于2017-07-28 00:26 星期五

小说网站的页面内容编码用的 GBK,如果不做处理,中文内容会是乱码。解决方案是用 iconv-lite 来对内容用 GBK 的方式来解码。大概的写法:

var iconv = require('iconv-lite')
request({
  url: BOOK_URL,
  encoding: null // 传 null,可以让 body 的类型是 Buffer。 用 iconv 进行 decode 传入的参数必须是 Buffer类型的。
}, (error, response, body) => {
  body = iconv.decode(body, 'GBK')
})




你可能感兴趣的文章

    发表评论

    评论支持markdown,评论内容不能超过500字符,如果内容过多或者要及时回复,建议去 平台,一般一天之内就会回复。
    关于技术问题或者有啥不懂的都可以留言,我会定期回复答 疑,推荐最新仓库 前端知识体系, 感謝支持!