2016 - 2024

感恩一路有你

python编程 python爬虫一部分中文乱码一部分中文正常,如何解决?

浏览量:1289 时间:2021-03-17 13:03:44 作者:admin

python爬虫一部分中文乱码一部分中文正常,如何解决?

这个问题没有遇到过,有的中文乱码,有的正常中文,正常情况下,一个网页的编码格式是一个,不能是几个,要么正常,要么乱码,不清楚你用哪个包做爬虫,这里我就简单的以requests包为例,介绍如何设置网页编码,使中文正常显示,实际测试环境win7python3.6主要步骤如下:1https://www.baidu.com/例如,使用请求的get方法来请求这个页面。代码如下:

程序运行结果如下。您可以看到页面的编码方式是iso-8859-1:

并且iso-8859-1本身不支持中文,所以页面的中文内容显示为乱码,如下图所示:

2。为了支持中文显示,我们可以重置页面代码,如下所示,只要我们支持中文,如UTF-8等,代码如下所示:

3。程序运行结果如下,页面的中文内容已经成功显示,并且没有出现乱码:

到目前为止,我们已经完成了中文的正常显示。就整个过程而言,其实很简单。在使用Python作为爬虫时,经常会遇到中文乱码的情况。一般来说,只要设置网页的编码格式,比如UTF-8,就可以支持中文。网上有很多关于中文乱码的信息。你可以参考它的帮助和学习它也很有帮助。我不在这里重复了。希望以上分享的内容能对您有所帮助。

python编程 python人脸识别源码 python读取中文乱码

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。