python编程 python爬虫一部分中文乱码一部分中文正常，如何解决？

2021-03-17

1289

python爬虫一部分中文乱码一部分中文正常，如何解决？这个问题没有遇到过，有的中文乱码，有的正常中文，正常情况下，一个网页的编码格式是一个，不能是几个，要么正常，要么乱码，不清楚你用哪个包做爬虫，这

python爬虫一部分中文乱码一部分中文正常，如何解决？

这个问题没有遇到过，有的中文乱码，有的正常中文，正常情况下，一个网页的编码格式是一个，不能是几个，要么正常，要么乱码，不清楚你用哪个包做爬虫，这里我就简单的以requests包为例，介绍如何设置网页编码，使中文正常显示，实际测试环境win7python3.6主要步骤如下：1https://www.baidu.com/例如，使用请求的get方法来请求这个页面。代码如下：

程序运行结果如下。您可以看到页面的编码方式是iso-8859-1：

并且iso-8859-1本身不支持中文，所以页面的中文内容显示为乱码，如下图所示：

2。为了支持中文显示，我们可以重置页面代码，如下所示，只要我们支持中文，如UTF-8等，代码如下所示：

3。程序运行结果如下，页面的中文内容已经成功显示，并且没有出现乱码：

到目前为止，我们已经完成了中文的正常显示。就整个过程而言，其实很简单。在使用Python作为爬虫时，经常会遇到中文乱码的情况。一般来说，只要设置网页的编码格式，比如UTF-8，就可以支持中文。网上有很多关于中文乱码的信息。你可以参考它的帮助和学习它也很有帮助。我不在这里重复了。希望以上分享的内容能对您有所帮助。

python爬虫一部分中文乱码一部分中文正常，如何解决？

相关推荐