python输出中文的是乱码 python爬虫一部分中文乱码一部分中文正常,如何解决?
python爬虫一部分中文乱码一部分中文正常,如何解决?
这个问题没有遇到过,有的中文乱码,有的正常中文,正常情况下,一个网页的编码格式是一个,不能是几个,要么正常,要么乱码,不清楚你用哪个包做爬虫,这里我就简单的以requests包为例,介绍如何设置网页编码,使中文正常显示,实际测试环境win7python3.6主要步骤如下:1https://www.baidu.com/例如,使用请求的get方法来请求这个页面。代码如下:
程序运行结果如下。您可以看到页面的编码方式是iso-8859-1:
并且iso-8859-1本身不支持中文,所以页面的中文内容显示为乱码,如下图所示:
2。为了支持中文显示,我们可以重置页面代码,如下所示,只要我们支持中文,如UTF-8等,代码如下所示:
3。程序运行结果如下,页面的中文内容已经成功显示,并且没有出现乱码:
到目前为止,我们已经完成了中文的正常显示。就整个过程而言,其实很简单。在使用Python作为爬虫时,经常会遇到中文乱码的情况。一般来说,只要设置网页的编码格式,比如UTF-8,就可以支持中文。网上有很多关于中文乱码的信息。你可以参考它的帮助和学习它也很有帮助。我不在这里重复了。希望以上分享的内容能对您有所帮助。
python输出中文的是乱码 python写入txt文件中文乱码 python无法读取中文txt文本
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。