2016 - 2024

感恩一路有你

python爬虫乱码怎么解决 python爬虫一部分中文乱码一部分中文正常,如何解决?

浏览量:2402 时间:2021-03-16 07:47:01 作者:admin

python爬虫一部分中文乱码一部分中文正常,如何解决?

这个问题没有遇到过,有的中文乱码,有的正常中文,正常情况下,一个网页的编码格式是一个,不能是几个,要么正常,要么乱码,不清楚你用哪个包做爬虫,这里我就简单的以requests包为例,介绍如何设置网页编码,使中文正常显示,实际测试环境win7python3.6主要步骤如下:1https://www.baidu.com/例如,使用请求的get方法来请求这个页面。代码如下:

程序运行结果如下。您可以看到页面的编码方式是iso-8859-1:

并且iso-8859-1本身不支持中文,所以页面的中文内容显示为乱码,到目前为止,我们可以重新显示以下中文代码:

,只要不支持中文代码,我们就可以重新显示以下行:]-3。就整个过程而言,其实很简单。在使用Python作为爬虫时,经常会遇到中文乱码的情况。一般来说,只要设置网页的编码格式,比如UTF-8,就可以支持中文。网上有很多关于中文乱码的信息。你可以参考它的帮助和学习它也很有帮助。我不在这里重复了。希望以上分享的内容能对您有所帮助。

Python中文出现乱码怎么解决?

python爬虫乱码怎么解决 python可以做什么有趣的东西 beautifulsoup网页爬虫解析

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。