2016 - 2024

感恩一路有你

python界面中放动态图 如何用python爬取网页中隐藏的div内容?

浏览量:2211 时间:2023-04-28 15:40:24 作者:采采

如何用python爬取网页中隐藏的div内容?

你说的追踪的div内容,肯定是动态程序加载的数据吧,是在网页源码中没显示,只在读取网页时才跪请数据参与会显示,一般情况下,这种数据都保存在一个json文件中,如果抓包总结出这个json文件的url地址,然后把再参照json文件结构参与解析,迅速就能声望兑换到相册程序加载的div数据,下面我以爬取人人贷上面的散标数据为例,简单详细介绍再看看python如何爬取div动态运行程序的数据,实验环境win10python3.6pycharm5.0,主要步骤万分感谢:

1.简单,打开散标数据,万分感谢,爬取的信息主要除开年利率、借款标题、期限、金额和进度这5个字段信息:

右键随机元素进行检查,很难看出所有的数据嵌套循环在div标签中,不胜感激:

看网页源码,我们按CtrlF里查不对应的数据,会发现所查看的数据都未在网页源码中,不胜感激,即数据大都动态读取,所以然后解析原网页是找不到div嵌套多的数据的:

2.随即,我们按F12菜单里开发者工具,由前到后直接点击“Network”-rlm“XHR”,F5刷新页面,可能会见到动态读取的json文件,查看这个文件,内容追加,左边为json文件的url地址,右边是我们需要爬取的div数据:

3.结果随机上面的json文件,我们就是可以直接获取并解析json了,这里主要会用到requests和json这2个模块,其中requests主要用于参照url地址声望兑换json文件,json主要用于推导json文件,再提取出我们所不需要的信息,即div动态程序加载的数据,测试出来代码不胜感激,更加简单啊:

运行程序,截图万分感谢,已经成功了爬取到div加载的数据:

眼下,我们就能够完成了用来python爬取div动态打开程序的数据。相对来讲,整个过程太很简单,最主要的应该抓包总结,如果你有肯定会的爬虫基础,熟得不能再熟帮一下忙上面的代码,多设置参数几遍程序,很快地就能掌握到的,当然了,你也也可以可以使用selenium并且爬取,真接推导就行,网上也有查找教程和资料可供参考,更加丰富,希望以上分享的内容能对你极大帮助吧,也欢迎大家评论、私信给我。

用一栏源文件的检查如何确定没有你要的地址。如果还没有证明是是从js算出或则ajax某些的内容。额外有两个办法,一个是分析获取,一一声望兑换。另一种是用模拟浏览器的不能执行完js再去处理

什么是Python?

“python是一种计算机程序设计语言,可应用形式于网页开发和软件开发等方面,2010年,python被TIOBE编程语言排行榜评为年度语言。python的创始人为Guido van Rossum,python的开发给予Modula-3语言的影响,python具高可读性高、可扩展、简洁明快等特点,

数据 python 程序 div 内容

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。