2016 - 2024

感恩一路有你

python读取excel文件失败 如何利用Python爬虫爬取智联招聘并存为Excel?

浏览量:4941 时间:2023-05-15 11:27:37 作者:采采

如何利用Python爬虫爬取智联招聘并存为Excel?

这个很简单。智联招聘数据动态加载,存储在一个json文件中。只要我们抓取包,提取这个json文件的url地址,然后直接请求解析这个json文件,就可以抓取到我们需要的数据。我简单介绍一下实现过程,实验环境win10 python3.6 pycharm5.0,主要内容如下:

1.为了更好地说明问题,这里举 "Python "在智联招聘,具体如下:

2.首先,按F12调出开发者工具,点击 "网络 "-gt "xhr "依次,并按F5刷新页面,可以看到网页上动态加载的json文件信息,也就是我们需要抓取的招聘信息,如下图:

3.然后,根据上面的json文件格式,我们可以编写相应的代码来请求和解析json文件。测试代码如下,主要使用requests模块和json模块,其中requests模块用于获取json文件,json模块用于解析json文件,提取我们需要的数据:

点击运行这个程序,效果如下,我们需要的数据已经爬取成功:

4.最后,将数据存储在excel文件中,这也很简单。xlwt主要用于将数据写入Excel文件,并直接写入相应的单元格。测试代码如下:

点击运行该程序,当前项目中会产生一个excel文件。内容如下,是我们需要抓取的招聘信息:

至此,我们已经完成了使用python对智联招聘数据的抓取,并保存为Exc

如何基于Python制作在Excel中批量查询姓名的桌面程序?

使用xlrd库读取excelxlrd。作为python第三方库,可以从excel电子表格中检索信息。

一般来说,可以用python读取excel文件中的任何数据。

我们创建一个新的excel表来解释这种情况:

首先,安装xlrd库(记得在命令行输入)

pip安装xlrd

导入xlrd库

导入xlrd

读取excel文件,也就是刚刚创建的excel表格。

#给出excel文件的绝对路径。

loc(文件路径)

#打开工作表

wb _工作book(锁定)

#这是第一页。

工作表索引(0)

打印excel表格的第一行和第一列。

gtgtgt print(sheet.c:

print(sheet.c:

print(sheet.cell_value(i,0))

名字

亚历克斯

黏土

贾斯廷

打印第一行

gtgtgt print(_values(1))

[亚历克斯,4.0,2011272.0]

用xlwt编写excel

写入excel需要python -xlwt的另一个第三方库。

Xlwt可以编写和修改excel文件,可以设置条件检索数据并修改,方便重复大量工作。

安装还是pip。

pip安装xlwt

导入xlwt

导入xlwt

从xlwt导入工作簿

将数据写入excel

#创建工作簿

wb工作簿()

#使用add_sheet函数创建新的工作表。

工作表1 _工作表(工作表1)

#写数据,参数分别为行、列、数据。

sheet1.write(1,0,ISBT·德拉敦)

sheet1.write(2,0,SHASTRADHARA)

sheet1.write(3,0,克莱门镇)

sheet1.write(拉杰普尔路4,0号)

sheet1.write(5,0,钟楼)

sheet1.write(0,1,ISBT·德拉敦)

sheet1.write(0,2,SHASTRADHARA)

sheet1.write(0,3,克莱门镇)

sheet1.write(拉杰普尔路0,4号)

sheet1.write(0,5,钟楼)

#保存到excel表格

(xlwt示例. xls)

看生成的excel!

如何在exc:加粗1,color:红)

#在单元格中写入数据

sheet.write(0,0,样本,样式)

#保存excel

(sample.xls)

看看结果!

excel 数据 文件 工作

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。