2016 - 2024

感恩一路有你

怎么用python爬数据 python如何读取网页中的数据?

浏览量:2133 时间:2021-03-12 12:29:28 作者:admin

python如何读取网页中的数据?

用Beautiful Soup这类解析模块: Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree); 它提供简单又常用的导航(navigating),搜索以及修改剖析树的操作; 用urllib或者urllib2(推荐)将页面的html代码下载后,用beautifulsoup解析该html; 然后用beautifulsoup的查找模块或者正则匹配将你想获得的内容找出来,就可以进行相关处理了,例如: from BeautifulSoup import BeautifulSoup html = "

test body

" soup = BeautifulSoup(html) soup.contents[0]

.name

# u"html" soup.comtents[0].contents[0]

.name

# u"head" head = soup.comtents[0].contents[0]

head.parent.name

# u"html"

head.next

# u"<title>test</title>

怎么用python爬数据 python怎么爬取网站数据 python网页抓取实例

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。