怎么抓取网页数据 如何抓取网页代码中的URL?
如何抓取网页代码中的URL?
下面的代码可以获取指定URL页面中的所有链接,即,所有a标记的a属性://获取链接的HTML代码$HTML=filegetcontents(”http://www.example.com“”$dom=new DOMDocument()@$dom->loadHTML($html)$xpath=new DOMXPath($dom)$hrefs=$xpath->evaluate(“/html/body//a”)for($i=0$i length$i){$href=$hrefs->item($i)$url=$href->getAttribute(“href”)echo$url。“”}此代码将获取所有a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag的a-tag内容(”http://www.example.com“”$DOM=new domdocument()@$DOM->loadhtml($HTML)$XPath=new domxpath($DOM)$hrefs=$XPath->evaluate(“/HTML/body//a”)for($I=0$I length$I){U.S.=$hrefs->item($I)$url=$U.S.=$U.S.->getattribute(“U.S.”)//保留以HTTP if开头的链接(substr($url,0,4)==“HTTP”)echo$url。"}
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。