新聞中心
這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python中如何使用XPath爬取小說
說明

創(chuàng)新互聯(lián)堅持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站建設(shè)、網(wǎng)站設(shè)計、企業(yè)官網(wǎng)、英文網(wǎng)站、手機端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時代的登封網(wǎng)站設(shè)計、移動媒體設(shè)計的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!
XPath是一種在XML文檔中搜索信息的語言。
過程
1、獲得瀏覽器中的標(biāo)題和作者測試。
2、在瀏覽器安裝xpath插件:
3、在html中找到book-mid-info:
4、找到我們想得到小說的名字、作者
即//div[@class='book-mid-info']/h4/a/txt()
實例
# 作者:
# 開發(fā)時間:2021/4/8/0008 8:24
import requests
from lxml import etree
url="https://www.qidian.com/rank/yuepiao"
headers={'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}
#發(fā)送請求
resp=requests.get(url,headers)
e=etree.HTML(resp.text) #類型轉(zhuǎn)換,把str轉(zhuǎn)變?yōu)閏lass 'lxml.etree._ELement
print(type(e))
names=e.xpath('//div[@class="book-mid-info"]/h4/a/text()')
authors=e.xpath('//p[@class="author"]/a[1]/text()')
print(names)
print(authors)
#名稱和作者對應(yīng)
for name,authors in zip(names,authors):
print(name,":",authors)以上就是python中使用XPath爬取小說的方法,希望對大家有所幫助。更多Python學(xué)習(xí)指路:創(chuàng)新互聯(lián)Python教程
本文教程操作環(huán)境:windows7系統(tǒng)、Python 3.9.1,DELL G3電腦。
標(biāo)題名稱:創(chuàng)新互聯(lián)Python教程:python中如何使用XPath爬取小說
分享URL:http://m.fisionsoft.com.cn/article/dhsggio.html


咨詢
建站咨詢
