颖小主

文章	评论	标签
99	265	99

最新回复

nvsnogxrqy

2025 年 03 月 07 日

这篇文章不错！

uhbcstkreg

2025 年 03 月 07 日

这篇文章不错！

ibddnljzyv

2025 年 03 月 04 日

作者以非凡的视角解读平凡，让文字焕发出别样的光彩。

zxcgvmoila

2025 年 03 月 04 日

案例丰富且贴合主题，论证逻辑环环相扣。

qkestuuhiv

2025 年 03 月 04 日

立意高远，以小见大，引发读者对社会/人性的深层共鸣。

首页 / python / 正文

使用lxml中的xpath提取文本与标签的属性值

定位

div = html.xpath('//div') # 获取所有div
div = html.xpath('//div[@id="pap"]') # 获取id=pap的div
div = html.xpath('//div[@class="foot"]') # 获取class=foot的div
div = html.xpath('//div[@*]')
div = html.xpath('//div[last()-1]')
div = html.xpath('//div[1]')
div = html.xpath('//div[position()<3]')
div = html.xpath('//div|//h1')
div = html.xpath('//div[net(@*)]')

获取文本text()

text = html.xpath('//div/text()')

取属性

value = html.xpath('//a/@href')

python 爬虫 lxml

版权属于：颖小主

本文链接：https://main.itffz.cn/archives/36.html

作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可

打赏

评论区

ifyltvxoxs
2025年3月2日 06:47

逆境中的反思充满生命韧性。

使用lxml中的xpath提取文本与标签的属性值

颖小主

使用lxml中的xpath提取文本与标签的属性值

定位

获取文本text()

取属性

文章目录