xpath 怎么取出 html 原文？

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 2649 days ago, the information mentioned may be changed or developed.

<div class="a">
    <a href="123.jpg">sample</a>
</div>

假设有这样一个 html，我要提取 div 中间的 html 原文，如：

<a href="123.jpg">sample</a>

要这段 html 原文，而不是 text 之类的东西，这个该怎么做？
用了 xpath 停久了，第一次碰到这个需求，查了一圈关键字 xpath + html + 各种关键字结果都挺乱的，来 v2 请教一下。

6 replies • 2019-03-13 21:05:13 +08:00

jayong

Mar 13, 2019

//div[@class='a']

MilkShake

Mar 13, 2019

//div[@class='a']/a/text() 不知道对不对，很久没用了

MilkShake

Mar 13, 2019

当我上面语句没说- - 没仔细看完、

Nick2VIPUser

Mar 13, 2019 via iPhone

etree.tounicode()
etree.tostring()

JCZ2MkKb5S8ZX9pq

Mar 13, 2019

@Nick2VIPUser 嗯，后来我自己搜到这个 tostring，还有 tounicode 哦，我试试去。

题目没说完整，的确是 python etree。

Lax

Mar 13, 2019

echo '<div class="a">
<a href="123.jpg">sample</a>
</div>' | nokogiri -e 'puts $_.xpath("//div[@class=\"a\"]").inner_html'