文章詳情頁

xpath - python怎么用lxml處理

瀏覽：110日期：2022-09-22 09:54:52

問題描述

例如：

沒aa沒aa沒aa沒

就是在p標簽里可能會出現同樣的em標簽，而且數量不定，那我怎么獲取p的內容，包括em里的內容。例如第二個p獲取輸出是‘沒aa沒aa’

或者獲取到p節點之后，怎么把里面的內容轉換為字符串

問題解答

回答1：

今天偶然學到處理這個問題的方法，特意翻出來這個問題回答。題主你可以看一下xpath的軸，比如你要取得第二個標簽的“沒aa沒aa”，實際是取得它全部后代節點的文本內容，可以使用element_dom.xpath('//p[2]//descendant::text()')來取得，拿到的結果是一個這樣[’沒’, ’aa’, ’沒’, ’aa’]的list,然后自己手動拼接成字符串就可以了，比如''.join(list)。同理，如果你需要進行其他操作，也可以使用類似的方法。

回答2：

換bs4，string和text之間的異同就在這里。

回答3：

lxml.html的.text_content()方法，可以獲取當前節點和所有子節點的文本內容。

Python 編程

上一條：python - 如何爬取豆瓣電影的詳細信息下一條：python - [Errno 2] No such file or directory: ’我為什么是一個文件，為什么返回值是這樣的呢？

相關文章：

1. 老師我是一個沒有學過php語言的準畢業生我希望您能幫我一下2. mysql如何配置遠程php外網鏈接數據庫3. mysql - eclispe無法打開數據庫連接4. mysql 5萬張表導出成sql 不要內容，只要結構，非常慢。如何解決啊？5. 數據庫 - mysql中有沒查看數據大小的函數??6. 導入數據庫不成功7. PHP單例模式8. mysql - 關于數據緩存策略方面的疑惑9. mysql如何判斷數據不存在則插入呢？10. mysql無法刪除字段（錯誤1091），但是對該字段設置主鍵后就可刪除，為什么？

排行榜

					
					angular.js - 下圖的函數有什么作用？
node.js - vue express 前后端分離 登錄驗證 與 權限控制問題
angular.js - 全站用的angular，但是像下面描述的這樣強交互的功能用angular該用什么思路去做呢？
android - Apk 中找不到r類文件
PHP單例模式
java - idea創建多modules項目后，tomcat啟動失敗
angular.js - Angular為什么我的版本換了下就不能用了呢？
android百度地圖定位問題
wordpress - Nginx中禁止訪問txt，robots.txt文件例外，規則該怎么寫？
javascript - 關于Js中 this的一道題
mysql如何判斷數據不存在則插入呢？
				

熱門標簽

国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

xpath - python怎么用lxml處理