国产成人精品亚洲777人妖,欧美日韩精品一区视频,最新亚洲国产,国产乱码精品一区二区亚洲

您的位置:首頁技術文章
文章詳情頁

python - lxml.etree為什么會自動加上加上</i>?

瀏覽:173日期:2022-06-27 17:32:13

問題描述

正在學習lxml,代碼如下:

from lxml import etreetext = ’’’<i class='cell maincell'> <p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></i>’’’html = etree.HTML(text)print(etree.tostring(html,encoding=’utf-8’).decode(’utf-8’))

輸出如下:

<html><body><i class='cell maincell'> </i><p class='title'><a target='_blank' > <span>洋鼴鼠</span></a> </p> <p><span class='tags t-small c-gray-aset'> <a >電子商務</a></span><span class='loca c-gray-aset t-small'> <a >天津</a></span> </p></body></html>

主要不理解為什么<i>標簽那里會出錯呢?請問怎么解決這個問題?謝謝~

問題解答

回答1:

主要是因為

p元素內容分類 Flow content, palpable content.允許的內容 Phrasing content.允許的父元素任何接受flow content的元素

i元素Content catergories Flow content, phrasing content, palpable content.允許量 phrasing content.

很顯然P元素的父元素應該是flow content類型的,然而i并不滿足條件,也就是說這是不符合規范的。解決辦法就是i直接換為p。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 固原市| 灌云县| 怀集县| 天长市| 秦皇岛市| 鸡西市| 武夷山市| 罗平县| 桃源县| 垣曲县| 乳山市| 广饶县| 绥阳县| 无锡市| 福鼎市| 含山县| 德保县| 新蔡县| 新干县| 津南区| 读书| 哈巴河县| 海淀区| 阿合奇县| 马关县| 昂仁县| 利辛县| 莱州市| 固阳县| 阳山县| 苗栗市| 宁城县| 万山特区| 崇明县| 青阳县| 玉门市| 中西区| 石狮市| 鹤壁市| 清新县| 甘谷县|