文章詳情頁
python利用css的font-family 提取html字符串的庫?
瀏覽:126日期:2022-06-28 16:50:52
問題描述
python下利用有利用css的font-family屬性來提取html字符串的庫嗎?用來做字體子集化。
問題解答
回答1:你問的問題有一點模糊,若是使用CSS Selector取html內的內容,可以用lxml.cssselect,中文說明還有這有,且不只是用lxml
回答2:font-family只是指定使用的字體。
你想做的是對一篇HTML計算一共有多少個漢字,然后動態或者半靜態生成只包含這些字的提及比較小的漢字字體遠程下載使用?
如果只是計算漢字,其實python下面的set是最簡單的。
但是要生成對應的字庫就是大坑了。目前方正有類似的服務,似乎叫云字庫,之前詢過價,對方老實表示問題還不少。
相關文章:
排行榜
