java - 如何用正則提取html內(nèi)容
問(wèn)題描述
<p class='info-detail-head-classify-subname'><a href='http://www.intensediesel.com/wenda/11492.html' target='_blank'>財(cái)富</a></p> 想用java 提取財(cái)富兩個(gè)字 請(qǐng)問(wèn)用正則怎么提取 用jsoup會(huì)不會(huì)簡(jiǎn)單一點(diǎn)
問(wèn)題解答
回答1:可以使用jsoup和regex, 推薦使用jsoup!jsoup document:https://jsoup.org/cookbook/in...http://www.open-open.com/jsoup/
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Main { public static void main(String[] args) {// 方法1: jsoup String html = '<p class='info-detail-head-classify-subname'><a href='http://www.intensediesel.com/wenda/11492.html' target='_blank'>財(cái)富</a></p>';Document doc = Jsoup.parse(html); Element element = doc.getElementById('info_detail_head_classify_type'); System.out.println(element.text());// 方法2: regex Pattern r = Pattern.compile('<a.*>(.*)</a>'); Matcher m = r.matcher(html); if (m.find()) {System.out.println(m.group(1)); }} }回答2:
<a[^>]*>([^<]*)</a>
取<a></a>中的內(nèi)容
相關(guān)文章:
1. mysql - 這條聯(lián)合sql語(yǔ)句哪里錯(cuò)了2. mysql優(yōu)化 - 關(guān)于mysql分區(qū)3. 請(qǐng)教各位大佬,瀏覽器點(diǎn) 提交實(shí)例為什么沒(méi)有反應(yīng)4. java - Atom中文問(wèn)題5. java - MySQL中,使用聚合函數(shù)+for update會(huì)鎖表嗎?6. css3 - 這個(gè)形狀使用CSS怎么寫出來(lái)?7. javascript - 為什么這個(gè)點(diǎn)擊事件需要點(diǎn)擊兩次才有效果8. node.js - 在vuejs-templates/webpack中dev-server.js里為什么要exports readyPromise?9. javascript - ionic2 input autofocus 電腦成功,iOS手機(jī)鍵盤不彈出10. java - C語(yǔ)言算法題-韓信點(diǎn)兵 求解?
