文章詳情頁

java - 如何用正則提取html內容

瀏覽：122日期：2023-12-04 08:35:21

問題描述

<p class='info-detail-head-classify-subname'><a href='http://m.cgvv.com.cn/wenda/11492.html' target='_blank'>財富</a></p> 想用java 提取財富兩個字請問用正則怎么提取用jsoup會不會簡單一點

問題解答

回答1：

可以使用jsoup和regex, 推薦使用jsoup!jsoup document:https://jsoup.org/cookbook/in...http://www.open-open.com/jsoup/

import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;import java.util.regex.Matcher; import java.util.regex.Pattern;public class Main { public static void main(String[] args) {// 方法１: jsoup String html = '<p class='info-detail-head-classify-subname'><a href='http://m.cgvv.com.cn/wenda/11492.html' target='_blank'>財富</a></p>';Document doc = Jsoup.parse(html); Element element = doc.getElementById('info_detail_head_classify_type'); System.out.println(element.text());// 方法2: regex Pattern r = Pattern.compile('<a.*>(.*)</a>'); Matcher m = r.matcher(html); if (m.find()) {System.out.println(m.group(1)); }} }回答2：

<a[^>]*>([^<]*)</a>

取<a></a>中的內容

HTML

上一條：java - 反射數組:為什么每次獲取Modifiers都是public,abstract,以及final下一條：java - Kafka:如果消息的保存策略被設置為2天，那么在一個消息被發布的兩天時間內，它都是可以被消費的。之后它將被丟棄以釋放空間。

相關文章：

1. nignx - docker內nginx 80端口被占用2. docker api 開發的端口怎么獲取？3. dockerfile - [docker build image失敗- npm install]4. 關于docker下的nginx壓力測試5. docker images顯示的鏡像過多，狗眼被亮瞎了，怎么辦？6. java - 阿里的開發手冊中為什么禁用map來作為查詢的接受類?7. macos - mac下docker如何設置代理8. dockerfile - 為什么docker容器啟動不了？9. 在windows下安裝docker Toolbox 啟動Docker Quickstart Terminal 失敗！10. docker網絡端口映射，沒有方便點的操作方法么？

排行榜

					
					關于docker下的nginx壓力測試
nignx - docker內nginx 80端口被占用
dockerfile - [docker build image失敗- npm install]
docker api 開發的端口怎么獲取？
docker images顯示的鏡像過多，狗眼被亮瞎了，怎么辦？
java - 阿里的開發手冊中為什么禁用map來作為查詢的接受類?
docker - 如何修改運行中容器的配置
在windows下安裝docker  Toolbox 啟動Docker Quickstart Terminal 失敗！
docker鏡像push報錯
docker網絡端口映射，沒有方便點的操作方法么？
golang - 用IDE看docker源碼時的小問題
				

熱門標簽

成人视屏在线观看-国产99精品-国产精品1区2区-欧美一级在线观看-国产一区二区日韩-色九九九

java - 如何用正則提取html內容