Matcher類的簡單使用

今天工作時遇到一個問題, 用正則處理html標簽時不知該如何下手。還好有Matcher幫助解決了問題。
需求如下:

例如有如下html文章內容:
<p><a href="www.baidu.com">百度的鏈接</a>; 這是一個百度的鏈接。 <a href="www.jiakaobaodian.com">駕考寶典的鏈接</a>這是一個駕考寶典的鏈接</p>;

在我們做文章內鏈的時候, 往往摻雜了一些我們不想要的鏈接, 如上所示我們只想保留www.jiakaobaodian.com 的鏈接, 如下是我們希望得到的:
<p>這是一個百度的鏈接。<a href="www.jiakaobaodian.com">駕考寶典的鏈接</a>這是一個駕考寶典的鏈接</p>;

說白了就是去掉自己不需要的標簽, 但是保留標簽中的文本。
開始嘗試用Jsoup,Dom4j 一類的解析這段html, 但是后面在刪除標簽的時候都遇到了問題, 最后嘗試使用Matcher中的appendReplacementappendReplacement才解決問題。

1, 使用實例:
Image[4]

輸出結果是將沒有匹配到的a標簽都remove掉且保留了標簽中的文字。
結果如下圖:
Image(1)[4]


下面在講一個簡單的案例:
public static void main(String[] args) throws Exception{
??? Pattern p = Pattern.compile("(\\w+)%(\\d+)");
??? Matcher m = p.matcher("前ab%12中cd%34后");
??? StringBuffer s = new StringBuffer();
??? while (m.find()) {
??????? m.appendReplacement(s, "app");
??? }
??? System.out.println(s);// 前app中app
??? m.appendTail(s);
??? System.out.println(s);// 前app中app
}

先看下這段正則的匹配情況:
Image(2)[4]
圖中彩色的部分就是匹配到情況, 遇到這種需要正則匹配且時時看到結果的, 大家可以到: https://regex101.com/ 上測試。
然后看下輸出結果:
Image(3)

2, 解釋說明:
public Matcher appendReplacement(StringBuffer sb, String replacement)
將當前匹配子串替換為指定字符串,并將從上次匹配結束后到本次匹配結束后之間的字符串添加到一個StringBuffer對象中,最后返回其字符串表示形式。
注意:對于最后一次匹配,其后的字符串并沒有添加入StringBuffer對象中,若需要這部分的內容需要使用appendTail方法。

public StringBuffer appendTail(StringBuffer sb)
將最后一次匹配工作后剩余的字符串添加到一個StringBuffer對象里。

更多內容大家可以查看Matcher類。
參考:http://www.cnblogs.com/SQP51312/p/6134324.html

轉載于:https://www.cnblogs.com/wang-meng/p/7613177.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/253265.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/253265.shtml
英文地址,請注明出處:http://en.pswp.cn/news/253265.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

USB 攝像頭成熟方案介紹

UVC&#xff0c;全稱為&#xff1a;USB video class 或USB video device class。是Microsoft與另外幾家設備廠商聯合推出的為USB視頻捕獲設備定義 的協議標準&#xff0c;目前已成為USB org標準之一。 如今的主流操作系統(如Windows XP SP2 and later, Linux 2.4.6 and later…

JS練習:商品的左右選擇

代碼&#xff1a; <!DOCTYPE html> <html> <head><meta charset"UTF-8"><title>商品的左右選擇</title><!--步驟分析1. 確定事件: 點擊事件 :onclick事件2. 事件要觸發函數 selectOne3. selectOne要做一些操作(將左邊選中的元…

java生成首字母拼音簡碼的總結

百度找到了某論壇高人寫的java&#xff08;具體論壇記不清了&#xff09;&#xff0c;直接用來調用&#xff0c;再次非常感謝&#xff0c;基本上實現了我的需求 package MD5;import java.util.Scanner;public class ChineseToPinYin { /** * 漢字轉拼音縮寫 * * param str * 要…

sockaddr_in , sockaddr , in_addr區別Socket編程函數集(非常有用)

一、sockaddr和sockaddr_in在字節長度上都為16個BYTE&#xff0c;可以進行轉換 struct sockaddr { unsigned short sa_family; //2 char sa_data[14]; //14 }; 上面是通用的socket地址&#xff0c;具體到Int…

Python 購物車

購物車需求&#xff1a; 可購買的商品信息顯示 顯示購物車內的商品信息、數量 購物車內的商品數量進行增加、減少 用戶余額的充值 用戶購買完成進行結賬&#xff0c;將最終余額回寫到用戶文件中   流程圖&#xff1a; 代碼&#xff1a; 1、主文件 def login():# 驗證用戶帳號…

認對畫對MOS管

MOS管我們在設計電路中經常用的一種無源器件。 首先介紹下&#xff0c;在原理圖和PCB以及實物PCBA中如何辨別各種MOS管&#xff0c;作為應用好的先決條件&#xff0c;必須認對畫對管子。 1. MOS管的GSD三極在原理圖和PCB上怎么判定&#xff1a; G極(gate)—柵極&#xff0c;原…

Jmeter之BeanShell

在Jmeter中各種分類組件中都有相應的BeanShell組件&#xff0c;這里簡單的說明一下Beanshell的使用。 一、概念 BeanShell是一種符合Java語法的腳本語言&#xff0c;也有自己的一些特定語法 二、內置變量 Jmeter在它的Beanshell中內置了變量&#xff0c;用戶可以通過這些變量與…

HDU 1875 暢通工程再續

傳送門&#xff1a;http://acm.hdu.edu.cn/showproblem.php?pid1875 簡單的最小生成樹 #include <iostream> #include <cstdio> #include <cmath> using namespace std;const int maxn100005; const double INF1.0e20;struct Node{double x,y; } isl[maxn];…

C語言變長數組 struct中char data[0]的用法

摘要&#xff1a;在實際的編程中&#xff0c;我們經常需要使用變長數組&#xff0c;但是C語言并不支持變長的數組。此時&#xff0c;我們可以使用結構體的方法實現C語言變長數組。 struct MyData {int nLen;char data[0];}; 在結構中&#xff0c;data是一個數組名&#xff1b;但…

MOS管的實際應用

繼上一篇“認對畫對MOS管”后&#xff0c;現在小結一下MOS管的具體應用&#xff1a; 應用MOS管前&#xff0c;理解MOS管每個參數的具體意義后&#xff0c;再額外注意一下管子本身的體二極管&#xff0c;本身Vf1.6V&#xff0c;導通后管子本身阻抗一般是mΩ級&#xff1b;管子廠…

imp導入前對當前用戶清庫腳本

--清空當前用戶所有表begin for i in ( select drop table || a.tab_name as sqls from (select distinct t.tab_name from (select Lower(table_name) as tab_name from user_tables) t) a ) loop dbms_output.put_line(i.sqls); execute immediate i.sqls; end loop;end;/--清…

Spring - Spring Boot Spring Cloud

Spring -> Spring Boot > Spring Cloud 這幾天剛剛上班&#xff0c;公司用的是Spring Cloud&#xff0c;接觸不多。我得趕快學起來。 想學習就必須得知道什么是微服務&#xff0c;什么是Spring Boot&#xff0c;什么是Spring Cloud&#xff0c;以及兩者之間有什么關系&am…

C語言 · 前10名

算法提高 前10名 時間限制&#xff1a;1.0s 內存限制&#xff1a;256.0MB問題描述數據很多&#xff0c;但我們經常只取前幾名&#xff0c;比如奧運只取前3名。現在我們有n個數據&#xff0c;請按從大到小的順序&#xff0c;輸出前10個名數據。輸入格式兩行。第一行一個整數n…

ssacanf\Sprintf格式化字符串

一、sscanf sscanf() - 從一個  int sscanf(const char *buffer,const char *format,[argument ]...); buffer 存儲的數據 format 格式控制字符串 argument 選擇性設定字符串 sscanf會從buffer里讀進數據&#xff0c;依照argument的設定將數據寫回。字符串中讀進與指定格式相…

防火墻規則

1、iptables -t -L -n -t指定表格 -L 顯示目前表格的規則 -n 數字顯示2、iptables-save 以命令方式顯示規則3、清除清空filter從頭制定規則 ipatables -F 清除已經定義 iptables -X 清除自定義鏈 iptables -z 清除鏈統計和計數4、設定默認規則,當所有規則不匹…

JAVA中循環刪除list中元素的方法總結

印象中循環刪除list中的元素使用for循環的方式是有問題的&#xff0c;但是可以使用增強的for循環&#xff0c;然后今天在使用時發現報錯了&#xff0c;然后去科普了一下&#xff0c;再然后發現這是一個誤區。下面就來講一講。。伸手黨可直接跳至文末。看總結。。 JAVA中循環遍歷…

直流有刷電機與無刷電機的區別

首先介紹有刷電機與無刷電機工作原理&#xff0c;最后從調速方式及性能差異這兩個方面詳細的闡述了有刷電機與無刷電機的區別。 有刷電機與無刷電機工作原理 1、有刷電機 電機工作時&#xff0c;線圈和換向器旋轉&#xff0c;磁鋼和碳刷不轉&#xff0c;線圈電流方向的交替變化…

MapReduce詳解

MapReduce簡介 MapReduce是一種編程模型&#xff0c;用于大規模數據集&#xff08;大于1TB&#xff09;的并行運算。概念"Map&#xff08;映射&#xff09;"和"Reduce&#xff08;歸約&#xff09;"&#xff0c;是它們的主要思想。 MapReduce極大地方便了編…

JavaScriptBreak 語句 continue 語句

break 語句用于跳出循環。 continue 用于跳過循環中的一個迭代。 Break 語句 我們已經在本教程之前的章節中見到過 break 語句。它用于跳出 switch() 語句。 break 語句可用于跳出循環。 continue 語句跳出循環后&#xff0c;會繼續執行該循環之后的代碼&#xff08;如果有的話…

kernel mtd 分區與UBOOT 分區的理解

今天做內核移植&#xff0c;準備添加NAND flash的驅動&#xff0c;做到MTD分區時&#xff0c;想起在一本書上看到的一句話&#xff0c;說的是分區時每個區之間沒有間隙&#xff0c;前一個區的結束地址是后一個區的起始地址。可是當我看我的開發板的教程時&#xff0c;分區如下&…