how2j.cn

步骤 1 : 零个或一个   
步骤 2 : 零个或多个   
步骤 3 : 一个或多个   
步骤 4 : 匹配次数   
步骤 5 : 次数区间   
步骤 6 : 至少几次   
步骤 7 : 防止过度匹配   
步骤 8 : 练习-重复匹配   

-?\d\d\d 表示三个连续的数字,前面有一个-或者没有-
零个或一个
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "-?\\d\\d\\d" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
-*\d\d\d 表示三个连续的数字,前面有零个-或者多个-
零个或多个
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "-*\\d\\d\\d" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
-+\d\d\d 表示三个连续的数字,前面有一个-或者多个-
一个或多个
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "-+\\d\\d\\d" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
\d{3}表示三个连续的数字, 和 \d\d\d 一样的效果
匹配次数
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "\\d{3}" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
\d{3,4}表示至少3个连续的数字,最多4个连续的数字。
次数区间
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "\\d{3,4}" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
\d{3,}表示至少3个连续的数字,上不封顶
至少几次
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "\\d{3,}" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
步骤 7 :

防止过度匹配

edit
[A-Z]{3}.*\d{3} 表示以3个字母开始,3个数字结束的匹配模式。 .* 表示中间是任意符号,任意数量。
在默认情况下 .*贪婪模式,会尽可能多的匹配多的字符。 所以匹配结果就是

ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132

因为这个结果满足匹配条件,往往导致过度匹配

然而,我们在.* 后面加一个?后,就表示懒惰模式,尽可能匹配少的
[A-Z]{3}.*?\d{3} 表示以3个字母开始,3个数字结束的匹配模式。
.*? 表示中间是任意符号,任意数量,但是尽量少匹配,只要满足最低要求就行。
这样就会找到如下结果:

ABS 041
SNIS--556
MXBD---197
MGD692
SNIS----556
ASW-132
防止过度匹配
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Regex { public static void main(String[] args) { String[] ps = { "[A-Z]{3}.*\\d{3}","[A-Z]{3}.*?\\d{3}" }; StringBuffer targetString = new StringBuffer(); targetString.append("1. ABS 041 2. SNIS--556 3. MXBD---197 4. MGD692 5. SNIS----5567 6. ASW-132"); System.out.println("目标字符串:\t" + targetString); for (String p : ps) { System.out.println(); Pattern pattern = Pattern.compile(p); Matcher matcher = pattern.matcher(targetString); System.out.println("匹配模式:\t" + p); boolean found = false; while (matcher.find()) { System.out.format("找到匹配的字符串:" + " \"%s\" 开始位置是 " + "index %d 结束位置是 index %d.%n", matcher.group(), matcher.start(), matcher.end()); found = true; } if (!found) System.out.println("没有找到匹配的字符串"); } } }
步骤 8 :

练习-重复匹配

edit  姿势不对,事倍功半! 点击查看做练习的正确姿势
借助正则表达式,统计这段html一共有多少个超链

<a href="http://sina.com.cn">sina.com.cn</a>
<a href="http://sina.com.cn">sina.com.cn</a>
<a href="http://sina.com.cn">sina.com.cn</a>
<a href="http://sina.com.cn">sina.com.cn</a>
<a href="http://sina.com.cn">sina.com.cn</a>


HOW2J公众号,关注后实时获知最新的教程和优惠活动,谢谢。


提问之前请登陆
提问已经提交成功,正在审核。 请于 我的提问 处查看提问记录,谢谢
关于 Temp-正则表达式-重复匹配 的提问

尽量提供截图代码异常信息,有助于分析和解决问题。 也可进本站QQ群交流: 578362961
提问尽量提供完整的代码,环境描述,越是有利于问题的重现,您的问题越能更快得到解答。
对教程中代码有疑问,请提供是哪个步骤,哪一行有疑问,这样便于快速定位问题,提高问题得到解答的速度
在已经存在的几千个提问里,有相当大的比例,是因为使用了和站长不同版本的开发环境导致的,比如 jdk, eclpise, idea, mysql,tomcat 等等软件的版本不一致。
请使用和站长一样的版本,可以节约自己大量的学习时间。 站长把教学中用的软件版本整理了,都统一放在了这里, 方便大家下载: https://how2j.cn/k/helloworld/helloworld-version/1718.html

上传截图