通过正则表达式提取内容
如何使用正则表达式过滤出特定内容?
要过滤出特定内容,可以使用包含该内容的正则表达式。例如,要过滤出包含特定前缀和后缀的文本,可以编写如下正则表达式:
reg = "prefix.*?suffix"
此正则表达式将匹配以 “prefix” 开头并以 “suffix” 结尾的任何文本。
测试代码
下面是一个用于测试正则表达式的 Java 代码示例:
string html = "<a>www.baidu.com</a><a>www.qq.com</a><a>www.aaa.cn</a>www.eee.cn"; string reg = "www.*?(com|cn)"; matcher matcher = pattern.compile(reg, pattern.case_insensitive).matcher(html); while (matcher.find()) { system.out.println(matcher.group()); }
匹配输出结果
运行此代码将输出如下结果:
www.baidu.com www.qq.com www.aaa.cn www.eee.cn