在编写 php 中用于过滤 html 的函数时,需要从 html 标签中提取特定的属性,如 style、class、href、target 和 alt。为了实现这一目标,我们可以使用正则表达式来查找匹配的标签并只保留所需的属性。
此前,您提供的代码使用了正则表达式来匹配属性,但并未能够正确提取所需的属性。以下是修改后的正则表达式代码:
$re = '/onw+=(['"]).*?/m';
这个正则表达式匹配所有以 “on” 开头的属性,并提取其属性值,将其保存在捕获组中。
接下来,利用 preg_replace() 函数替换匹配项:
立即学习“PHP免费学习笔记(深入)”;
$subst = ''; $result = preg_replace($re, $subst, $str);
将匹配的属性值替换为空字符串,从而只保留所需的属性。
应用修改后的代码后,输出结果如下:
<strong class="123" style="white-space: normal;"> </strong><div class="ccc">aaaaa</div> <p style="white-space: normal;">bbbbb</p> <strong class="123" style="white-space: normal;">12313123 </strong> <strong>eeeeee </strong><a href="http://www.xxx.com" target="_blank" class="aaaa">链接链接</a><p>ffff</p>
正如你所见,不需要的属性(如 onload)已被删除,只保留了所需的属性。