Hello! 欢迎来到小浪资源网!


PHP HTML过滤:如何高效移除HTML标签中不需要的属性?


PHP HTML过滤:如何高效移除HTML标签中不需要的属性?

在编写 php 中用于过滤 html 的函数时,需要从 html 标签中提取特定的属性,如 style、classhref、target 和 alt。为了实现这一目标,我们可以使用正则表达式来查找匹配的标签并只保留所需的属性。

此前,您提供的代码使用了正则表达式来匹配属性,但并未能够正确提取所需的属性。以下是修改后的正则表达式代码:

$re = '/onw+=(['"]).*?/m';

这个正则表达式匹配所有以 “on” 开头的属性,并提取其属性值,将其保存在捕获组中。

接下来,利用 preg_replace() 函数替换匹配项:

立即学习PHP免费学习笔记(深入)”;

$subst = '';  $result = preg_replace($re, $subst, $str);

将匹配的属性值替换为空字符串,从而只保留所需的属性。

应用修改后的代码后,输出结果如下:

<strong class="123" style="white-space: normal;">&nbsp</strong><div class="ccc">aaaaa</div> <p style="white-space: normal;">bbbbb</p> <strong class="123" style="white-space: normal;">12313123&nbsp</strong> <strong>eeeeee&nbsp</strong><a href="http://www.xxx.com" target="_blank" class="aaaa">链接链接</a><p>ffff</p>

正如你所见,不需要的属性(如 onload)已被删除,只保留了所需的属性。

相关阅读