Hello! 欢迎来到小浪资源网!


如何用正则表达式高效提取HTML标签属性?


如何用正则表达式高效提取HTML标签属性?

提取 html 标签属性:正则表达式的巧妙应用

在处理 html 标签时,提取特定的属性至关重要。本问答将指导您使用正则表达式从 html 标签中捕获常用的属性值。

正则表达式方案:

$re = '/onw+=(['"]).*?/m';

解释:

立即学习前端免费学习笔记(深入)”;

  • bonw =([‘”]).*?1:匹配属性名称和值,其中值用单引号或双引号引起来。
  • m:多行匹配选项,确保跨越多行匹配属性。

替换策略:

$subst = '';

对于每个匹配,我们将其替换为空字符串,从而仅保留属性名称。

使用示例:

$str = '<strong style="white-space: normal;" class="123" onload="asdasdas()">12313123&nbsp</strong><div class="ccc">aaaaa</div> <p style="white-space: normal;">bbbbb</p> <strong class="123" style="white-space: normal;" onload="asdasdas()">12313123&nbsp</strong> <strong onload='asdasdas()'?>eeeeee&nbsp</strong><a href="http://www.xxx.com" target="_blank" class="aaaa">链接链接</a><p>ffff</p>';  $result = preg_replace($re, $subst, $str);  echo "替换的结果是 " . $result;

结果:

替换的结果是 <strong class="123">12313123&nbsp</strong><div class="ccc">aaaaa</div> <p style="white-space: normal;">bbbbb</p> <strong class="123">12313123&nbsp</strong> <strong >eeeeee&nbsp</strong><a class="aaaa">链接链接</a><p>ffff</p>

如您所见,此解决方案有效地从 html 标签中提取了您指定的属性(style、class、href、target、alt),而无需其他不需要的部分(例如事件处理程序)。

相关阅读