在处理 html 标签时,提取特定的属性至关重要。本问答将指导您使用正则表达式从 html 标签中捕获常用的属性值。
正则表达式方案:
$re = '/onw+=(['"]).*?/m';
解释:
立即学习“前端免费学习笔记(深入)”;
- bonw =([‘”]).*?1:匹配属性名称和值,其中值用单引号或双引号引起来。
- m:多行匹配选项,确保跨越多行匹配属性。
替换策略:
$subst = '';
对于每个匹配,我们将其替换为空字符串,从而仅保留属性名称。
使用示例:
$str = '<strong style="white-space: normal;" class="123" onload="asdasdas()">12313123 </strong><div class="ccc">aaaaa</div> <p style="white-space: normal;">bbbbb</p> <strong class="123" style="white-space: normal;" onload="asdasdas()">12313123 </strong> <strong onload='asdasdas()'?>eeeeee </strong><a href="http://www.xxx.com" target="_blank" class="aaaa">链接链接</a><p>ffff</p>'; $result = preg_replace($re, $subst, $str); echo "替换的结果是 " . $result;
结果:
替换的结果是 <strong class="123">12313123 </strong><div class="ccc">aaaaa</div> <p style="white-space: normal;">bbbbb</p> <strong class="123">12313123 </strong> <strong >eeeeee </strong><a class="aaaa">链接链接</a><p>ffff</p>
如您所见,此解决方案有效地从 html 标签中提取了您指定的属性(style、class、href、target、alt),而无需其他不需要的部分(例如事件处理程序)。