如何使用正则表达式准确解析HTML文本中的a标签href地址?

如何使用正则表达式准确解析HTML文本中的a标签href地址?

js如何使用正则表达式解析html文本

问题:

想要使用正则表达式解析html文本,并获取其中每个a标签href地址,应该如何书写正则表达式

尝试:

const r1 = s.match(/活动开展情况[sS]*/g)[0] const r2 = r1.match(/(?<p><strong>错误:</strong></p><p><span>立即学习</span>“<a href="https://pan.quark.cn/s/cb6835dc7db1" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">前端免费学习笔记(深入)</a>”;</p><p>上述代码会匹配到不想要的#、JavaScript:void(0)等内容,无法准确获取想要的结果。</p><p><strong>解决方案:</strong></p><p>由于自己写正则容易误配,建议使用html解析器来进行解析,更加安全稳妥。例如,可以使用jquery中的$(html).find('&gt;li&gt;a')来查找所有a标签,然后使用map方法获取它们的href地址:</p><p><strong>使用jquery:</strong></p><pre class="brush:php;toolbar:false">$(html).find('&gt;li&gt;a').map((_, a) =&gt; $(a).attr('href'))
登录后复制

使用es6

[...$(html).find('&gt;li&gt;a')].map(a =&gt; $(a).attr('href'))
登录后复制

输出:

[     "/eduadmin/SpecialInfo/SpecialInfo?AreAID=533167224&amp;AreaType=1&amp;SpecialCode=3",     "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&amp;AreaType=1&amp;SpecialCode=4",     "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&amp;AreaType=1&amp;SpecialCode=6",     "/eduadmin/SpecialInfo/SpecialInfo?AreaID=533167224&amp;AreaType=1&amp;SpecialCode=9",     "/eduadmin/DevelopActivity/SystemActivityManage/2/-1" ]
登录后复制

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容