二次封装的html解析

源码信息 :

发布:2021-11-21 18:10:49  阅读:372

转载本源码必须注明出处,欢迎加入官群【445790831】

上传用户 :

源码归属:不吃鱼的喵

源码状态 :

资源状态:免费下载

源码好评 :

源码下载 :


开源作者:【不吃鱼的喵】

个性签名:增强知识,努力学习

源码已修改   火山注释和列程并不详细  白费不少功夫

添加规则路径方面参考备注里的java用法  

 

Generic placeholder image
利快云编程教育平台 Time: 2021-11-21 19:58:58

感谢分享 必须点赞

Generic placeholder image
不吃鱼的喵 Time: 2021-11-24 17:28:08

看来白封装了搜了下 Java查询元素的用法 

描述测试的HTML代码select写法

结果

通过 标签名 查找

<span>33</span>
<span>25</span>
Elements elements = doc.select("span");
注 :通过标签来查找,直接写 "标签名" 就好, 不需要尖括号
33
25

通过 id 查找

<span id="mySpan">36</span>
<span>20</span>
Elements elements = doc.select("#mySpan");

注 :通过id来查找,用 #


通过 class查找

<span class="myClass">36</span>
<span>20</span>
Elements elements = doc.select(".myClass");

注 :通过class来查找,用 .


通过 属性名 查找

<span class="class1" id="id1">36</span>
<span class="class2" id="id2">36</span>
Elements elements = doc.select("span[class=class1]span[id=id1]");

注 :查询规则为 标签名[属性名=属性值],

标签名可写可不写,多个属性即多个[],如上


通过 属性名前缀  查找

<span class="class1">36</span>
<span class="class2">22</span>
Elements elements = doc.select("span[^cl]");

注 :查询规则为 标签名[^属性名前缀] ,

标签名可写可不写, 多个属性即多个[]

36
22

通过 属性名+正则表达式 查找

<span class="ABC">36</span>
<span class="ADE">22</span>
Elements elements = doc.select("span[class~=^AB]");

注 :查询规则为 标签名[属性名~=正则表达式],

标签名可写可不写,多个属性即多个[]


通过 文本内容 查找

<span>36</span>
<span>22</span>
Elements elements = doc.select("span:contains(3)");
 注 :查询规则为 标签名:contains(文本值)

通过 文本内容+正则表达式 查找

<span>36</span>
<span>22</span>
Elements elements = doc.select("span:matchesOwn(^3)");

注 :查询规则为  标签名:matchesOwn(正则表达式)



PS:



二次封装的html解析