微信客服微信客服

采集器规则说明

阅读:1.53万 评论:0 点赞:1 2020-05-17

规则分隔方式,每行一个采集规则

程序会从第一条向下依次执行

一条规则包含操作符、正则表达式、和参数,有的操作符不需要参数,他们之前用@分隔


操作符说明

match

获取内容

match@正则表达式


replace

替换内容

replace@正则表达式@替换的内容


join

链接字符串

join@前面的字符串@后面的字符串


matchall

获取所有匹配的内容,内容之前用逗号分隔,一般用于获取列表页面的所有链接,或内容页中的图片

matchall@正则表达式


gettab

获取一个标签及内容

gettab@标签

例子

内容

<p>
<h1 class="title">123</h1>
</p>

gettab@<h1 class="title">

获取到的是

<h1 class="title">123</h1>
用户评论(0)
无有评论,您来说说!
本系统由七台河市广盛网络科技有限公司开发 专业地方同城分类信息源码。
Copyright © 2008-2022 框分类信息系统 版权所有
ICP证:黑ICP备19004589号 黑公网安备 23090402000014号
加盟我们 - 关于我们 - 联系我们 - 版权声明 - 手机号所在地查询、IP所在地查询

电话:13136793879 Q Q :251443403
周一至周五(早8:00 - 晚6:00)
2000人站长群:176381403
VIP群:196313294