Appearance
网址/图片地址获取
🚩【组件功能】:根据配置获取源HTML代码中a标签、img标签内的链接或图片地址
配置预览
配置说明
源HTML文本 支持T或# 默认FLOW输入项
提取处理的对象,若为空,以上一个组件的输出做为源HTML文本,支持文本或表达式输入。
提取方式
支持“自动识别、通配符参数组合、正则匹配”3种提取方式。
提取规则 支持T或#
使用[参数]
代表最终所需的指定结果字符串,用指定结果字符串的前后字符来定位参数。若前后字符串中包含可能变化的字符串,使用通配符[*]替代。
拼接地址 支持T或#
[参数1]
[参数2]
[参数N]
等参数中对应的值是按照提取规则
中的[参数]的位置顺序来匹配。
匹配正则 支持T或#
使用正则表达式匹配最终所需的指定结果字符串,匹配的内容用分组模式匹配,以便对匹配结果进行分组组合。
组合结果 支持T或#
用$1、$2、$N
替代正则分组来组合匹配结果。
网址补全
支持“不补全、相对网址补全、base href补全”3种方式。
当前源码URL 支持T或#
填写源HTML文本所属页面URL,用于分析自动补全网址所需的网址前缀。
base href地址 支持T或#
填写base href地址。
忽略大小写
在执行提取方式时,通过此项确定是否忽略大小写。
输入输出
输入类型
字符串(System.String)
输出类型
字符串列表(System.Collections.Generic.List<System.String>)
🏁 上一组件的输出类型如果也是字符串,则可以直接输入到本组件的流变量(FLOW,类型也为字符串),如果不是则不接收,在本组件内任何文本配置区域都可以使用T模式下的 ~flow 或#模式下的FLOW
格式直接调用该流变量,流变量FLOW在该组件内可能被修改,本组件完成功能处理后,将结果按布尔型(System.Boolean)输出到下一组件。
组件依赖
该组件无任何依赖,可以随意安装卸载,可以在流程内任何地方使用,可以理解为火语言的普通静态函数。
支持平台
~win-yes ~mac-yes ~linux-yes
更新历史及框架依赖
组件当前最新版本为 V1.0,暂无版本更新历史,暂无主程序框架依赖要求。
所在组件市场链接:网址/图片地址获取 V1.0
组件同时安装多版本操作提示
➡️ 一个组件存在功能升级及Bug完善后会发布成新更新的版本,比如V1.0
, V1.1
, V2.0
;
➡️ 如果在本地以前安装了旧的组件版本,发现了新的组件版本后,可以在线安装新的版本到本地,多个版本可以在本地共存;
➡️ 本地安装有当前组件多个版本时,新编辑的流程内拖拽该组件使用时,都会默认使用组件的最新版本;
➡️ 如果流程中已经保存使用了组件的比较旧版本:
默认不会对用户的应用流程内该组件进行任何操作,使用组件旧的版本及配置以保证原流程完整功能的正常使用;
用户可以在流程编辑时对存在更新的组件,自行选择确认是否升级切换到较高版本,当切换时,新的组件用户配置信息可能需要您做细节确认以保证功能适用;
例如:输出日志组件最新版为1.0.1,当前流程使用的版本为1.0.0,在组件名称后点击历史版本下拉列表,选中要更新的版本1.0.1。
然后弹出提示框,确定是否更新。
成功更新到指定版本后,组件历史版本较旧的版本列表将不再显示,如果更新的版本是该组件的最新版本,则版本选择框整体不再显示。
切换到新版本并进行规则保存后,不再提供组件的向下降级,提醒您在进行流程内组件版本的升级时,请确认应用流程规则已进行过保存备份。
➡️ 多段流程使用了组件的多个版本,运行时相互之间不会受到影响;
➡️ 在某些极端情况下,用户开发的相同组件的不同版本可能调用了外部动态链接库的不同版本而未做命名空间隔离,敬请尽量不要在单段流程内使用组件的不同版本。
示例
base href补全
描述
通过http请求组件获取https://www.huoyuyan.com/help/demo-pages/spider/demo.html
的源码html,自动识别网址并以base href补全,base href地址:https://www.huoyuyan.com/help/demo-pages/spider/demo.html
。
配置
输出结果
通配符参数组合
描述
通过http请求组件获取https://www.huoyuyan.com/help/demo-pages/spider/demo.html
的源码html,以“通配符参数组合”方式获取网址且不补全,提取规则:img src=".[参数]"
,拼接地址:[参数1]
配置
输出结果
因为未补全,所以获取的是源码中的地址