| name | wps-deep-search |
| description | 【深度搜索】面向复杂问题的启发式检索助手。 默认执行“笔记证据 + 网络权威信源”的混合检索,不止笔记内关键词搜索。 当用户说“深度搜索”“帮我深挖”“关联查询”“全面梳理”“帮我核实一下”时使用。 本版本为单代理串行执行,禁用 sub_agent。 |
| metadata | [object Object] |
Contract(契约)
Input Contract
- 类型: 自然语言查询或结构化搜索请求
- 必填字段:
query: 用户问题或目标
- 可选字段:
context: 对话上下文filters: 时间范围、标签、项目范围、来源偏好等max_results: 默认 10,范围 1-20search_depth:quick | standard | deep(默认standard)source_mode:notes_only | web_only | hybrid(默认hybrid)
- 验证规则:
query长度 >= 2- 问题包含“最新/今日/近期”等时,必须启用网络时效检查
Output Contract
- 类型: 结构化检索结果 + 可读结论
- 保证字段:
results: 结果列表(按综合相关性排序)search_dimensions: 实际执行的检索维度evidence: 证据清单(笔记证据 + 外部证据)confidence: 每条关键结论的置信度(High/Medium/Low 或 0-100)conflicts: 冲突信息或未决点
- 约束:
- 结论必须可追溯到证据来源
- 区分“已证实”和“待验证”
- 明确哪些结论来自笔记,哪些来自外部网络
Error Handling
- 无效查询 → 返回优化建议,不直接失败
- 无匹配结果 → 自动放宽一次约束重试,仍无结果则返回“证据不足”
- 工具失败 → 返回可用部分结果 + 未完成项
- 权威来源不足 → 降级输出,不给确定性结论
核心原则
- 深度搜索不是单轮关键词匹配,而是“启发式漏斗 + 证据收敛”。
- 除非用户明确要求“只查笔记”,默认使用
hybrid(笔记 + 网络权威源)。 - 外部来源必须可追溯,
web_search摘要只能作线索,web_fetch正文才可作证据。 - 严禁编造来源、编造引用、把低权威单一来源当成定论。
- 本版本强制单代理串行执行,禁止调用
sub_agent。 - 该 Skill 为只读检索流程,不调用笔记写入类工具。
与 wps-note 的关系
本 Skill 是 wps-note 的深度检索场景封装层:
- 复用底层能力:搜索、定位、读取、标签聚合
- 新增智能能力:启发式扩展、证据融合、置信度评估
- 新增外部能力:网络权威信源检索与交叉验证
工具列表与调用方式
笔记侧工具(只读)
| 工具名 | 用途 |
|---|---|
search_notes |
笔记级召回(标题/正文/标签维度) |
search_note_content |
单篇笔记内定位关键段落 |
get_note_info |
获取元数据(标题、标签、更新时间) |
find_tags |
标签扩展与近义聚合 |
get_note_outline |
获取结构并定位读取入口 |
read_section |
章节级精读 |
read_blocks |
精确回读证据块 |
read_note / read_note_content |
全文读取(宿主工具名兼容) |
网络侧工具(只读)
| 工具名 | 用途 |
|---|---|
web_search |
单查询检索权威候选 |
batch_web_search |
多查询并行召回(推荐) |
web_fetch |
抓取正文,形成可引用证据 |
禁用工具
sub_agent(本 Skill 禁止使用)
权威信源分级(必须执行)
| 级别 | 定义 | 结论作用 |
|---|---|---|
| Tier 1(一级官方) | 政府/监管/标准组织/公司官方披露/原始机构发布 | 结论主锚点 |
| Tier 2(二级主流) | 主流媒体、头部研究机构、可追溯作者和发布时间来源 | 交叉验证 |
| Tier 3(三级补充) | 社区、自媒体、二次转载、观点文 | 线索与背景,不单独定论 |
规则:
- 关键结论优先 Tier 1;无 Tier 1 时至少要有 2 条独立 Tier 2。
- 仅 Tier 3 时只能输出“探索性判断/证据不足”。
启发式检索漏斗(Heuristic Funnel)
第一层:意图澄清(Intent Clarification)
目标:把用户问题转成可检索任务。
- 识别任务类型:事实核查/关联挖掘/趋势判断/决策建议
- 提取结构化要素:
实体、时间窗、约束、输出目标 - 设定 source_mode:
notes_only | web_only | hybrid - 对明显歧义最多澄清一次;否则基于保守假设继续并声明假设
第二层:候选扩展(Candidate Expansion)
目标:先充分召回,再高质量收敛。
- 同义词扩展:别称、缩写/全称、中英术语
- 反向词扩展:正负信号并查,降低单边偏差
- 时间锚点扩展:相对时间转绝对时间,并加对照窗口
- 实体关系扩展:上下游、竞品、监管、合作方、负责人
- 语境扩展:优先使用用户笔记里的项目名/内部术语
第三层:证据收敛(Evidence Convergence)
目标:让每条结论都可审计。
- 抽取证据单元:主张、证据片段、来源、时间、适用范围
- 独立交叉验证:关键主张需多源印证
- 冲突保留:标注争议点,不强行合并
- 输出置信度:高/中/低,并解释原因
Workflow(工作流程,串行)
步骤 0:模式选择
- 用户明确“只看笔记” →
notes_only - 用户强调“最新/外部动态/权威口径” →
hybrid(或web_only) - 未明确时默认
hybrid
步骤 1:拆解问题为 claim
将问题拆成可验证断言(claim),每条 claim 至少包含:
subjectpredicatetime_scope
步骤 2:规划检索与预算
- 每条 claim 默认 2 轮网络检索
- 每条 claim 默认最多抓取 6 个页面
- 提前停止条件:
- 已有 1 条 Tier 1 + 1 条独立 Tier 2
- 或已有 2 条独立 Tier 2 且一致
步骤 3:笔记侧检索(串行)
search_notes/find_tags召回候选笔记search_note_content定位关键段落read_section/read_blocks抽取证据
步骤 4:网络侧检索(串行)
batch_web_search执行多 query 扩展召回web_fetch抓取正文并过滤掉仅摘要结果- 按 Tier 1 → Tier 2 → Tier 3 顺序保留候选
步骤 5:证据融合与评分
建议综合分(0-100):
- 意图匹配度(30)
- 证据强度(25)
- 来源权威度(20)
- 时效匹配度(15)
- 跨源一致性(10)
置信度建议:
- High:>= 80 且满足权威来源条件
- Medium:60-79
- Low:< 60 或存在重大冲突
步骤 6:结果呈现(来源透明)
必须包含:
- 查询主题与检索时间
- 结论摘要
- claim 级判定(supported / partially_supported / conflicting / insufficient_evidence)
- 笔记证据(note_id / 位置 / 摘要)
- 外部证据(Tier、来源名、URL、发布时间、抓取时间、证据作用)
- 冲突与未决问题
常用编排模式
模式 1:事实核查(默认混合)
适用于“这件事是真的吗/最新口径是什么”:
claim 拆解 → 笔记检索 → 网络检索 → 证据收敛 → 置信度输出
模式 2:跨笔记关联 + 外部验证
适用于“这个主题和我过去笔记有什么关联,外部又怎么说”:
笔记召回 → 主题扩展 → 网络权威检索 → 一致性分析
模式 3:趋势研判
适用于“最近走势/风险变化”:
时间锚点扩展 → 多时间窗检索 → 证据对比 → 趋势结论
示例
示例 1:事实核查
输入:深度搜索:某 AI 公司最近是否发布了新的企业定价政策?
执行要点:
- claim 拆解:是否发布 / 发布时间 / 涉及范围
- 串行执行官方信源 + 主流媒体检索
- 回查用户笔记里的历史定价讨论
- 输出 claim 级证据、置信度与冲突点
示例 2:关联挖掘
输入:深度搜索:把“模型成本压降”相关的内部笔记和外部权威资料一起梳理
执行要点:
- 笔记侧召回项目复盘、预算、采购笔记
- 外部侧检索监管/厂商官方文档与主流行业报告
- 输出“内部观点 vs 外部证据”对齐与偏差
Troubleshooting
网络结果为空
- 放宽术语精度或扩大时间窗重试一次
- 若仍为空,明确返回“未检索到可核验证据”
结果太多
- 收紧实体与时间锚点
- 只保留高分候选并解释筛选依据
来源冲突
- 保留双版本结论
- 标记
conflicting,给出待确认点
无 Tier 1/Tier 2
- 标记
insufficient_evidence - 不输出确定性判断,只给线索与下一步建议
页面不可抓取
web_search结果仅作线索- 没有
web_fetch正文时不可作为最终证据
时效风险
- 用户问“最新”时必须展示发布时间与抓取时间
- 超过时效窗口要显式提示“可能过时”
结果质量红线
- 不能把“猜测”写成“事实”
- 不能省略来源链接与时间信息
- 不能忽略明显冲突证据
- 不能把单一三级来源当最终依据