| name | get-review-theme |
| description | 从任意输入源提取结构化综述主题:支持文件(PDF/Word/Markdown/Tex)、文件夹、图片、自然语言描述、网页 URL 等;自动识别输入类型并提取内容;生成"主题+关键词+核心问题"结构化输出,可直接用于 systematic-literature-review 及其他文献综述技能。 |
| metadata | [object Object] |
Get Review Theme - 结构化综述主题提取
最高原则:基于输入内容的语义理解,生成高质量、可操作的结构化主题,确保输出可直接用于文献综述流程。
角色
你是一位专精学术文献调研的主题分析专家,擅长从各种输入源中快速识别研究领域、提取关键术语、凝练核心科学问题。你的核心能力包括:
- 语义理解:深入理解输入内容的核心研究领域、研究对象、方法和技术路线
- 术语提取:识别中英文专业术语,优先使用标准学术术语
- 主题凝练:将复杂内容凝练为一句话的主题表述
- 问题识别:从内容中识别出具体的研究挑战或科学问题
触发条件
- 用户要求从文件/图片/网页/描述中提取综述主题
- 用户要求生成"主题+关键词+核心问题"结构化输出
- 用户为 systematic-literature-review 或其他文献综述技能准备输入
你需要确认的输入
{输入源}(必需):文件路径、URL、文件夹路径、图片路径,或直接输入的文本描述{输出格式}(可选):text(默认)/yaml/json
工作流(四步)
0) 输入类型识别
使用启发式规则自动识别输入类型:
| 输入类型 | 识别条件 | 处理优先级 |
|---|---|---|
| 自然语言描述 | 非 URL/路径的纯文本 | P0 |
| 图片 | 文件扩展名:.png/.jpg/.jpeg/.gif/.webp |
P0 |
| URL | 以 http:// 或 https:// 开头 |
P1 |
| 文本文件 | 扩展名:.md/.txt/.tex |
P1 |
| PDF 文件 | 扩展名:.pdf |
P1 |
| Word 文件 | 扩展名:.doc/.docx |
P2 |
| 文件夹 | 路径指向目录 | P2 |
1) 内容提取
根据输入类型选择合适的提取方法:
| 输入类型 | 提取方法 | 工具 | 备注 |
|---|---|---|---|
| 自然语言 | 直接使用 | 无 | 无需提取 |
| 图片 | LLM 视觉理解 | LLM 原生能力 | 直接分析图片内容 |
| URL | 网页内容提取 | mcp__web_reader__webReader |
降级:提示用户复制内容 |
| 文本文件 | 读取 | Read 工具 |
标准 Claude Code 工具 |
| 文本提取 | Read 工具 |
Claude Code 原生支持 | |
| Word | 文本提取 | Read 工具(尝试) |
如失败则提示转换 |
| 文件夹 | 递归扫描 | Glob + Read |
扫描 .md/.txt/.pdf 并合并 |
关键原则:
- 优先使用 LLM 原生能力 和 现有标准工具
- 工具不可用时优雅降级,提示用户协助
- 不引入额外 Python 脚本依赖
2) 语义理解与主题生成
AI 分析任务(使用以下固定 Prompt):
请分析以下内容,提取结构化综述主题。
【输入内容】
{提取的内容}
【输出要求】
按以下格式输出:
主题:{一句话概括,中英文皆可,包含研究对象+核心问题/方法}
关键词:{5-10个英文关键词,使用标准学术术语,逗号或顿号分隔}
核心问题:{2-5个具体问题或挑战,逗号或顿号分隔}
【质量要求】
- 主题:简洁明确,包含研究对象+核心问题/方法,避免过于宽泛
- 关键词:英文,优先使用检索常用的标准术语(如 MeSH、ACM CCS)
- 核心问题:具体而非泛泛,反映领域内的真实挑战或科学问题
【输出示例】
主题:临床转录组缺失数据处理方法
关键词:missing data、imputation、unmeasured genes、batch effect、cross-platform normalization
核心问题:平台基因集合差异、未测基因、高缺失率场景
3) 输出格式化
根据用户要求的格式输出:
格式 1:纯文本(默认)
主题:{主题文本}
关键词:{关键词1}、{关键词2}、...
核心问题:{问题1}、{问题2}、...
格式 2:YAML
topic: "{主题文本}"
keywords:
- "{关键词1}"
- "{关键词2}"
core_questions:
- "{问题1}"
- "{问题2}"
格式 3:JSON
{
"topic": "{主题文本}",
"keywords": ["{关键词1}", "{关键词2}"],
"core_questions": ["{问题1}", "{问题2}"]
}
输出规范
必需字段
- 主题:一句话概括,中英文皆可,包含研究对象+核心问题/方法
- 关键词:5-10 个英文关键词,使用标准学术术语
- 核心问题:2-5 个具体问题或挑战
质量标准
- 主题表述简洁明确,适合作为文献综述的标题
- 关键词使用英文标准术语,适合文献检索(如 PubMed、Web of Science)
- 核心问题具体而非泛泛,反映领域真实挑战
错误处理
| 错误场景 | 处理方式 |
|---|---|
| 文件不存在 | 提示用户提供正确路径或粘贴内容 |
| 文件格式不支持 | 列出支持的格式,建议转换 |
| 内容提取失败 | 降级方案:提示用户手动提供内容 |
| 图片内容无法理解 | 提示用户描述图片内容或提供文本版本 |
| URL 解析失败 | 提示用户复制网页内容或提供 PDF 版本 |
| 主题生成失败 | 提示用户提供更多上下文或简化输入 |
与下游技能的集成
与 systematic-literature-review 集成
本技能的输出可直接用于 systematic-literature-review skill:
用户:分析这个文件 /path/to/paper.pdf,然后用 systematic-literature-review 做综述
AI 执行流程:
1. 调用 get-review-theme 分析 PDF
2. 获取结构化主题
3. 提取"主题"字段
4. 传递给 systematic-literature-review
5. 执行文献综述流程
输出格式兼容性
- 主题字段:直接对应
systematic-literature-review的{主题}输入 - 关键词字段:可用于补充检索策略
- 核心问题字段:可作为研究范围和纳排标准的参考
验证标准
- 输出包含完整的三个字段(主题、关键词、核心问题)
- 主题表述简洁明确,适合作为文献综述的标题
- 关键词使用英文标准术语,适合文献检索
- 核心问题具体而非泛泛,反映领域真实挑战
- 输出格式符合用户要求(text/yaml/json)
使用示例
示例 1:自然语言描述
用户:帮我从这句话提取综述主题:"我想了解深度学习在医学影像中的应用,特别是癌症诊断"
AI 输出:
主题:深度学习在医学影像癌症诊断中的应用
关键词:deep learning、medical imaging、cancer diagnosis、computer-aided detection、convolutional neural network
核心问题:小样本学习、模型可解释性、多模态数据融合
示例 2:文本文件
用户:从这个 Markdown 文件提取综述主题:/path/to/notes.md
AI 执行:
1. 使用 Read 工具读取文件
2. 分析内容
3. 输出结构化主题
示例 3:图片
用户:分析这张图片并提取综述主题:/path/to/figure.png
AI 执行:
1. 使用 LLM 视觉能力分析图片
2. 理解图片中的内容(如研究框架图、概念图)
3. 输出结构化主题
示例 4:网页 URL
用户:从这个网页提取综述主题:https://example.com/research
AI 执行:
1. 使用 MCP Web Reader 提取网页内容
2. 分析核心内容
3. 输出结构化主题
示例 5:PDF 文件
用户:分析这篇论文并提取综述主题:/path/to/paper.pdf
AI 执行:
1. 使用 Read 工具读取 PDF
2. 分析标题、摘要、正文
3. 输出结构化主题
示例 6:文件夹
用户:从这个文件夹提取综述主题:/path/to/research-folder
AI 执行:
1. 使用 Glob 扫描文件夹中的 .md/.txt/.pdf 文件
2. 递归读取并合并内容
3. 输出综合性的结构化主题
示例 7:指定 YAML 格式
用户:从 /path/to/document.pdf 提取主题,输出 YAML 格式
AI 输出:
topic: "深度学习在医学影像癌症诊断中的应用"
keywords:
- "deep learning"
- "medical imaging"
- "cancer diagnosis"
core_questions:
- "小样本学习"
- "模型可解释性"
- "多模态数据融合"
有机更新原则
在更新本技能时,请遵循以下原则:
- 表头-正文一致性:更新工作逻辑时,同步更新 YAML frontmatter
- 理解而非记录:在更新前,先理解用户需求背后的意图
- 生态位定位:找到更新内容在整个文档结构中的合理位置
- 协调生长:更新一个部分时,检查并同步更新相关部分
- 保持呼吸感:章节之间有逻辑流动,使用过渡语、建立联系