| name | aicup-aortic-valve-workflow |
| description | 規劃並執行 AICUP 2025 主動脈瓣物件偵測競賽的完整工作流程,包含資料理解、前處理、模型訓練、評估與提交檔產生。 當使用者提到 AICUP 2025、主動脈瓣、aortic valve、object detection、bounding box、比賽規則或 leaderboard 時使用這個 Skill。 |
| allowed-tools | Read, Write, Execute, Glob, Grep |
AICUP 2025 主動脈瓣物件偵測 Workflow Skill
這個 Skill 用來協助你在 AICUP 2025 主動脈瓣物件偵測競賽中,穩定且有系統地提升成績。
使用情境(When to use)
- 使用者提到:
- 「AICUP 2025 主動脈瓣物件偵測」
- 主動脈瓣 / aortic valve 的偵測 / bounding box 標註
- 比賽規則、評分方式、submission 格式
- 需要規劃實驗或優化 leaderboard 分數
- 使用者把官方簡報 PDF 或規則檔放在
docs/下,並請你幫忙分析。
當這些條件出現時,請啟用本 Skill,並依照以下流程行動。
整體流程
1. 確認專案與資料結構
- 使用
Glob與Read工具,搜尋並列出:docs/下所有與 AICUP 相關 PDF / PPTXdata/下的資料夾結構(train / val / test / annotations 等)baseline/或src/下的程式碼與設定檔
- 將目前狀態整理成簡短摘要回報給使用者,包含:
- 是否已有 baseline
- 是否已有任意訓練 / inference script
- 是否有現成的 submission 範例
2. 深入理解比賽規則與評分指標
- 若安裝了 PDF 相關 Skill 或 MCP(例如 docling、document-skills/pdf),請:
- 用這些工具讀取
docs/下的競賽簡報與規則 PDF。 - 把以下資訊整理成有條列的 checklist:
- 評分指標(例如 mAP / IoU / F1 等)
- 是否區分 public / private leaderboard
- submission 檔案欄位與命名規則
- 資料使用限制(external data / pretrain model)
- 重要 deadline 或額外加分項目
- 用這些工具讀取
- 在回答中主動提醒使用者:「任何實作都必須符合這份 checklist」。
3. 建立實驗框架與目錄結構
請協助使用者建立一個清楚的實驗目錄,例如:
experiments/exp_YYYYMMDD_baseline_yolo/exp_YYYYMMDD_aug_mixup/exp_YYYYMMDD_ensemble/
對每個實驗:
- 產生一份設定檔(YAML / JSON / Python module):
- 資料路徑 / 影像尺寸 / augmentation
- 模型架構與 backbone
- Optimizer / scheduler / batch size / epoch 數
- 評估指標與 early stopping 條件
- 規劃訓練與推論指令:
train.py:負責 training / validationinference.py:產生 submission 所需格式的輸出
- 使用
Write工具,把這些腳本與設定實際寫入src/或experiments/下。
4. 建立 baseline 並確認可重現性
- 先根據官方或你自擬的 baseline 完成:
- 完整訓練流程(即便是較小 epoch)
- 完整推論與 submission 產生
- 要求自己(或使用者)實際執行一次:
- 若出現錯誤,協助 debug 並修正腳本
- 確保只要跑同一套指令,就可以得到一致的結果
- 把 baseline 成績(public leaderboard / local metric)記錄在:
experiments/exp_xxx/metrics.json- 或
results/experiments_overview.xlsx(可藉由 xlsx skill 協助)
5. 系統性調參與改進策略
當 baseline 已穩定可重現後,依照下列順序逐步優化:
- 資料前處理與 augmentation
- 分析影像解析度、主動脈瓣的大小分佈。
- 設計合理的 resize / crop / padding 策略。
- 加入適度的 augmentation(flip / rotate / color jitter 等),避免過度破壞醫學影像特徵。
- 模型架構
- 比較不同 backbone / detection head(例如 YOLO 系列 / Faster R-CNN / RetinaNet 等)。
- 若計算資源許可,可嘗試 ensemble。
- Loss 與訓練策略
- 調整 IoU / CIoU / GIoU 等 loss 組合。
- 使用 warmup / cosine scheduler / EMA 等技巧。
- 推論與後處理
- 調整 NMS 閾值、score threshold。
- 探索 multi-scale inference 或 TTA。
在每一步:
- 只變動少數關鍵超參數,避免一次改太多導致無法歸因。
- 將每次變更清楚記錄在實驗設定與結果檔中。
6. Submission 檔案產生與驗證
- 根據規則整理出 submission 所需:
- 欄位名稱(例如 image_id / x_min / y_min / x_max / y_max / score)
- 檔名與壓縮格式(例如
submission.csv/submission.zip)
- 建立一個
make_submission.py(或類似)腳本,負責:- 從 model output 讀取結果
- 轉換成官方指定的格式
- 自動檢查常見錯誤(空欄位 / NaN / 重複 ID 等)
- 在本地進行一次「dry run」:
- 產生 submission 檔,並請使用者實際上傳到比賽平台確認可被接受。
7. 報告與簡報準備
- 若安裝了
document-skills/pptx與theme-factory等 Skill:- 協助產生比賽報告簡報,包括:
- 問題定義與資料介紹
- 模型架構與實驗設計
- 結果與 ablation study
- 未來工作與可能改善方向
- 協助產生比賽報告簡報,包括:
- 確保簡報內容不包含任何個資或醫療建議,純粹聚焦在技術層面。
實作細節指引
- 儘量產生 可直接執行的程式碼與腳本,而不是只給高階 pseudo-code。
- 當需要安裝第三方套件時:
- 建議編輯或產生
requirements.txt/environment.yml。
- 建議編輯或產生
- 若使用者希望把流程部分自動化(例如批次嘗試多組 hyperparameters):
- 可以協助撰寫簡單的 experiment runner(Python script 或 Makefile)。
安全與限制
- 不要嘗試解釋或推測任何病人的臨床狀態。
- 不要輸出與醫療診斷相關的結論。
- 所有建議都應明確標示是「為了比賽任務」而設計的技術方案。