老王 Agent 訓練計畫書

一句話：不是「直接捏一個像老王的 agent」，而是用足夠的語料「訓練」出一個像老王一樣分析台股的 agent。最完整的語料＝夏哥付費訂閱內容。資料不足不訓練（≥50 篇硬閘）。
紀律：圖不離機、付費內容只進私有 NLM、產出為老王方法之模擬、非投資建議。

一、專案定位

項目	內容
目標	訓練一個用老王（浦惠投顧王倚隆）方法分析台股的 agent：能力＋格式＋知識
路線	Agent 工程（skill + RAG + 自學迴路），非 fine-tune 模型（官方架構驗證不需要）
語料	主：PressPlay 付費每日報告／週晚報；輔：YT「老王不只三分鐘」、公開 FB 貼文
硬閘	累積 ≥50 篇語料才進訓練，避免資料不足就 generalize（反 D4）

二、六大目標 × 現況 × 缺口

#	目標	現況	還缺什麼
1	每天產一篇「洞悉全球財經掌握台股主流」文章，像老王	skill+方法庫雛形	文章級整篇模板、每日 cron、完整資料源（三大法人/族群強弱）、語料厚度
2	記錄/反省/追蹤分析過的族群與個股	個股時間線骨架(L1)	capture hook、5 欄 schema、L2 instinct+consolidate+verifier、族群級
3	給股票代號就分析＋調出過去分析資料	skill 讀時間線、cnyes 驗代號	RAG DB 資料量（要 backfill 才調得出）
4	不要我截圖，computer-use 每日截	已決：夏哥手動截圖	（改由夏哥截、agent 解讀入庫）
5	圖要進資料庫	本機 Vision OCR + NLM 方案就緒	持續 backfill、圖庫索引規範
6	對焦老王分析法（同/異）	抓到 COMMON＋部分 CONDITIONAL	per-股/per-族群 profile 結構化（＝L2 缺口，待語料校正）

三、老王分析法模型（待驗假設，Phase B 用語料校正）

COMMON 層（每檔都看）

均線體系：5 日(短線強弱)／10 日(波段)／月線(中線防守)／季線／20 週(大型權值)
量能：有量才有價、不怕爆量怕量縮、爆大量低點＝關鍵支撐
術語型態：四海遊龍(站回所有均線·多)↔三聲無奈(跌破3短均線·空)、三陽開泰(站上3短均線)、前高壓力、海闊天空(突破前高無壓)、窮多極少(跌破爆量低點·反轉)

CONDITIONAL 層（依股性不同，這層＝L2 instinct）

股性	老王主看	例
外資連動股	三大法人/外資連續買賣超	聯電2303、南亞科2408、至上8112
獲利爆發股	自結 EPS/年增率	華邦電2344、旺宏2337
國際連動股	看大作小、龍頭臉色	記憶體看美光 MU
大型權值股	20 週均線	台積電
分盤處置股	無法看量、改看均線	力積電6770

此表是 1 影片+截圖萃取的 v0 假設，Phase B 由 ≥50 篇語料重建/校正，非定論。

四、系統架構（四層＋兩子系統）

laowang plugin (CLI 版優先，不吃 SDK credit)
├─ 知識層：方法庫(vault SSoT) + 術語/均線/籌碼/紀律
├─ 能力層：laowang-analyst skill(單檔互動) + Dynamic Workflow(批量/建庫)
│     dynamic context injection !`cnyes 即時盤面`
├─ 格式層：老王輸出模板(大盤→美股→族群→逐檔→紀律, 先預告後印證)
└─ 防護層：hooks 強制 非投資建議 + 來源引用

子系統 B — RAG DB(NLM, 省 token)：所有語料 STT/檢索, notebooklm ask
子系統 C — 個股/族群時間線(連續追蹤)：每次分析 append, 下次先讀

五、自我學習設計（L1→L4，源自 self-improving agent 藍圖）

L1 Raw(時間線/transcript) ─萃取→ L2 Instinct(老王規則+confidence)
   情境→方法→結果→原因→建議        隨實績 decay/升, 跨股 promote
        ↑capture(便宜,每次)              ─聚類→ L3 Skill(方法庫)
        ↓consolidate(貴,dual-gate,背景)  ─抽象→ L4 Strategic(老王策略準則)
   Verifier(獨立模型): 校忠實度(NLM RAG) + 信心校準 ← 重用 cross-model, 不 self-judge

MVP 5 步：①L1 有 → ②deterministic capture hook → ③固定 5 欄 schema → ④capture≠consolidate → ⑤獨立 verifier。

六、三階段 + 硬閘

Phase A【語料累積】≥50 篇        ← 現在
   截圖(夏哥) → 本機 Vision OCR → NLM RAG + 圖庫 + 結構化記錄 + 個股時間線
        │
   ════ 硬閘：未滿 50 不進 B ════
        │
Phase B【訓練】從語料萃取 COMMON+CONDITIONAL per-股 profile → L2 instinct → cross-model 驗證
        │
Phase C【交付】每日產文 + 族群/個股追蹤 + 給代號就分析調歷史

七、現況進度（2026-06-03）

語料：76 篇（已過 50 閘）

來源	量	狀態
老王不只三分鐘 YT 2026	75 部	NLM RAG ready（核實 75/0 error）
截圖日報	1 篇	已解讀入庫(2026-06-01)

已建工具/資產

vision-ocr.swift：本機繁中 OCR（圖不離機，準度勝 STT）
laowang-ocr.sh：批次截圖→corpus
laowang-yt-ingest.sh：resumable YT 批次灌 NLM
laowang-ingest skill：截圖解讀入庫四寫流程
laowang-analyst skill：互動單檔分析
vault：方法庫 11 篇 + _corpus + 個股時間線 + _PROGRESS(76)

八、技術棧核實（2026-06，live，非記憶）

元件	版本/狀態	用途
Claude Code	v2.1.160	主機
Dynamic Workflows	v2.1.154 GA	批量建庫/全盤掃描
Skills(dynamic injection/subagent/progressive)	docs 核實	agent 能力封裝
macOS Vision OCR(swift 6.2.4)	本機	繁中 OCR，圖不離機
NotebookLM CLI	私有 Pro	RAG DB（省 token）
cross-model(codex+gemma)	§4	verifier 分離
fine-tune	❌ 不採	官方架構 skill/prompt-based

九、風險與紀律

圖不離機：付費截圖用本機 Vision OCR，只有萃取文字進私有 NLM；不上第三方 OCR 雲。
著作權：付費文有電子浮水印追蹤，僅個人自用、不對外散布；萃取方法+數據點，非逐字重製。
非投資建議：全程只記錄/模擬老王方法，不下買賣建議。
反 D4：資料不足不下方法定論；≥50 篇才訓練；confidence 隨實績校準。
verifier 分離：實作≠評審，重用 cross-model，避免 LLM 過度自信。

十、下一步（待夏哥定）

1. 補 PressPlay 付費每日報告截圖（最完整主語料）→ 我 OCR 解讀入庫，或

2. 直接用現有 76 篇先跑 Phase B 訓練，看老王方法模型雛形，再決定加料。

相關：_MOC 浦惠老王方法論研究、_SPEC 老王研究 + SOP差異點日誌、laowang-analyst、laowang-ingest