老王 Agent 訓練計畫書

一句話:不是「直接捏一個像老王的 agent」,而是用足夠的語料「訓練」出一個像老王一樣分析台股的 agent。最完整的語料=夏哥付費訂閱內容。資料不足不訓練(≥50 篇硬閘)。
紀律:圖不離機、付費內容只進私有 NLM、產出為老王方法之模擬、非投資建議

一、專案定位

項目內容
目標訓練一個用老王(浦惠投顧 王倚隆)方法分析台股的 agent:能力+格式+知識
路線Agent 工程(skill + RAG + 自學迴路), fine-tune 模型(官方架構驗證不需要)
語料主:PressPlay 付費每日報告/週晚報;輔:YT「老王不只三分鐘」、公開 FB 貼文
硬閘累積 ≥50 篇語料才進訓練,避免資料不足就 generalize(反 D4)

二、六大目標 × 現況 × 缺口

#目標現況還缺什麼
1每天產一篇「洞悉全球財經掌握台股主流」文章,像老王skill+方法庫雛形文章級整篇模板、每日 cron、完整資料源(三大法人/族群強弱)、語料厚度
2記錄/反省/追蹤分析過的族群與個股個股時間線骨架(L1)capture hook、5 欄 schema、L2 instinct+consolidate+verifier、族群級
3給股票代號就分析+調出過去分析資料skill 讀時間線、cnyes 驗代號RAG DB 資料量(要 backfill 才調得出)
4不要我截圖,computer-use 每日截已決:夏哥手動截圖(改由夏哥截、agent 解讀入庫)
5圖要進資料庫本機 Vision OCR + NLM 方案就緒持續 backfill、圖庫索引規範
6對焦老王分析法(同/異)抓到 COMMON+部分 CONDITIONALper-股/per-族群 profile 結構化(=L2 缺口,待語料校正)

三、老王分析法模型(待驗假設,Phase B 用語料校正)

COMMON 層(每檔都看)

CONDITIONAL 層(依股性不同,這層=L2 instinct)

股性老王主看
外資連動股三大法人/外資連續買賣超聯電2303、南亞科2408、至上8112
獲利爆發股自結 EPS/年增率華邦電2344、旺宏2337
國際連動股看大作小、龍頭臉色記憶體看美光 MU
大型權值股20 週均線台積電
分盤處置股無法看量、改看均線力積電6770
此表是 1 影片+截圖萃取的 v0 假設,Phase B 由 ≥50 篇語料重建/校正,非定論。

四、系統架構(四層+兩子系統)

laowang plugin (CLI 版優先,不吃 SDK credit)
├─ 知識層:方法庫(vault SSoT) + 術語/均線/籌碼/紀律
├─ 能力層:laowang-analyst skill(單檔互動) + Dynamic Workflow(批量/建庫)
│     dynamic context injection !`cnyes 即時盤面`
├─ 格式層:老王輸出模板(大盤→美股→族群→逐檔→紀律, 先預告後印證)
└─ 防護層:hooks 強制 非投資建議 + 來源引用

子系統 B — RAG DB(NLM, 省 token):所有語料 STT/檢索, notebooklm ask
子系統 C — 個股/族群時間線(連續追蹤):每次分析 append, 下次先讀

五、自我學習設計(L1→L4,源自 self-improving agent 藍圖)

L1 Raw(時間線/transcript) ─萃取→ L2 Instinct(老王規則+confidence)
   情境→方法→結果→原因→建議        隨實績 decay/升, 跨股 promote
        ↑capture(便宜,每次)              ─聚類→ L3 Skill(方法庫)
        ↓consolidate(貴,dual-gate,背景)  ─抽象→ L4 Strategic(老王策略準則)
   Verifier(獨立模型): 校忠實度(NLM RAG) + 信心校準 ← 重用 cross-model, 不 self-judge

MVP 5 步:①L1 有 → ②deterministic capture hook → ③固定 5 欄 schema → ④capture≠consolidate → ⑤獨立 verifier。


六、三階段 + 硬閘

Phase A【語料累積】≥50 篇        ← 現在
   截圖(夏哥) → 本機 Vision OCR → NLM RAG + 圖庫 + 結構化記錄 + 個股時間線
        │
   ════ 硬閘:未滿 50 不進 B ════
        │
Phase B【訓練】從語料萃取 COMMON+CONDITIONAL per-股 profile → L2 instinct → cross-model 驗證
        │
Phase C【交付】每日產文 + 族群/個股追蹤 + 給代號就分析調歷史

七、現況進度(2026-06-03)

語料:76 篇(已過 50 閘)

來源狀態
老王不只三分鐘 YT 202675 部NLM RAG ready(核實 75/0 error)
截圖日報1 篇已解讀入庫(2026-06-01)

已建工具/資產


八、技術棧核實(2026-06,live,非記憶)

元件版本/狀態用途
Claude Codev2.1.160主機
Dynamic Workflowsv2.1.154 GA批量建庫/全盤掃描
Skills(dynamic injection/subagent/progressive)docs 核實agent 能力封裝
macOS Vision OCR(swift 6.2.4)本機繁中 OCR,圖不離機
NotebookLM CLI私有 ProRAG DB(省 token)
cross-model(codex+gemma)§4verifier 分離
fine-tune❌ 不採官方架構 skill/prompt-based

九、風險與紀律


十、下一步(待夏哥定)

1. 補 PressPlay 付費每日報告截圖(最完整主語料)→ 我 OCR 解讀入庫,或

2. 直接用現有 76 篇先跑 Phase B 訓練,看老王方法模型雛形,再決定加料。

相關:_MOC 浦惠老王 方法論研究_SPEC 老王研究 + SOP差異點日誌laowang-analystlaowang-ingest
⚠️ 非投資建議
本網站所有內容均為研究輔助用途,不構成買賣有價證券之建議。投資一定有風險,投資前請詳閱公開說明書。
老王 Agent © 2026 · 基於公開影片分析萃取 · 浦惠證券老王方法論研究