現行系統運行於個人 VPS(Oracle Cloud JP, ARM64, 4C/23GB),以單一使用者為中心:
~/.claude/CLAUDE.md (user) +
~/CLAUDE.md (workspace) + 子樹規則,形成三層指令傳遞鏈核心問題:這套系統證明了 AI 輔助行銷調研的商業價值,但目前只有一個人能使用。公司需要讓行銷團隊也能操作,同時維持品質基準。
| 維度 | 現況(VPS 單人) | 目標(企業共用) |
|---|---|---|
| 使用者數 | 1 人 | 5-15 人(行銷團隊 + 管理層) |
| 存取方式 | SSH + Claude CLI | Web UI / Slack Bot / 受控 CLI |
| 資料隔離 | 無需隔離 | 按客戶/專案隔離 |
| API 成本控管 | 個人自費 | 部門預算 + quota |
| 品質管控 | 人工 + eval baseline | 自動化 quality gate + 定期 eval |
| 知識累積 | 個人記憶 + library | 團隊共享 library + 個人偏好 |
| 元件 | 現有路徑 | 遷移策略 | 理由 |
|---|---|---|---|
| CLAUDE.md 階層 | ~/.claude/CLAUDE.md, ~/CLAUDE.md, subtree
rules |
轉為企業 base template + 租戶覆寫層 | 指令傳遞鏈是系統行為的基礎 |
| Agent 定義 | ~/.claude/agents/*.md (39 個) |
共享唯讀層,全員使用同版本 | Agent 品質已調教穩定 |
| REGISTRY.md | ~/.claude/agents/REGISTRY.md |
共享唯讀,作為 dispatch 權威 | 觸發詞與調度邏輯是核心路由 |
| 核心 Skills | ~/.claude/skills/{brand-research,marketing,research}/ |
共享唯讀 + eval 保護 | 三個核心 skill 有 baseline |
| Library/Reference | ~/.claude/library/reference/ |
共享唯讀 knowledge base | 方法論、框架、領域知識 |
| Eval Framework | skill-eval.md + evals.json + eval-artifacts |
集中管理,定期執行 | 品質基準不可丟失 |
| Hooks(品質閘門) | quality-gate.sh,
debate-quality-judge.sh |
集中部署,所有租戶共用 | 防止品質靜默退步 |
| 元件 | 現有設計 | 必要調整 | 複雜度 |
|---|---|---|---|
| 記憶架構 | 單人 memory/、單人 project MEMORY.md |
多人隔離:共享 team memory + 個人 memory 雙層 | 中 |
| 權限模型 | 無(單人全權) | RBAC:管理員 / 進階使用者 / 一般使用者 | 中 |
| API Key 管理 | 個人 key、無 quota | 集中 key pool + per-user quota + 審批流程 | 中-高 |
| 專案結構 | ~/.claude/projects/{name}/ |
多租戶 project namespace + 客戶資料隔離 | 中 |
| Hooks(遙測) | runtime-event-log.sh 寫本地 JSONL |
集中日誌收集 + 用量儀表板 | 低-中 |
| 存取介面 | SSH + CLI 直接操作 | Web UI / Slack 整合 / 受控 CLI wrapper | 高 |
| 元件 | 理由 |
|---|---|
| 個人專案資料(oasis、ttl、fino 等) | 客戶專屬資料,不進共用環境 |
agent-memory/(已退役) |
系統已確認退役,不遷移歷史包袱 |
claude-mem MCP plugin 的 session artifacts |
runtime artifact,非架構元件 |
| VPS 基礎設施服務(Pangolin、YFBB、AdGuard 等) | 與行銷 AI 無關的個人服務 |
| Codex CLI 相關設定 | 個人多 AI 實驗工具,企業環境統一用 Claude |
.system-backup/ 備份架構 |
企業環境有自己的備份策略 |
| 輔助 Skills(ops、plan、present 等) | 非核心,Phase 3 再評估是否納入 |
Phase 1 (1-2 週) Phase 2 (2-4 週) Phase 3 (1-2 月)
基礎環境 + 核心移植 多人存取 + Onboarding Eval + 治理 + 全面運作
├─ 企業環境建置 ├─ 權限系統上線 ├─ Eval 框架導入
├─ CLAUDE.md 模板化 ├─ 行銷團隊帳號開通 ├─ 自動化 quality gate
├─ Agent/Skill 部署 ├─ 培訓 + 試用 ├─ 用量報表 + 成本分析
└─ 單人端到端驗證 └─ API quota 啟用 └─ 持續改善迴圈
目標:在企業環境中重現個人 VPS 的完整能力,由技術負責人驗證。
| 任務 | 交付物 | 估算 | 前置 |
|---|---|---|---|
| 1.1 企業運算環境建置 | 雲端 VM 或容器集群 ready | 2-3 天 | IT 部門配合 |
| 1.2 Claude API 企業帳號申請 | API key + billing 設定 | 1-2 天 | 財務核准 |
| 1.3 CLAUDE.md 企業 base template 建立 | 企業版 CLAUDE.md 三層指令檔 |
1 天 | 1.1 |
| 1.4 Agent registry + 定義檔部署 | 39 個 agent .md + REGISTRY.md | 0.5 天 | 1.3 |
| 1.5 核心 Skills 部署 | brand-research, marketing, research | 0.5 天 | 1.4 |
| 1.6 Library/Reference 部署 | 方法論、框架、領域知識 | 0.5 天 | 1.3 |
| 1.7 Hooks 部署(quality-gate + telemetry) | quality-gate.sh + runtime-event-log.sh | 0.5 天 | 1.5 |
| 1.8 端到端驗證 | 3 組 benchmark(BR-001, MKT-001, RES-001)通過 | 2-3 天 | 1.7 |
Phase 1 驗收標準:
Phase 1 估算:
目標:讓行銷團隊開始使用,建立基本的存取控管與成本管理。
| 任務 | 交付物 | 估算 | 前置 |
|---|---|---|---|
| 2.1 RBAC 權限模型實作 | 三級角色系統(admin / power / user) | 3-4 天 | Phase 1 |
| 2.2 API Key pool + quota 系統 | 集中 key 管理 + per-user 月額度 | 2-3 天 | 2.1 |
| 2.3 多租戶 project namespace | 客戶資料隔離方案上線 | 2-3 天 | 2.1 |
| 2.4 存取介面建置 | Slack Bot 或 Web UI wrapper(MVP) | 5-7 天 | 2.1 |
| 2.5 行銷團隊培訓(第一梯次) | 培訓教材 + hands-on workshop | 2 天 | 2.4 |
| 2.6 Pilot 試用期 | 2-3 位先行者使用 2 週 + 回饋收集 | 10 天 | 2.5 |
| 2.7 回饋迭代 + 第二梯次培訓 | 修正痛點 + 擴大至全團隊 | 3-5 天 | 2.6 |
Phase 2 驗收標準:
/brand-research 和
/marketing 並產出可用報告Phase 2 估算:
目標:從「能用」進化到「可持續、可度量、可改善」。
| 任務 | 交付物 | 估算 | 前置 |
|---|---|---|---|
| 3.1 Eval framework 企業版部署 | skill-eval protocol + benchmark 定期執行 | 3-5 天 | Phase 2 |
| 3.2 自動化 quality gate 全面啟用 | 所有使用者的輸出都經過 quality-gate hook | 2-3 天 | 3.1 |
| 3.3 用量報表儀表板 | 月度成本、使用頻率、品質趨勢 | 5-7 天 | Phase 2 |
| 3.4 知識庫維護流程建立 | library 更新 SOP + review cadence | 2-3 天 | 3.1 |
| 3.5 Skill 改版治理流程 | 變更必須通過 eval、3-run window | 1-2 天 | 3.1 |
| 3.6 Agent portfolio review | 基於 telemetry 決定 Core/Conditional/Specialist 調整 | 3-5 天 | 3.3(需 30 天資料) |
| 3.7 輔助 Skills 評估與移植 | 評估 ops、plan、present 等是否納入企業版 | 3-5 天 | 3.1 |
| 3.8 災難復原演練 | 完整環境 restore + 品質驗證 | 1-2 天 | 3.2 |
Phase 3 驗收標準:
Phase 3 估算:
| 階段 | 時長 | 累計 | 里程碑 |
|---|---|---|---|
| Phase 1 | ~2 週 | 2 週 | 技術負責人確認企業環境品質等同 VPS |
| Phase 2 | ~4 週 | 6 週 | 行銷團隊開始產出可用報告 |
| Phase 3 | ~6 週 | 12 週 | 完整治理體系運行穩定 |
┌─────────────────────────────────────────────────────────────────┐
│ 存取層 Access Layer │
│ Slack Bot / Web UI / CLI Wrapper │
│ 認證 + 路由 + quota 檢查 │
├─────────────────────────────────────────────────────────────────┤
│ 調度層 Dispatch Layer │
│ RBAC 權限閘門 → Orchestrator → Agent Dispatch │
├─────────────────────────────────────────────────────────────────┤
│ 共享層 Shared Layer (唯讀) │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────────┐ │
│ │ Agents │ │ Skills │ │ Library │ │ Eval Framework │ │
│ │ (39 位) │ │ (核心 3) │ │ (Ref) │ │ (Benchmark) │ │
│ └──────────┘ └──────────┘ └──────────┘ └──────────────────┘ │
├─────────────────────────────────────────────────────────────────┤
│ 租戶層 Tenant Layer (隔離) │
│ ┌─────────────────┐ ┌─────────────────┐ ┌──────────────┐ │
│ │ User A │ │ User B │ │ User C │ │
│ │ ├ projects/ │ │ ├ projects/ │ │ ├ projects/ │ │
│ │ ├ memory/ │ │ ├ memory/ │ │ ├ memory/ │ │
│ │ └ preferences/ │ │ └ preferences/ │ │ └ prefs/ │ │
│ └─────────────────┘ └─────────────────┘ └──────────────┘ │
├─────────────────────────────────────────────────────────────────┤
│ 基礎設施層 Infrastructure │
│ API Key Pool + Quota + Telemetry + Backup │
└─────────────────────────────────────────────────────────────────┘
| 資產 | 共享/隔離 | 權限 | 理由 |
|---|---|---|---|
| Agent 定義(39 個 .md) | 共享 | 全員唯讀,admin 可修改 | 統一品質,避免各自魔改 |
| REGISTRY.md | 共享 | 全員唯讀,admin 可修改 | 調度邏輯必須一致 |
| 核心 Skills | 共享 | 全員唯讀,變更需 eval | Skill 品質是核心資產 |
| Library/Reference | 共享 | 全員唯讀,admin 可擴充 | 知識庫是團隊共同資產 |
| Eval baseline | 共享 | admin 可執行 eval | 品質基準是治理工具 |
| Quality-gate hook | 共享 | 自動套用 | 防止品質退步 |
| 客戶專案資料 | 隔離 | 僅 project member | 客戶資料保密義務 |
| 個人 memory/preferences | 隔離 | 僅本人 | 使用習慣屬個人 |
| API 用量記錄 | 隔離(個人)+ 共享(彙總) | 個人看自己,admin 看全部 | 成本歸屬 + 整體管控 |
| Team memory | 共享 | 團隊成員可讀寫 | 團隊知識累積 |
/enterprise/
├── shared/ # 共享層(git 版控)
│ ├── agents/ # 39 位 Agent 定義
│ ├── skills/ # 核心 Skills
│ ├── library/ # 知識庫
│ ├── hooks/ # 品質閘門
│ └── eval/ # Eval framework + baselines
│
├── team/ # 團隊層
│ ├── memory/ # 團隊共享記憶
│ ├── templates/ # 團隊報告模板
│ └── decisions/ # 團隊決策記錄
│
└── tenants/ # 租戶層(嚴格隔離)
├── user-alice/
│ ├── projects/
│ │ ├── client-alpha/ # 客戶 A 專案
│ │ └── client-beta/ # 客戶 B 專案
│ ├── memory/ # 個人記憶
│ └── preferences/ # 個人偏好
├── user-bob/
│ └── ...
└── user-carol/
└── ...
隔離機制:
0700,僅 owner + admin
可存取 ┌─────────────────────┐
│ API Key Pool │
│ (企業主帳號) │
├─────────────────────┤
│ key-1: Claude API │
│ key-2: Claude API │
│ key-3: Web Search │
└────────┬────────────┘
│
┌────────┴────────────┐
│ Quota Manager │
│ (中間層代理) │
├─────────────────────┤
│ Per-user 月額度 │
│ Per-skill 單次上限 │
│ 超額需審批 │
└────────┬────────────┘
│
┌────────────────┼────────────────┐
▼ ▼ ▼
┌──────────┐ ┌──────────┐ ┌──────────┐
│ User A │ │ User B │ │ User C │
│ 月額 $50 │ │ 月額 $50 │ │ 月額 $30 │
└──────────┘ └──────────┘ └──────────┘
Quota 規則:
| 控管層級 | 預設值 | 超額處理 |
|---|---|---|
| 每人每月 token 額度 | $50 USD 等值 | 通知 admin,暫停該使用者 |
| 單次 skill 執行上限 | $5 USD(marketing 4.6x 倍率已知最貴) | 執行前預估,超過則需 admin 核准 |
| 團隊月度總預算 | $500 USD | 80% 水位線預警 |
| 突發大量使用 | N/A | 1 小時內超過日均 3 倍,自動暫停 + 通知 |
成本參考(基於現有 baseline 資料):
| Skill | 每次預估 token 成本 | 倍率 | 備註 |
|---|---|---|---|
| brand-research (full) | 中 | 2.3x | 多來源品牌診斷 |
| marketing (full) | 高 | 4.6x | 多階段 agent dispatch,最貴 |
| research (full) | 中 | 2.2x | 研究院 full workflow |
| 階段 | 對象 | 內容 | 時長 | 形式 |
|---|---|---|---|---|
| L1 概念入門 | 全員 | AI 輔助行銷的價值主張、系統能做什麼/不能做什麼、成功案例展示 | 1 小時 | 簡報 + 示範 |
| L2 實作工坊 | 操作人員 | /brand-research 和 /marketing
的完整操作流程、如何看懂報告、如何給好的 prompt |
3 小時 | Hands-on 工坊 |
| L3 進階應用 | 進階使用者 | /research 完整模式、Agent 選擇與組合、報告客製化、eval
閱讀 |
2 小時 | 小班教學 |
| L4 管理概覽 | 管理層 | 成本結構、品質監控儀表板、團隊用量報表解讀 | 1 小時 | 簡報 |
| 教材 | 內容 | 優先序 |
|---|---|---|
| Quick Start Guide | 10 分鐘內完成第一次 brand-research | P0 |
| Skill Reference Card | 三個核心 skill 的輸入/輸出/模式速查表 | P0 |
| Prompt Best Practices | 好的指令 vs 壞的指令、常見錯誤 | P0 |
| FAQ | 收集 pilot 期間的常見問題 | P1 |
| Video Tutorial | 螢幕錄影操作示範 | P1 |
| Troubleshooting Guide | 常見錯誤排除(API timeout、quota 超額等) | P2 |
| 角色 | 人數 | 職責 | 所需技能 |
|---|---|---|---|
| 系統管理員 (Admin) | 1-2 人 | Agent/Skill 版本管理、eval 執行、quota 調整、故障排除 | Claude Code 操作、eval protocol 理解 |
| 超級使用者 (Power User) | 2-3 人 | 進階 skill 使用、報告品質審查、新進人員 mentor | 行銷專業 + 系統操作熟練 |
| 一般使用者 (User) | 5-10 人 | 日常 brand-research 和 marketing 執行、報告微調 | 基本操作能力 |
| 技術支援 | 1 人(可由系統管理員兼任) | 環境維護、API 問題排除、hook 異常處理 | Linux 基礎 + Claude API 理解 |
Week 1-2: Pilot Group (2-3 人)
│ 先行者 = 行銷團隊中最有好奇心的成員
│ 目標:收集真實使用回饋,找出最大痛點
│
▼
Week 3-4: 回饋迭代
│ 根據 pilot 回饋調整:介面、教材、prompt 範例
│ 同時建立 FAQ 和 Troubleshooting Guide
│
▼
Week 5-6: 第一次擴大 (5-8 人)
│ 加入第二批使用者,由 pilot 成員當 mentor
│ 此時品質和成本數據已足夠做初步分析
│
▼
Week 7-8: 全員開放
│ 全行銷團隊開放使用
│ 建立定期 office hour(每週 30 分鐘)
│
▼
Month 3+: 常態運營
定期 eval + 月度報告 + 季度 review
| 抗拒類型 | 預期表現 | 緩解策略 |
|---|---|---|
| 「AI 會取代我」 | 迴避使用、消極抵制 | 明確定位:AI 是工具不是替代品,節省的時間用於更高價值的策略思考 |
| 「我現在的方法就很好」 | 不願改變工作流程 | 用 A/B 比較展示:同一個案子,有 AI vs 無 AI 的時間和品質差異 |
| 「這太複雜了」 | 試了一次就放棄 | Quick Start Guide + Buddy 制度(每位新手配一位 power user) |
| 「AI 的輸出不可靠」 | 質疑報告品質 | 展示 eval baseline 數據、quality-gate 機制、source discipline 追蹤 |
| # | 風險 | 可能性 | 影響 | 風險值 | 緩解策略 |
|---|---|---|---|---|---|
| R1 | API 成本失控 | 高 | 高 | 嚴重 | Per-user quota + 單次上限 + 月度預算警報 + 突發用量自動暫停 |
| R2 | 品質不一致(不同人產出品質落差大) | 中 | 高 | 高 | 共享 skill(不允許個人魔改)+ quality-gate hook + 定期 eval baseline 比對 |
| R3 | 人員抗拒導入 | 中 | 中 | 中 | Pilot group 先行 + quick win 展示 + buddy 制度 + 管理層支持 |
| R4 | 客戶資料外洩 | 低 | 極高 | 高 | 租戶隔離 + 檔案權限 + 禁止跨租戶搜尋 + 定期存取稽核 |
| R5 | Claude API 服務中斷 | 低 | 高 | 中 | 與 Anthropic 簽 SLA 或準備 fallback 流程(人工作業 SOP) |
| R6 | Skill 改版後品質退步 | 中 | 高 | 高 | Eval protocol + 3-run window + promotion rule(未通過 eval 不上線) |
| R7 | 環境遷移導致行為差異 | 中 | 中 | 中 | Phase 1 用 3 組 benchmark 做端到端驗證 |
| R8 | 知識庫過時 | 中 | 中 | 中 | 季度 library review cadence + team memory 累積機制 |
R1:API 成本失控
防線一:Per-user 月額度($50 預設)
│ 超過 → 帳號暫停 + 通知 admin
│
防線二:單次 skill 上限($5)
│ 預估超過 → 需 admin 核准
│
防線三:團隊月預算($500)
│ 80% 水位 → 團隊預警
│ 100% → 全團隊暫停 + 管理層決策
│
防線四:突發偵測
│ 1 小時內 > 3x 日均 → 自動暫停 + 即時通知
R2:品質不一致
R4:客戶資料外洩
0700 + ACL| 指標 | 定義 | Phase 2 目標 | Phase 3 目標 | 量測方式 |
|---|---|---|---|---|
| 提案產出時間 | 從接到客戶 brief 到第一版報告完成 | 縮短 40% | 縮短 60% | before/after 時間記錄 |
| 品質評分穩定度 | 5 維度評分的標準差 | < 25% | < 15% | eval framework 定期 benchmark |
| 使用者採用率 | 實際使用 / 有帳號人數 | > 50% | > 80% | 月度 telemetry 統計 |
| 指標 | 定義 | 目標 | 量測方式 |
|---|---|---|---|
| 月度 API 成本 | 團隊每月 API 花費 | < $500 | billing 報表 |
| 每次提案平均成本 | API 成本 / 提案數量 | < $15 | telemetry + billing |
| 人均月度使用次數 | skill 執行次數 / 活躍使用者 | > 8 次 | telemetry |
| Source discipline 分數 | eval 中「來源紀律」維度平均分 | >= 1.5 / 2.0 | eval scorecard |
| Quality gate 攔截率 | 被 quality-gate 標記的輸出比例 | < 10%(代表品質穩定) | hook telemetry |
| 培訓完成率 | 完成 L2 培訓 / 有帳號人數 | > 90% | 培訓記錄 |
| 使用者滿意度 | 季度內部問卷 NPS | > 30 | 問卷調查 |
| 頻率 | 動作 | 負責 |
|---|---|---|
| 每週 | 用量摘要(API 成本、執行次數、活躍人數) | 系統管理員自動產出 |
| 每月 | 完整指標報表 + eval benchmark 執行 | 系統管理員 |
| 每季 | KPI review + agent portfolio review + 決策層彙報 | 系統管理員 + 管理層 |
| 時機 | 判斷 | 觸發條件 |
|---|---|---|
| Phase 1 結束 | Go to Phase 2? | 3 組 benchmark 全部通過,無硬性失敗 |
| Phase 2 Pilot 結束 | 擴大至全員? | 至少 2/3 pilot 成員能獨立產出、成本在預算內 |
| Phase 3 第一月 | 繼續投資? | 提案時間確實縮短 > 30%、使用者採用率 > 50% |
| Phase 3 第三月 | 常態化? | 所有核心 KPI 達標或正向趨勢 |
狀態:提議
上下文:遷移至多人環境時,需決定 Agent 定義和 Skill prompt 是每人一份還是共用一份。
決策:採用共享唯讀層,所有使用者使用同一版本的 Agent 定義和 Skill prompt。
理由:
替代方案:
後果:
狀態:提議
上下文:行銷人員不熟悉 CLI,需要更友善的操作介面。選項包括 Web UI、Slack Bot、VS Code Extension。
決策:Phase 2 以 Slack Bot 作為 MVP 存取介面。
理由:
替代方案:
後果:
狀態:提議
上下文:多人使用時,API key 的管理方式需要決定。
決策:使用企業主帳號的 key pool,透過中間層代理分配,不讓個人持有 API key。
理由:
替代方案:
後果:
本章完。遷移方案在管理層批准後,由系統管理員主導 Phase 1 執行。