Operations Strategy Report

鬥地主 AI 營運與 RTP 策略報告

這份報告不是只討論哪個 AI 更強，而是從平台營運角度評估：如果目標是穩定收入、控制 RTP 區間、降低波動並維持玩家體感，AI 應該怎麼設計、怎麼分層、怎麼落地。

主營運目標 穩定收益與 RTP 區間控制

核心主力 DouZero WP + RuleBot fallback

升級方向 ADP 分層 + LLM 體驗層 + Distillation

一句話結論

如果平台的首要目標是 穩定收入與控制 RTP，那 AI 的核心就不應該只是「更強」，而應該是 更穩、更可控、更容易 fallback，且能分層調整玩家體感。

主出牌層：DouZero WP
保底層：RuleBot
高壓層：DouZero ADP
互動層：LLM

AI 方案的營運角色分工

Operating Lens

🎯 主出牌層

DouZero WP

勝率穩、風格一致，最適合做全站主模式，能在玩家體感與收益穩定之間取得平衡。

🛡 保底層

RuleBot

在 AI health 失敗、tunnel 異常或託管切換時立即接手，確保 RTP 不會因系統問題失控。

⚡ 高壓層

DouZero ADP

適合拿來做高難度、競技房或活動模式，但不建議直接當全站唯一主模式。

💬 體驗層

LLM / Qwen

適合做教學、解說、陪玩與角色互動，提升留存與體驗，但不直接承擔收益控制任務。

🧪 長期路線

Distillation / 進階 RL

適合作為中長期策略，用於優化成本、壓縮模型或建立差異化自研 AI。

📌 原則

營運優先

先確保 RTP 可控與收益穩，再追求 AI 的理論強度天花板，順序不能反過來。

從營運角度看 AI 適配度

RTP-Oriented Comparison

方案	收益穩定性	RTP 可控性	波動風險	玩家體感	營運定位
RuleBot	高	最高	低	偏機械但穩	保底、託管、安全網
DouZero WP	高	高	中低	穩定、正式	主模式首選
DouZero ADP	中	中高	中高	壓力感強	進階房、高壓模式
DouZero SL	中高	高	低到中	穩、偏基線	本地驗證、基線模型
LLM / Qwen	低	低到中	高	互動感佳	解說、教學、陪玩
Distillation / 進階 RL	待驗證	中	視方案而定	潛力高	中長期升級

真正需要監控的不是 AI 強不強

Operational Checklist

📉 收益與 RTP

先看數值是否穩

RTP 是否維持在目標區間。
高低分房的波動是否過大。
不同模式切換後收益是否異常偏移。
是否能把玩家體感與收益目標拆開管理。

🛠 系統穩定性

再看系統能否穩定執行

AI health 是否持續正常。
fallback 到 RuleBot 是否即時。
託管模式是否能平滑接手。
模型、tunnel、快取與路徑是否容易維運。

營運視角的核心：AI 不是單純「變強」，而是要能在收入、RTP、體感與維運之間維持可預期的平衡。

對目前專案的落地方案

Execution Path

📌 短期

先穩定主模式

主模式固定用 DouZero WP。
RuleBot 負責 health 失敗 fallback。
SL 當成本地驗證與穩定基線。

🛠 中期

開始分層

把 WP / ADP / SL 做成可切換模式。
建立 AI 狀態與收益監控。
觀察不同模式對 RTP 與留存的影響。

✨ 長期

擴充體驗與壓縮成本

引入 LLM 做解說、教學、陪玩。
評估 Distillation 或更進階自訓路線。
視營運需要做 AI 強度分層。

一句話方案：出牌用 DouZero WP、保底用 RuleBot、體驗增強用 LLM，所有決策都服從於收益穩定與 RTP 區間控制。