Operations Strategy Report

鬥地主 AI 營運與 RTP 策略報告

這份報告不是只討論哪個 AI 更強,而是從平台營運角度評估: 如果目標是穩定收入、控制 RTP 區間、降低波動並維持玩家體感,AI 應該怎麼設計、怎麼分層、怎麼落地。

主營運目標 穩定收益與 RTP 區間控制
核心主力 DouZero WP + RuleBot fallback
升級方向 ADP 分層 + LLM 體驗層 + Distillation

一句話結論

如果平台的首要目標是 穩定收入與控制 RTP, 那 AI 的核心就不應該只是「更強」,而應該是 更穩、更可控、更容易 fallback,且能分層調整玩家體感

  • 主出牌層:DouZero WP
  • 保底層:RuleBot
  • 高壓層:DouZero ADP
  • 互動層:LLM

AI 方案的營運角色分工

Operating Lens
🎯 主出牌層

DouZero WP

勝率穩、風格一致,最適合做全站主模式,能在玩家體感與收益穩定之間取得平衡。

🛡 保底層

RuleBot

在 AI health 失敗、tunnel 異常或託管切換時立即接手,確保 RTP 不會因系統問題失控。

⚡ 高壓層

DouZero ADP

適合拿來做高難度、競技房或活動模式,但不建議直接當全站唯一主模式。

💬 體驗層

LLM / Qwen

適合做教學、解說、陪玩與角色互動,提升留存與體驗,但不直接承擔收益控制任務。

🧪 長期路線

Distillation / 進階 RL

適合作為中長期策略,用於優化成本、壓縮模型或建立差異化自研 AI。

📌 原則

營運優先

先確保 RTP 可控與收益穩,再追求 AI 的理論強度天花板,順序不能反過來。

從營運角度看 AI 適配度

RTP-Oriented Comparison
方案 收益穩定性 RTP 可控性 波動風險 玩家體感 營運定位
RuleBot 最高 偏機械但穩 保底、託管、安全網
DouZero WP 中低 穩定、正式 主模式首選
DouZero ADP 中高 中高 壓力感強 進階房、高壓模式
DouZero SL 中高 低到中 穩、偏基線 本地驗證、基線模型
LLM / Qwen 低到中 互動感佳 解說、教學、陪玩
Distillation / 進階 RL 待驗證 視方案而定 潛力高 中長期升級

真正需要監控的不是 AI 強不強

Operational Checklist
📉 收益與 RTP

先看數值是否穩

  • RTP 是否維持在目標區間。
  • 高低分房的波動是否過大。
  • 不同模式切換後收益是否異常偏移。
  • 是否能把玩家體感與收益目標拆開管理。
🛠 系統穩定性

再看系統能否穩定執行

  • AI health 是否持續正常。
  • fallback 到 RuleBot 是否即時。
  • 託管模式是否能平滑接手。
  • 模型、tunnel、快取與路徑是否容易維運。
營運視角的核心:AI 不是單純「變強」,而是要能在收入、RTP、體感與維運之間維持可預期的平衡。

對目前專案的落地方案

Execution Path
📌 短期

先穩定主模式

  • 主模式固定用 DouZero WP。
  • RuleBot 負責 health 失敗 fallback。
  • SL 當成本地驗證與穩定基線。
🛠 中期

開始分層

  • 把 WP / ADP / SL 做成可切換模式。
  • 建立 AI 狀態與收益監控。
  • 觀察不同模式對 RTP 與留存的影響。
✨ 長期

擴充體驗與壓縮成本

  • 引入 LLM 做解說、教學、陪玩。
  • 評估 Distillation 或更進階自訓路線。
  • 視營運需要做 AI 強度分層。
一句話方案:出牌用 DouZero WP、保底用 RuleBot、體驗增強用 LLM,所有決策都服從於收益穩定與 RTP 區間控制。