Hi~ 我是 Eric!🚀

這篇文章想做一件我自己覺得非常有意思、而且很有代表性的事情:

把 AI 從聊天工具,直接拉進「遊戲戰術研究員」的角色裡。

這次我拿來做實驗的題目,不是寫程式、不是做摘要、不是生企劃,而是很多人第一眼可能會覺得「這也能交給 AI?」的主題:

讓 AI 去研究《Pokémon Champions》的 Meta,找出單打與雙打的最佳隊伍,並且再找出能克制這些最佳隊伍的對策隊。

我同時使用了兩個模型工具:

  • ChatGPTDeep Research
  • GeminiDeep Research

我給它們幾乎相同的研究任務,讓它們自己去做資料搜尋、整理規則、分析環境,最後各自交出一份完整報告。

如果你想先直接看原始完整報告,我也把兩份檔案放到 Google 雲端公開檢視了:

而這個任務的結構很明確:

  • 每個 AI 要產出 4 支隊伍
  • 分別是:
    • 最強單打隊伍
    • 最強雙打隊伍
    • 克制最強單打隊伍的對策隊
    • 克制最強雙打隊伍的隊伍

也就是說,這不是一般的「你幫我推薦一隊寶可夢」而已。

這更像是:

我把兩個 AI 丟進同一個新遊戲的競技環境裡,看它們會如何閱讀規則、吸收資料、建立 Meta 模型,最後交出它們認為最合理的競技答案。

而結果比我預期得還有趣。

因為這不只是「誰列的隊伍比較強」而已,而是兩個 AI 在研究方法、風格、風險偏好、組隊哲學上的差異,全部都會攤在陽光下。


這篇文章想回答的,不只是「哪個 AI 比較強」

如果你只是想看一句結論,那這篇文章可能會讓你失望。

因為我最後得到的答案,並不是單純的:

  • ChatGPT 比 Gemini 強
  • 或 Gemini 比 ChatGPT 強

真正有價值的地方,其實在於下面這幾個問題:

  1. Deep Research 這個功能,到底適不適合拿來做遊戲 Meta 研究?
  2. 為什麼《寶可夢》這種 IP,會特別適合給 AI 分析?
  3. 當題目是「新遊戲、規則變動、資料還在形成中」時,AI 會怎麼推理?
  4. 同樣都叫做 Deep Research,ChatGPT 與 Gemini 的研究風格到底差在哪裡?
  5. 一份 AI 生成的戰術報告,到底能不能直接拿去抄?還是只能當靈感來源?

如果你平常就有在用 AI 工具,尤其是你對下面這幾種情境有興趣:

  • 想知道 Deep Research 跟一般聊天模式差在哪
  • 想用 AI 研究遊戲、股票、產業、產品或競品
  • 想比較不同模型在「多來源推理」上的風格
  • 想知道 Prompt 要怎麼下,才能讓 AI 真的做出像樣的深度報告

那這篇我會盡量寫得完整一點,也寫得誠實一點。

因為這次的重點,不只是成果,而是整個研究過程本身。


什麼是我這次用的「Deep Research」?

先講一下脈絡。

所謂的 Deep Research,不是一般那種你問一句、AI 回一段話的聊天模式。

它比較像是:

  • AI 先理解你的研究目標
  • 自己決定要去查哪些資料
  • 交叉比對不同來源
  • 整理規則、建立論點
  • 最後組合成一份相對完整的研究報告

換句話說,它不是單純在「生成答案」,而是在模擬一種更接近研究助理的工作流。

這件事的重要性在於:

當問題不是靜態知識題,而是需要大量比對、歸納、組合時,Deep Research 類型的功能,理論上應該比一般聊天模式更有優勢。

而遊戲 Meta,剛好就是一種非常適合驗證這種能力的題型。

因為遊戲 Meta 不是死知識。

它是:

  • 規則
  • 資料
  • 主流傾向
  • 對策思維
  • 環境互剋

這五種東西交織起來的動態系統。

如果一個 AI 真的有能力做研究,那它理應不只會告訴你:

「這隻寶可夢很強。」

而應該要能進一步說明:

  • 為什麼它在現在的規則下很強
  • 它強在什麼隊伍結構裡
  • 這個結構怕什麼
  • 對手又會怎麼反制
  • 反制之後,最佳解會不會再往下一層演化

而《Pokémon Champions》恰好是一個非常好的測試場。


為什麼我選《Pokémon Champions》當 Deep Research 的測試題?

因為這個題目同時具備了三個很關鍵的特性:

  1. 它夠新
  2. 它有規則變動
  3. 它又不是完全從零開始

這三點很重要。

如果我拿一個已經研究到爛掉、幾乎有標準答案的老題目給 AI,它只是在把現成共識重新包裝而已,很難看出研究能力。

但《Pokémon Champions》不同。

它雖然繼承了寶可夢系列的核心戰鬥邏輯,卻又有一些明顯的新機制,例如:

  • 66 SP 的能力點數分配
  • 單項能力上限 32
  • 全員 31 IV
  • Mega Evolution 回歸
  • 異常狀態機率與持續回合調整

也就是說,這是一個「熟悉的骨架 + 新的規則層」。

這種題目最能測出 AI 到底是在「背答案」,還是真的能夠做交叉比對與遷移推理。

因為它不能只複製主系列既有答案。

它必須做的是:

  • 先抓到新遊戲規則
  • 再映射回主系列的戰術概念
  • 最後判斷哪些老邏輯還成立,哪些不成立

而這正好也是我最想測的能力。


為什麼「寶可夢」這個 IP,如此適合作為 AI 分析的對象?

這是我在做完這次實驗後,感受最強烈的一件事。

我甚至覺得,如果你真的想看 AI 在「多來源推理、規則理解、結構化分析」上的能力,寶可夢幾乎是教科書級的測試題材

原因至少有三個。

1. 世界第一 IP 的數據紅利

作為全球價值最高、影響力最深的媒體 IP 之一,寶可夢在過去三十年間累積了極其龐大的數位資料資產。

這些資料不是只有角色設定而已,而是非常具體、非常可運算的內容,包括:

  • 寶可夢圖鑑資料
  • 種族值
  • 屬性相剋
  • 招式表
  • 特性表
  • 道具效果
  • 歷代賽制規則
  • VGC 與單打環境的戰術分析
  • 玩家社群長年累積的攻略、隊伍文章與比賽討論

這代表什麼?

代表 AI 在訓練階段、或在推理階段透過搜尋可接觸到的資訊,遠比一般遊戲來得完整。

對 AI 來說,寶可夢不是一個「資料荒原」,而是一個極度肥沃的知識地層。

它天然就有非常厚的「戰術基底」。

這也是為什麼在我這次的測試中,無論是 ChatGPT 還是 Gemini,都能快速產出看起來像模像樣、而且彼此之間還有內在邏輯差異的報告。

不是因為它們在亂猜,而是因為寶可夢這個題目本來就有太多可供引用、轉譯與推理的素材。

2. 規則化的邏輯骨架

寶可夢對戰的本質,其實非常適合 AI。

因為它不是那種高度依賴模糊敘事、抽象審美或純感覺操作的題材。

它有一個非常清楚的底層特質:

它本質上是一個規則嚴謹、參數眾多、結果可推演的邏輯系統。

所有關鍵元素幾乎都可以被形式化:

  • 招式威力
  • 命中率
  • 優先度
  • 天氣效果
  • 場地效果
  • 能力值變化
  • 特性觸發條件
  • 屬性剋制倍率
  • 道具乘區
  • 回合節奏

這類「規則明確、變數很多、但邊界清楚」的系統,本來就是 AI 很擅長處理的推理場景。

因為它不需要憑空創造世界觀,而是要在一個規則框架裡做最合理的推演。

這種題型,會讓 AI 的長處變得非常明顯:

  • 它可以快速比對多個變數
  • 可以同時思考多種隊伍組合
  • 可以從大量資料裡萃取穩定的結構模式
  • 可以把複雜資訊壓成結構化答案

也因此,當題目是「幫我找最強單打隊伍」、「幫我找最強雙打隊伍」、「再幫我找出克制這兩支隊的對策隊」時,AI 不會像在面對純創作題時那麼飄。

它有骨架可抓。

3. AI 的交叉比對能力,在這裡特別有價值

《Pokémon Champions》不是主系列正傳,但它的很多核心邏輯明顯是從歷代寶可夢對戰演化過來的。

這就形成一個很有趣的研究條件:

  • 新遊戲有新規則
  • 但新規則不是完全與歷史切斷

對 AI 來說,這等於是一個非常適合做「新舊資料交叉比對」的題目。

它可以做的事情包括:

  • 把新遊戲的 SP 系統,映射到過去 EV 的思考方式
  • 把《Champions》的對戰節奏,對照 VGC 或單打歷代的常見隊伍骨架
  • 把目前可用的寶可夢名單,與歷代強勢角色的功能分類做比對
  • 估算哪些隊伍思維能延續,哪些需要重寫

這也是為什麼在這次測試裡,我看到兩個模型都不約而同做了一件事:

它們沒有把《Pokémon Champions》當成完全陌生的新遊戲,而是把它視為一個「在寶可夢戰術體系上做規則偏移的新環境」。

這種做法其實非常合理。

而 AI 在這方面的優勢,正在於它很擅長把「新資料」與「舊結構」快速連起來。


我的實驗設計:讓兩個 AI 都交出 4 支隊伍

這次我給 Gemini 與 ChatGPT 的核心任務,大致可以濃縮成一句話:

請以 Deep Research 的方式,分析《Pokémon Champions》目前的競技環境,並分別找出單打與雙打的最佳隊伍,以及能夠克制這兩支最佳隊伍的隊伍。

換句話說,每個 AI 都要交出四份成果:

  1. 最強單打隊伍
  2. 最強雙打隊伍
  3. 克制最強單打隊伍的對策隊
  4. 克制最強雙打隊伍的隊伍

這個設計有一個我很喜歡的地方:

它不是只讓 AI 推一個答案。

它要求 AI 必須具備「第二層思考」:

  • 不只要能提出最強者
  • 還要能理解最強者的弱點
  • 再進一步提出針對這個弱點的答案

這會逼迫 AI 做出比較像真正玩家的推理。

因為競技環境從來不是單點靜止的。

它是一個:

  • 主流誕生
  • 對策出現
  • 對策被再反制

的循環。

如果一個 AI 只能講出「最強是什麼」,卻講不出「最強怕什麼」,那它離真正的 Meta 理解還差很遠。


我實際使用的 Prompt:不是問「哪隊最強」,而是要求 AI 交出整套作戰報告

我這次不是用很短的提問,例如:

  • 「幫我推薦《Pokémon Champions》最強隊伍」
  • 「現在單打最強寶可夢是什麼?」
  • 「雙打上分隊伍怎麼組?」

這類 Prompt 的問題在於,它太容易讓 AI 回到「泛泛而談的推薦模式」。

它可能會列幾隻熱門寶可夢,講一些大家都知道的強勢原因,但不一定真的能產出一份能拿去實戰的成品。

所以我一開始就把任務框得非常明確。

我不是要 AI 跟我閒聊。

我是要它直接扮演研究員兼隊伍建構顧問。

以下就是我這次實際使用、並同時丟給 ChatGPTGemini 的核心 Prompt:

我目前正在遊玩《Pokémon Champions》,這是一款以單打(Single)與雙打(Double)為主的回合制對戰遊戲,重點在於 PVP 對戰與排名提升。

我的目標是提升排位並穩定連勝,因此需要你根據「目前可取得的最新對戰環境資訊(Meta)」幫我設計最強隊伍。

請依據以下要求,提供完整且可實戰的配置:

【任務目標】
1. 建立一隊「最強單打隊伍(Single Battle Team)」6 Pick 3
2. 建立一隊針對上面「最強單打隊伍(Single Battle Team)」的克制隊伍 6 Pick 3
3. 建立一隊「最強雙打隊伍(Double Battle Team)」6 Pick 4
4. 建立一隊針對上面「最強雙打隊伍(Double Battle Team)」的克制隊伍 6 Pick 4

【每一隻寶可夢需提供】
- 寶可夢名稱(中文為主)
- 屬性與定位(如:物攻手 / 特攻手 / 輔助 / 坦克 / 控場)
- 特性(Ability)
- 攜帶道具(Item)
- 性格(Nature)
- 努力值分配(EV spread),《Pokémon Champions》為 66 點分配
- 技能配置(Moveset,4 招)
- 戰術說明(該寶可夢在隊伍中的用途與操作方式)

【整隊需補充】
- 核心戰術(例如:天氣隊、空間隊、速攻隊、控場隊等)
- 對戰開場策略(Lead 建議),使用 Mermaid 圖表做成局勢判斷,應該派誰上場
- 優勢對局與劣勢對局分析
- 替換選項(如果部分寶可夢無法取得)

【重要限制】
- 以「目前 Pokémon Champions 已登場的寶可夢、機制與道具」為基準
- 優先考慮當前主流(Meta)與高勝率組合
- 避免過於理論化,需偏實戰可操作
- 若資料不足,可參考 Pokémon VGC 或 Smogon OU 作為推論基準

【輸出格式】
請用「清楚分段 + 表格 + 條列」方式呈現,讓我可以直接照著組隊使用。

這段 Prompt 真正重要的地方,不只是字很多。

而是它同時做了幾件很關鍵的事。

1. 先定義任務,不讓 AI 自己猜題

很多人用 AI 效果不好,並不是模型太弱。

而是你把題目丟得太模糊。

如果你只問「最強隊伍是什麼」,AI 很可能只會回你一個籠統答案。

但當你把任務拆成:

  • 單打最強
  • 單打對策
  • 雙打最強
  • 雙打對策

AI 就被迫從「推薦清單模式」進入「結構化推理模式」。

它不能只講一套,而是必須考慮整個環境的互相剋制關係。

2. 先定義輸出欄位,避免它只講概念不講配置

這也是我很在意的一點。

因為如果你沒有要求:

  • 特性
  • 道具
  • 性格
  • EV 分配
  • 招式
  • 戰術用途

AI 很容易只給你一種「方向正確但無法直接照抄」的答案。

而我這次的目標不是聽理論.

我是要拿來上分。

所以我會直接要求它把每一隻寶可夢當成一個完整配置單位來交付。

這也是為什麼最後生成出來的報告,會更像真正的隊伍建構文件,而不是普通聊天回覆。

3. 先給推論邊界,允許它參考 VGC 與 Smogon,但不能亂飛

《Pokémon Champions》本身是新遊戲。

所以我在 Prompt 裡刻意補了一條非常重要的限制:

若資料不足,可參考 Pokémon VGC 或 Smogon OU 作為推論基準。

這句話其實很關鍵。

因為它等於告訴 AI:

  • 可以推論
  • 但推論必須有根
  • 根要來自既有對戰體系,而不是憑空幻想

這能大幅降低那種「看起來很聰明、實際上完全不符合 Meta」的回答。

4. 我要求 Mermaid,不只是為了好看,而是想逼 AI 畫出決策流程

這一點是很多人比較少用,但我自己覺得特別有用的地方。

我要求 AI 在開場策略裡加入 Mermaid 圖表,不是為了排版花俏。

而是因為:

當 AI 必須把「什麼對局該先發誰」畫成流程圖時,它就不能只停留在口頭描述。

它必須顯式表達:

  • 如果遇到高速壓制怎麼辦
  • 如果看到空間手怎麼辦
  • 如果對方明顯帶天氣軸怎麼辦

這會逼它把原本隱性的判斷流程攤開來。

而一旦這些判斷被攤開,整份報告就會從「意見」更靠近「可驗證的戰術邏輯」。

5. 真正有效的 Prompt,不是越華麗越好,而是越能限制任務越好

這次做完之後,我最大的心得之一就是:

很多人以為 Prompt Engineering 是把句子寫得很玄、很像在下咒語。

但其實真正有用的 Prompt,往往只是做到幾件樸素但重要的事:

  • 定義目標
  • 定義範圍
  • 定義輸出格式
  • 定義判準
  • 定義可以推論到哪裡、不能推論到哪裡

你給 AI 的框架越清楚,它越容易把算力花在推理上,而不是花在猜你的意思。

而這也是為什麼,同樣是 Deep Research,有些人拿到的是一份很普通的整理文,有些人拿到的卻是一份看起來真的像研究報告的東西。

差別很多時候,不在模型本身,而在你怎麼下題目。


系列下一篇

如果你想直接看兩個模型真正的差異,我在中篇會專門拆:

  • ChatGPT 的報告為什麼更像戰術教練
  • Gemini 的報告為什麼更像 Meta 情報分析師
  • 兩份報告真正的差異,為什麼不在寶可夢名單,而在思考姿態

下一篇: AI 戰術大進擊(中):ChatGPT vs. Gemini,兩份報告真正差在哪裡?