Hi~ 我是 Eric!🚀
這篇文章想做一件我自己覺得非常有意思、而且很有代表性的事情:
把 AI 從聊天工具,直接拉進「遊戲戰術研究員」的角色裡。
這次我拿來做實驗的題目,不是寫程式、不是做摘要、不是生企劃,而是很多人第一眼可能會覺得「這也能交給 AI?」的主題:
我同時使用了兩個模型工具:
ChatGPT的Deep ResearchGemini的Deep Research
我給它們幾乎相同的研究任務,讓它們自己去做資料搜尋、整理規則、分析環境,最後各自交出一份完整報告。
如果你想先直接看原始完整報告,我也把兩份檔案放到 Google 雲端公開檢視了:
而這個任務的結構很明確:
- 每個 AI 要產出 4 支隊伍
- 分別是:
- 最強單打隊伍
- 最強雙打隊伍
- 克制最強單打隊伍的對策隊
- 克制最強雙打隊伍的隊伍
也就是說,這不是一般的「你幫我推薦一隊寶可夢」而已。
這更像是:
而結果比我預期得還有趣。
因為這不只是「誰列的隊伍比較強」而已,而是兩個 AI 在研究方法、風格、風險偏好、組隊哲學上的差異,全部都會攤在陽光下。
這篇文章想回答的,不只是「哪個 AI 比較強」
如果你只是想看一句結論,那這篇文章可能會讓你失望。
因為我最後得到的答案,並不是單純的:
- ChatGPT 比 Gemini 強
- 或 Gemini 比 ChatGPT 強
真正有價值的地方,其實在於下面這幾個問題:
Deep Research這個功能,到底適不適合拿來做遊戲 Meta 研究?- 為什麼《寶可夢》這種 IP,會特別適合給 AI 分析?
- 當題目是「新遊戲、規則變動、資料還在形成中」時,AI 會怎麼推理?
- 同樣都叫做 Deep Research,ChatGPT 與 Gemini 的研究風格到底差在哪裡?
- 一份 AI 生成的戰術報告,到底能不能直接拿去抄?還是只能當靈感來源?
如果你平常就有在用 AI 工具,尤其是你對下面這幾種情境有興趣:
- 想知道 Deep Research 跟一般聊天模式差在哪
- 想用 AI 研究遊戲、股票、產業、產品或競品
- 想比較不同模型在「多來源推理」上的風格
- 想知道 Prompt 要怎麼下,才能讓 AI 真的做出像樣的深度報告
那這篇我會盡量寫得完整一點,也寫得誠實一點。
因為這次的重點,不只是成果,而是整個研究過程本身。
什麼是我這次用的「Deep Research」?
先講一下脈絡。
所謂的 Deep Research,不是一般那種你問一句、AI 回一段話的聊天模式。
它比較像是:
- AI 先理解你的研究目標
- 自己決定要去查哪些資料
- 交叉比對不同來源
- 整理規則、建立論點
- 最後組合成一份相對完整的研究報告
換句話說,它不是單純在「生成答案」,而是在模擬一種更接近研究助理的工作流。
這件事的重要性在於:
而遊戲 Meta,剛好就是一種非常適合驗證這種能力的題型。
因為遊戲 Meta 不是死知識。
它是:
- 規則
- 資料
- 主流傾向
- 對策思維
- 環境互剋
這五種東西交織起來的動態系統。
如果一個 AI 真的有能力做研究,那它理應不只會告訴你:
「這隻寶可夢很強。」
而應該要能進一步說明:
- 為什麼它在現在的規則下很強
- 它強在什麼隊伍結構裡
- 這個結構怕什麼
- 對手又會怎麼反制
- 反制之後,最佳解會不會再往下一層演化
而《Pokémon Champions》恰好是一個非常好的測試場。
為什麼我選《Pokémon Champions》當 Deep Research 的測試題?
因為這個題目同時具備了三個很關鍵的特性:
- 它夠新
- 它有規則變動
- 它又不是完全從零開始
這三點很重要。
如果我拿一個已經研究到爛掉、幾乎有標準答案的老題目給 AI,它只是在把現成共識重新包裝而已,很難看出研究能力。
但《Pokémon Champions》不同。
它雖然繼承了寶可夢系列的核心戰鬥邏輯,卻又有一些明顯的新機制,例如:
66 SP的能力點數分配- 單項能力上限
32 - 全員
31 IV Mega Evolution回歸- 異常狀態機率與持續回合調整
也就是說,這是一個「熟悉的骨架 + 新的規則層」。
這種題目最能測出 AI 到底是在「背答案」,還是真的能夠做交叉比對與遷移推理。
因為它不能只複製主系列既有答案。
它必須做的是:
- 先抓到新遊戲規則
- 再映射回主系列的戰術概念
- 最後判斷哪些老邏輯還成立,哪些不成立
而這正好也是我最想測的能力。
為什麼「寶可夢」這個 IP,如此適合作為 AI 分析的對象?
這是我在做完這次實驗後,感受最強烈的一件事。
我甚至覺得,如果你真的想看 AI 在「多來源推理、規則理解、結構化分析」上的能力,寶可夢幾乎是教科書級的測試題材。
原因至少有三個。
1. 世界第一 IP 的數據紅利
作為全球價值最高、影響力最深的媒體 IP 之一,寶可夢在過去三十年間累積了極其龐大的數位資料資產。
這些資料不是只有角色設定而已,而是非常具體、非常可運算的內容,包括:
- 寶可夢圖鑑資料
- 種族值
- 屬性相剋
- 招式表
- 特性表
- 道具效果
- 歷代賽制規則
- VGC 與單打環境的戰術分析
- 玩家社群長年累積的攻略、隊伍文章與比賽討論
這代表什麼?
代表 AI 在訓練階段、或在推理階段透過搜尋可接觸到的資訊,遠比一般遊戲來得完整。
對 AI 來說,寶可夢不是一個「資料荒原」,而是一個極度肥沃的知識地層。
它天然就有非常厚的「戰術基底」。
這也是為什麼在我這次的測試中,無論是 ChatGPT 還是 Gemini,都能快速產出看起來像模像樣、而且彼此之間還有內在邏輯差異的報告。
不是因為它們在亂猜,而是因為寶可夢這個題目本來就有太多可供引用、轉譯與推理的素材。
2. 規則化的邏輯骨架
寶可夢對戰的本質,其實非常適合 AI。
因為它不是那種高度依賴模糊敘事、抽象審美或純感覺操作的題材。
它有一個非常清楚的底層特質:
所有關鍵元素幾乎都可以被形式化:
- 招式威力
- 命中率
- 優先度
- 天氣效果
- 場地效果
- 能力值變化
- 特性觸發條件
- 屬性剋制倍率
- 道具乘區
- 回合節奏
這類「規則明確、變數很多、但邊界清楚」的系統,本來就是 AI 很擅長處理的推理場景。
因為它不需要憑空創造世界觀,而是要在一個規則框架裡做最合理的推演。
這種題型,會讓 AI 的長處變得非常明顯:
- 它可以快速比對多個變數
- 可以同時思考多種隊伍組合
- 可以從大量資料裡萃取穩定的結構模式
- 可以把複雜資訊壓成結構化答案
也因此,當題目是「幫我找最強單打隊伍」、「幫我找最強雙打隊伍」、「再幫我找出克制這兩支隊的對策隊」時,AI 不會像在面對純創作題時那麼飄。
它有骨架可抓。
3. AI 的交叉比對能力,在這裡特別有價值
《Pokémon Champions》不是主系列正傳,但它的很多核心邏輯明顯是從歷代寶可夢對戰演化過來的。
這就形成一個很有趣的研究條件:
- 新遊戲有新規則
- 但新規則不是完全與歷史切斷
對 AI 來說,這等於是一個非常適合做「新舊資料交叉比對」的題目。
它可以做的事情包括:
- 把新遊戲的 SP 系統,映射到過去 EV 的思考方式
- 把《Champions》的對戰節奏,對照 VGC 或單打歷代的常見隊伍骨架
- 把目前可用的寶可夢名單,與歷代強勢角色的功能分類做比對
- 估算哪些隊伍思維能延續,哪些需要重寫
這也是為什麼在這次測試裡,我看到兩個模型都不約而同做了一件事:
它們沒有把《Pokémon Champions》當成完全陌生的新遊戲,而是把它視為一個「在寶可夢戰術體系上做規則偏移的新環境」。
這種做法其實非常合理。
而 AI 在這方面的優勢,正在於它很擅長把「新資料」與「舊結構」快速連起來。
我的實驗設計:讓兩個 AI 都交出 4 支隊伍
這次我給 Gemini 與 ChatGPT 的核心任務,大致可以濃縮成一句話:
換句話說,每個 AI 都要交出四份成果:
- 最強單打隊伍
- 最強雙打隊伍
- 克制最強單打隊伍的對策隊
- 克制最強雙打隊伍的隊伍
這個設計有一個我很喜歡的地方:
它不是只讓 AI 推一個答案。
它要求 AI 必須具備「第二層思考」:
- 不只要能提出最強者
- 還要能理解最強者的弱點
- 再進一步提出針對這個弱點的答案
這會逼迫 AI 做出比較像真正玩家的推理。
因為競技環境從來不是單點靜止的。
它是一個:
- 主流誕生
- 對策出現
- 對策被再反制
的循環。
如果一個 AI 只能講出「最強是什麼」,卻講不出「最強怕什麼」,那它離真正的 Meta 理解還差很遠。
我實際使用的 Prompt:不是問「哪隊最強」,而是要求 AI 交出整套作戰報告
我這次不是用很短的提問,例如:
- 「幫我推薦《Pokémon Champions》最強隊伍」
- 「現在單打最強寶可夢是什麼?」
- 「雙打上分隊伍怎麼組?」
這類 Prompt 的問題在於,它太容易讓 AI 回到「泛泛而談的推薦模式」。
它可能會列幾隻熱門寶可夢,講一些大家都知道的強勢原因,但不一定真的能產出一份能拿去實戰的成品。
所以我一開始就把任務框得非常明確。
我不是要 AI 跟我閒聊。
我是要它直接扮演研究員兼隊伍建構顧問。
以下就是我這次實際使用、並同時丟給 ChatGPT 與 Gemini 的核心 Prompt:
我目前正在遊玩《Pokémon Champions》,這是一款以單打(Single)與雙打(Double)為主的回合制對戰遊戲,重點在於 PVP 對戰與排名提升。
我的目標是提升排位並穩定連勝,因此需要你根據「目前可取得的最新對戰環境資訊(Meta)」幫我設計最強隊伍。
請依據以下要求,提供完整且可實戰的配置:
【任務目標】
1. 建立一隊「最強單打隊伍(Single Battle Team)」6 Pick 3
2. 建立一隊針對上面「最強單打隊伍(Single Battle Team)」的克制隊伍 6 Pick 3
3. 建立一隊「最強雙打隊伍(Double Battle Team)」6 Pick 4
4. 建立一隊針對上面「最強雙打隊伍(Double Battle Team)」的克制隊伍 6 Pick 4
【每一隻寶可夢需提供】
- 寶可夢名稱(中文為主)
- 屬性與定位(如:物攻手 / 特攻手 / 輔助 / 坦克 / 控場)
- 特性(Ability)
- 攜帶道具(Item)
- 性格(Nature)
- 努力值分配(EV spread),《Pokémon Champions》為 66 點分配
- 技能配置(Moveset,4 招)
- 戰術說明(該寶可夢在隊伍中的用途與操作方式)
【整隊需補充】
- 核心戰術(例如:天氣隊、空間隊、速攻隊、控場隊等)
- 對戰開場策略(Lead 建議),使用 Mermaid 圖表做成局勢判斷,應該派誰上場
- 優勢對局與劣勢對局分析
- 替換選項(如果部分寶可夢無法取得)
【重要限制】
- 以「目前 Pokémon Champions 已登場的寶可夢、機制與道具」為基準
- 優先考慮當前主流(Meta)與高勝率組合
- 避免過於理論化,需偏實戰可操作
- 若資料不足,可參考 Pokémon VGC 或 Smogon OU 作為推論基準
【輸出格式】
請用「清楚分段 + 表格 + 條列」方式呈現,讓我可以直接照著組隊使用。
這段 Prompt 真正重要的地方,不只是字很多。
而是它同時做了幾件很關鍵的事。
1. 先定義任務,不讓 AI 自己猜題
很多人用 AI 效果不好,並不是模型太弱。
而是你把題目丟得太模糊。
如果你只問「最強隊伍是什麼」,AI 很可能只會回你一個籠統答案。
但當你把任務拆成:
- 單打最強
- 單打對策
- 雙打最強
- 雙打對策
AI 就被迫從「推薦清單模式」進入「結構化推理模式」。
它不能只講一套,而是必須考慮整個環境的互相剋制關係。
2. 先定義輸出欄位,避免它只講概念不講配置
這也是我很在意的一點。
因為如果你沒有要求:
- 特性
- 道具
- 性格
- EV 分配
- 招式
- 戰術用途
AI 很容易只給你一種「方向正確但無法直接照抄」的答案。
而我這次的目標不是聽理論.
我是要拿來上分。
所以我會直接要求它把每一隻寶可夢當成一個完整配置單位來交付。
這也是為什麼最後生成出來的報告,會更像真正的隊伍建構文件,而不是普通聊天回覆。
3. 先給推論邊界,允許它參考 VGC 與 Smogon,但不能亂飛
《Pokémon Champions》本身是新遊戲。
所以我在 Prompt 裡刻意補了一條非常重要的限制:
這句話其實很關鍵。
因為它等於告訴 AI:
- 可以推論
- 但推論必須有根
- 根要來自既有對戰體系,而不是憑空幻想
這能大幅降低那種「看起來很聰明、實際上完全不符合 Meta」的回答。
4. 我要求 Mermaid,不只是為了好看,而是想逼 AI 畫出決策流程
這一點是很多人比較少用,但我自己覺得特別有用的地方。
我要求 AI 在開場策略裡加入 Mermaid 圖表,不是為了排版花俏。
而是因為:
當 AI 必須把「什麼對局該先發誰」畫成流程圖時,它就不能只停留在口頭描述。
它必須顯式表達:
- 如果遇到高速壓制怎麼辦
- 如果看到空間手怎麼辦
- 如果對方明顯帶天氣軸怎麼辦
這會逼它把原本隱性的判斷流程攤開來。
而一旦這些判斷被攤開,整份報告就會從「意見」更靠近「可驗證的戰術邏輯」。
5. 真正有效的 Prompt,不是越華麗越好,而是越能限制任務越好
這次做完之後,我最大的心得之一就是:
很多人以為 Prompt Engineering 是把句子寫得很玄、很像在下咒語。
但其實真正有用的 Prompt,往往只是做到幾件樸素但重要的事:
- 定義目標
- 定義範圍
- 定義輸出格式
- 定義判準
- 定義可以推論到哪裡、不能推論到哪裡
你給 AI 的框架越清楚,它越容易把算力花在推理上,而不是花在猜你的意思。
而這也是為什麼,同樣是 Deep Research,有些人拿到的是一份很普通的整理文,有些人拿到的卻是一份看起來真的像研究報告的東西。
差別很多時候,不在模型本身,而在你怎麼下題目。
系列下一篇
如果你想直接看兩個模型真正的差異,我在中篇會專門拆:
- ChatGPT 的報告為什麼更像戰術教練
- Gemini 的報告為什麼更像 Meta 情報分析師
- 兩份報告真正的差異,為什麼不在寶可夢名單,而在思考姿態