Hi~ 我是 Eric! 👋
在 上一篇文章 中,我們快速導覽了 NotebookLM 「工作室 (Studio)」裡的各種強大武器。今天,我們要來深挖這座工廠裡最受歡迎、也是最具有「魔力」的第一個功能 —— 語音摘要 (Audio Overview)。
老實說,自從 NotebookLM 支援了自定義語音摘要後,我通勤時間的學習效率簡直翻倍。不再是聽那些死板的機器朗讀,而是像在聽一場關於技術的精彩 Podcast! 🚀
為什麼要用「對話」來學習?
在進入功能介紹前,我想先聊聊為什麼 Google 要花這麼多心思把摘要做成「兩個人在聊天」的格式?
從學習心理學的角度來看,對話模式(Dialogue-based Learning 有幾個天然優勢:
- 降低認知負荷:人類大腦天生擅長處理社交資訊。比起閱讀生硬的條列式文件,聽兩個人互動、舉例、甚至互相吐槽,會讓大腦覺得「這不是在讀書,是在聽故事」,學習壓力會小很多。
- 多維度的詮釋:對話中會包含「喔!原來是這樣」、「那如果遇到…怎麼辦?」這種情緒化與情境化的引導,這能幫助我們從不同的角度理解同一個技術概念。
- 適合碎片化時間:身為工程師,眼睛盯著螢幕一整天已經夠累了。語音摘要讓你能在開車、洗碗或健身時,依然能「無痛」吞下最新的技術規格。
語音摘要:自訂選項全解析
進入「工作室」點擊語音摘要後,你會看到右側有一個「自訂 (Customize)」ICON 按鈕。這就是魔法發生的地方!

1. 四大核心格式 (Format) 與策略搭配
現在你不只能讓他們聊天,更重要的是如何針對不同的來源屬性選擇正確的格式,才能發揮最大的轉化效果:
- 深入探索 (Deep Dive):
- 場景:學習新技術(如:第一次接觸 Gemini CLI 的 Extensions 機制)。
- 搭配策略:當你手上有完整的文件,且需要建立系統化的認知時。這兩位主講人會幫你把生硬的 Spec 轉化為「為什麼要這樣設計」的脈絡。
- 摘要 (Summary):
- 場景:追蹤技術更新(如:閱讀 Gemini CLI 的 Changelog)。
- 搭配策略:適合「資訊過濾」。如果你只想知道這週的 Patch 更新了哪些參數,不需要深度討論,用摘要能在三分鐘內幫你對齊資訊。
- 評論 (Review):
- 場景:專案優化與 Code Review。
- 搭配策略:這是開發者的隱藏玩法! 把你寫好的技術方案(RFC)或專案文件 丟進去,讓 AI 擔任「資深顧問」。它會針對你的邏輯盲點提供建設性的改進建議,幫助你在專案實作前先進行一次虛擬的腦力激盪,這個功能最適合在專案初期或設計階段使用,如果想要。
- 辯論 (Debate):
- 場景:技術選型與架構決策。
- 搭配策略:當你面對「選 A 還是選 B」的糾結時(如:Monolith vs. Microservices)。把兩方的文件都餵給它,聽主講人互相拆台、分析風險,這能讓你保持客觀,避免陷入「技術信仰」的偏見。
2. 語言與長度 (Language & Length)
NotebookLM 已經支援包括繁體中文在內的多國語言。
- 語言:會根據你的來源或設定自動調整。
- 長度:可選「短」、「中 (預設)」或「長」。如果你想聽一場深度的技術專題,選「長」能挖出更多細節。
3. 設定主持人重點 (Focus Prompt)
這是一個隱藏的殺手鐧!你可以輸入 Prompt 來告訴主持人:「請特別針對 Gemini CLI 的 Hook 機制進行討論」,或是「請解釋這些功能對 Web 開發者有什麼具體好處」。這讓輸出的 Podcast 具有高度的指向性,當你的來源內容有發散性的時候,一定要針對重點做設定,避免內容太多導致產出的資訊過於分散。
實戰示範:用聽的學會 Gemini CLI Hook
延續我們系列文章的主題,我們要把 Gemini CLI 官方文件 轉化成 Podcast。
場景 A:快速理解新功能 (搭配:深入探索)
當我想知道最近剛更新的 Hook 功能是幹嘛的,我會這樣設定:
- 格式:深入探索
- 重點 Prompt:
請詳細討論 Hook 的執行生命週期,並解釋它跟傳統腳本的差異。
AI 主持人的對話可能會長這樣: 「嘿,你有看到 Gemini CLI 新出的 Hook 嗎?這超酷的,它讓你在執行指令前後能自動跑自定義腳本!」 「對啊,而且它不只是簡單的 Script,它還能讀取當前的 Session 上下文…」
場景 B:技術方案評估 (搭配:辯論)
如果我在猶豫要用 Custom Commands 還是 Hooks 來達成某個自動化目標:
- 格式:辯論
- 重點 Prompt:
針對自動化工作流,辯論使用 Custom Commands 與 Hooks 的優劣與適用場景。
這就像請了兩位技術架構師在你耳邊分析優缺點,聽完你馬上就知噢道該選哪一個。
場景 C:改善現有專案 (搭配:評論)
如果你自己開發了一個 Gemini CLI 的 Skill 或 Extension,想要精益求精:
- 格式:評論
- 重點 Prompt:
根據這份原始碼、文件與SKILLS,找出可能存在的安全性問題或效能瓶頸,並建議如何優化。這能幫你在正式上線前,多一層 AI 驅動的品質檢查。
💡 更多創意玩法
除了技術文件,還有哪些情境適合這樣玩?
- Code Review 預讀:把你要審查的 PR 改動說明與代碼丟進去,用「評論」模式聽 AI 給出的初步建議。
- 會議記錄轉化:把落落長的會議逐字稿丟進去,用「摘要」模式讓它在五分鐘內告訴你結論。
- 技術趨勢對抗:同時餵給它 React 19 與 Next.js 15 的文件,開啟「辯論」模式,聽聽看 AI 怎麼看這兩者的整合(或衝突)。
- 專案回顧:專案結束後,把整個專案的文件、討論串丟進去,讓 AI 幫你做一次「專案回顧」,分析成功與失敗的關鍵因素,為下一次專案提供寶貴的經驗教訓。
- 跨領域學習:不只技術文件,還可以把商業分析報告、用戶研究資料丟進去,讓 AI 幫你從技術與商業的雙重視角來解讀資訊,這對於產品經理或跨職能團隊特別有幫助。
總結
語音摘要不是要把文字唸出來而已,它是要透過**「社交化」**的方式,幫你過濾掉不必要的資訊噪音,並用最直覺的對話來重組知識。
下一篇,我們要介紹工作室裡的另一個視覺利器 —— 影片摘要 (Video Overview),看看 AI 怎麼把文字變成會動的教學影片。
我是 Eric,我們下次見! 👋