n8n RAG 與 Voice Agent 補充教材
這份筆記整理自
260411_素養班_Day5.pdf中與 RAG、Voice Agent、Voice RAG Agent 相關的內容,目的是把你從一般 AI workflow 再往知識檢索與語音互動推進一步。
想一想
RAG 的直覺很簡單:不要只叫 AI 憑印象回答,而是先幫它找到相關資料,再讓它根據資料回答。這就像你問同事一個公司制度問題,如果他只是憑記憶回答,可能會錯;如果他先查最新 SOP,再整理給你,可信度就比較高。RAG 的價值不在於讓模型變神,而是讓回答更貼近你提供的文件。
Voice Agent 也是同樣邏輯,只是入口變成語音。語音本身不是重點,重點是語音轉成文字後,後面仍然要走資料整理、判斷、查詢、輸出這些步驟。新手不要一開始就做完整語音助理,可以先做文字版 RAG,確認資料能被正確檢索,再加語音輸入或語音輸出。這樣你會清楚知道問題出在語音辨識、文件檢索、prompt,還是輸出格式。
本篇怎麼讀
- 學習目標:理解 RAG、Voice Agent、Voice RAG Agent 在 n8n 中的結構
- 先修需求:已看過 07 n8n + OpenAI 實作範例集 與 08 n8n Agent 基礎補充教材
- 讀完後你應該能:解釋 RAG 的流程、知道 Voice Agent 多了哪些步驟、理解這些概念怎麼應用到不同語音或知識檢索案例
1. RAG 是什麼
RAG 的核心不是「更聰明」,而是:
- 先找資料
- 再回答
基本流程是:
- 使用者提問
- 系統先檢索相關內容
- 把相關內容交給模型
- 模型根據資料生成回答
這和直接問模型的差別是:
- 不只靠模型記憶
- 回答更靠近你的資料
- 比較適合企業或內部知識
2. RAG in n8n 的基本結構
PDF 中提到 embedding、Qdrant、retrieval tool,整理成教學就是:
資料來源 -> 切分 -> Embedding -> Vector DB -> Retrieve -> Agent -> 回答
2.1 Embedding
把文字轉成向量表示,方便搜尋語意相近內容。
2.2 Vector DB
像 Qdrant 這類向量資料庫,負責存放向量與檢索。
2.3 Retrieval
當使用者提問時,先找最相關片段。
2.4 Agent
Agent 根據檢索到的內容產生回答。
這裡最重要的理解是:
RAG 不是模型知道更多,而是流程先幫模型找到該看的資料。
3. 為什麼 RAG 很重要
適合的場景:
- 公司內部知識庫
- 課程教材問答
- SOP 查詢
- 文件檢索
- 醫院內部流程說明
RAG 的優點:
- 降低幻覺
- 回答更有來源依據
- 易於更新資料,不用重訓模型
限制:
- 如果資料來源本身差,回答也不會好
- chunking、索引、檢索策略會影響結果
4. Voice Agent 是什麼
Voice Agent 可以理解成:
語音輸入 -> 語音轉文字 -> Agent 處理 -> 回傳
其中多出來的關鍵步驟是:
- 語音轉文字
- 有時再加文字轉語音
所以 Voice Agent 其實不是完全不同的東西,而是:
Agent workflow + 語音介面
5. Voice RAG Agent 是什麼
Voice RAG Agent 可以理解成:
語音 -> 轉文字 -> 檢索 -> Agent -> 生成回答 -> 文字轉語音
它把三層合起來:
- 語音
- RAG
- Agent
這種流程很適合:
- 語音客服
- 語音查詢知識庫
- 語音助理
- 語音輔助臨床資訊查詢
6. 這和語音記錄案例有什麼關係
對你最直接有用的不是完整 Voice RAG demo,而是這個觀念:
6.1 語音先轉 transcript
不要直接把語音當正式紀錄或最終輸出。
6.2 transcript 再進入 workflow
可以做:
- 結構化抽取
- 重點整理
- 草稿生成
- 待辦或提醒抽取
6.3 若未來加知識檢索
可以讓系統:
- 查內部 SOP
- 查產品或服務說明
- 查客服知識庫
- 查課程教材或作業規範
但這部分更像輔助查詢,不應直接替代需要專業責任的正式判斷。
7. 用教學角度看,這份 PDF 最值得吸收的部分
如果不是要完全複製課堂 demo,而是要吸收架構,最值得留下的是:
- RAG 的概念框架
- Voice Agent 的流程觀念
- Voice RAG Agent 的組成
- tool + retrieval + model 的關係
反而不是每個安裝指令或每個 LINE 操作細節都要照搬進你的主教材。
8. 你未來可以怎麼擴充
對你目前的教學與專案,可以往這幾個方向發展:
8.1 教學擴充
- 做一篇
RAG in n8n 教材 - 做一篇
Voice transcript workflow 教材
8.2 workflow 擴充
- transcript → OpenAI 結構化抽取
- transcript → handoff summary
- transcript → nursing note draft
- transcript → retrieval SOP lookup
8.3 系統擴充
- 語音前端 + OpenAI Realtime
- n8n 接 transcript
- 需要時再加 retrieval
本篇練習
- 用自己的話解釋 RAG 是什麼。
- 畫出
Voice Agent和Voice RAG Agent的差別。 - 想一個你自己的工作場景,判斷它到底需要不需要 RAG。
下一步建議
如果你要把這些概念變成實作,下一步最適合做:
RAG in n8n workflow JSON- 或
Voice transcript + structured extraction workflow JSON