2025年5月21日

車品覺
May 28, 2025
2 min read

RAG與MCP互補更強大如果你已經是ChatGPT（或同類工具）的常客，那麼你對生成式語言模型的三大缺陷應該不會陌生，有否覺得以下問題似曾相識： 1. 大語言模型依賴公共數據訓練，但企業需要的是整合動態變化的專有訊息（如內部文檔、實時數據），傳統模型無法直接調用這些數據，導致生成結果與業務需求脫節。 2. 即使模型定期更新，其訓練數據的「截止日期」與實際應用時間始終存在差異。例如金融或醫療領域的最新政策、研究可能未被覆蓋，影響輸出準確性。 3. 幻覺與歸因缺失：模型不時生成看似合理、但與事實背道的「幻覺」內容，且缺乏引用資訊來源，用戶難以驗證真偽。這在專業場景（如法律諮詢）風險極高。檢索增強生成（RAG）技術在解決以上問題時，優勝之處在於它像給大模型裝了個「外接大腦」，從外部大量資料提取最新和最相關的訊息，為大模型作補充。然而，最近有一說法認為「模型上下文協議」（MCP）技術可以把RAG取而代之。那MCP又是什麼？MCP是一種通過長時記憶，經過較長時間用戶累積的上下文處理，以提升生成模型性能的方案，其核心在於強化模型對動態知識的持續學習和應用能力。該方法依賴一個專門設計的「記憶模塊」儲存長期數據，例如業務規則、用戶習慣或歷史交互紀錄。這些數據可以更新動態，確保模型對變化的訊息保持敏感度。在交互過程中，MCP模型可以通過用戶的反饋，不斷優化其「記憶模塊」的知識，提升後續生成內容的準確度和相關性。主要優勢在於它能針對個性化需求，理解用戶的具體需要，特別適合應用於客戶服務或個性化推薦等場景。此外，由於「記憶模塊」能夠實時更新，MCP在處理長期用戶交互時表現尤為出色。可是MCP也有一定局限性。首先，如果「記憶模塊」的數據不夠全面或存在偏差，可能導致生成內容失真。其次，MCP的優勢主要體現在需要長期交互和持續知識累積的場景中，對於那些需要快速檢索最新訊息的場景，它的適用性相對低。筆者比較相信RAG與MCP兩種方向並不是對立，也可結合使用通過儲存長時記憶的能力，再配合快速檢索新動態的優勢，可產生更強大的大模型系統。