top of page

2025年5月21日

RAG與MCP互補更強大 如果你已經是ChatGPT(或同類工具)的常客,那麼你對生成式語言模型的三大缺陷應該不會陌生,有否覺得以下問題似曾相識: 1. 大語言模型依賴公共數據訓練,但企業需要的是整合動態變化的專有訊息(如內部文檔、實時數據),傳統模型無法直接調用這些數據,導致生成結果與業務需求脫節。 2. 即使模型定期更新,其訓練數據的「截止日期」與實際應用時間始終存在差異。例如金融或醫療領域的最新政策、研究可能未被覆蓋,影響輸出準確性。 3. 幻覺與歸因缺失:模型不時生成看似合理、但與事實背道的「幻覺」內容,且缺乏引用資訊來源,用戶難以驗證真偽。這在專業場景(如法律諮詢)風險極高。 檢索增強生成(RAG)技術在解決以上問題時,優勝之處在於它像給大模型裝了個「外接大腦」,從外部大量資料提取最新和最相關的訊息,為大模型作補充。然而,最近有一說法認為「模型上下文協議」(MCP)技術可以把RAG取而代之。 那MCP又是什麼?MCP是一種通過長時記憶,經過較長時間用戶累積的上下文處理,以提升生成模型性能的方案,其核心在於強化模型對動態知識的持續學習和應用能力。該方法依賴一個專門設計的「記憶模塊」儲存長期數據,例如業務規則、用戶習慣或歷史交互紀錄。這些數據可以更新動態,確保模型對變化的訊息保持敏感度。 在交互過程中,MCP模型可以通過用戶的反饋,不斷優化其「記憶模塊」的知識,提升後續生成內容的準確度和相關性。主要優勢在於它能針對個性化需求,理解用戶的具體需要,特別適合應用於客戶服務或個性化推薦等場景。此外,由於「記憶模塊」能夠實時更新,MCP在處理長期用戶交互時表現尤為出色。 可是MCP也有一定局限性。首先,如果「記憶模塊」的數據不夠全面或存在偏差,可能導致生成內容失真。其次,MCP的優勢主要體現在需要長期交互和持續知識累積的場景中,對於那些需要快速檢索最新訊息的場景,它的適用性相對低。 筆者比較相信RAG與MCP兩種方向並不是對立,也可結合使用通過儲存長時記憶的能力,再配合快速檢索新動態的優勢,可產生更強大的大模型系統。

Recent Posts

See All
AI重新定義網安行業

如果你在5年前問我網絡安全行業會走向何方,我會告訴你一個穩定增長的答案;但到了今天,答案完全不同。這個行業正在經歷一場結構性的重塑─不是線性的擴張,而是多重力量的疊加爆發。 全球網絡安全市場在2026年已達2480億美元,預計2034年將增長到7000億美元,年複合增長率13.8%。然而,更有趣的是某顧問公司的另一個數字,人工智能(AI)正在把這個市場的總可及規模推高至2萬億美元。為什麼?因為網絡

 
 
AI引發全球工作大洗牌

人工智能(AI)正在以深刻且不可逆轉的方式重塑經濟,以美國為例,從勞動力市場崗位結構到企業競爭格局,從生產率增長到行業營運模式,AI的影響已開始滲透到經濟體的核心。AI創造新機會的同時,也在打破舊有秩序。 美國哈佛大學的一項研究,透過分析美國人口普查數據,建構了「職業流失率」這一獨特指標。研究發現,1990年至2017年間,美國勞動力市場經歷了非常穩定的低流失期,但從2019年開始,變革驟然而至,

 
 
歐洲AI開闢新路向

我之前在文章裏說過,人工智能(AI)競爭正在從技術參數之爭,轉向「數據管道、標準制定、規模落地」的全鏈條控制權之爭。最近歐洲的舉動,恰好印證這個判斷,也帶來一個有趣的問題:歐洲AI能否走出一條有別於中美的新道路? 德國上月啟動了「人工智能創新園」,總投資數十億歐羅,號稱歐洲迄今最完整的AI產業集群。布局的方向很明確:工業AI、智能製造、自動駕駛、智能物流、AI倫理與安全,全是「製造業+人工智能」的

 
 
bottom of page