top of page

開源AI創造經濟價值

早前Meta發布最新的開源大型語言模型Llama 3.1系列,這系列模型包括8B、70B和405B三種參數規模。其中405B參數規模的模型,在多項基準測試表現出色,超越了OpenAI的GPT-4o,並可媲美其他領先的閉源模型,例如Claude 3.5 Sonnet。Meta創辦人朱克伯格表示,Llama 3.1版本是行業的一個轉折點,預示着開源人工智能(AI)將成為未來主流。 在此次發布中,Llama 3.1版本的模型不僅在規模上有所擴展,還增加了上下文窗口的大小,從原來的8K增至128K,擴大了15倍,同時支援8種語言。尤其是405B模型,使用了超過15萬億個Tokens訓練,期間採用了1.6萬顆H100 GPU(繪圖處理器),是首個能達到如此規模的模型。評估了超過150個基準數據集後,Llama 3.1 405B模型在常識推理、操作性、數學等任務的表現,可比擬GPT-4、GPT-4o和Claude 3.5 Sonnet。同時,規模較小的8B和70B模型表現,與其他同等規模的開源和閉源模型不遑多讓。 在實際場景應用中,Llama 3.1 405B模型的整體性能,優於GPT-4o及Claude 3.5 Sonnet。Meta還更新了開源許可,允許開發者使用Llama模型(包括405B)的輸出以改進其他模型。儘管目前圖像、影片及語音整合功能還在開發,並未正式發布,但Meta指未來版本會整合這些功能。 筆者非常認同,開源AI能夠促進創新、降低成本和提高安全性。開發者亦可以利用開源模型來訓練、微調自己的模型,以滿足不同需求。 此外,開源模型的使用成本更低,效率更高,特別在運行推理任務時,成本約為封閉模型的一半,這使開發者能在自己的基礎設施上操作,加強數據安全。 開源AI代表着世界上最大的經濟契機和安全保障,也可以創造更大的經濟價值和更高的全球安全水平。至今為止,所有版本的Llama模型已超過3億次下載量,其廣泛受歡迎的程度和影響力已不言而喻。至於開源與閉源大模型之爭,其實也取決於數據開放程度和算力效率等。

Recent Posts

See All
AI重新定義網安行業

如果你在5年前問我網絡安全行業會走向何方,我會告訴你一個穩定增長的答案;但到了今天,答案完全不同。這個行業正在經歷一場結構性的重塑─不是線性的擴張,而是多重力量的疊加爆發。 全球網絡安全市場在2026年已達2480億美元,預計2034年將增長到7000億美元,年複合增長率13.8%。然而,更有趣的是某顧問公司的另一個數字,人工智能(AI)正在把這個市場的總可及規模推高至2萬億美元。為什麼?因為網絡

 
 
AI引發全球工作大洗牌

人工智能(AI)正在以深刻且不可逆轉的方式重塑經濟,以美國為例,從勞動力市場崗位結構到企業競爭格局,從生產率增長到行業營運模式,AI的影響已開始滲透到經濟體的核心。AI創造新機會的同時,也在打破舊有秩序。 美國哈佛大學的一項研究,透過分析美國人口普查數據,建構了「職業流失率」這一獨特指標。研究發現,1990年至2017年間,美國勞動力市場經歷了非常穩定的低流失期,但從2019年開始,變革驟然而至,

 
 
歐洲AI開闢新路向

我之前在文章裏說過,人工智能(AI)競爭正在從技術參數之爭,轉向「數據管道、標準制定、規模落地」的全鏈條控制權之爭。最近歐洲的舉動,恰好印證這個判斷,也帶來一個有趣的問題:歐洲AI能否走出一條有別於中美的新道路? 德國上月啟動了「人工智能創新園」,總投資數十億歐羅,號稱歐洲迄今最完整的AI產業集群。布局的方向很明確:工業AI、智能製造、自動駕駛、智能物流、AI倫理與安全,全是「製造業+人工智能」的

 
 
bottom of page