開源AI創造經濟價值

車品覺
Aug 14, 2024
2 min read

早前Meta發布最新的開源大型語言模型Llama 3.1系列，這系列模型包括8B、70B和405B三種參數規模。其中405B參數規模的模型，在多項基準測試表現出色，超越了OpenAI的GPT-4o，並可媲美其他領先的閉源模型，例如Claude 3.5 Sonnet。Meta創辦人朱克伯格表示，Llama 3.1版本是行業的一個轉折點，預示着開源人工智能（AI）將成為未來主流。在此次發布中，Llama 3.1版本的模型不僅在規模上有所擴展，還增加了上下文窗口的大小，從原來的8K增至128K，擴大了15倍，同時支援8種語言。尤其是405B模型，使用了超過15萬億個Tokens訓練，期間採用了1.6萬顆H100 GPU（繪圖處理器），是首個能達到如此規模的模型。評估了超過150個基準數據集後，Llama 3.1 405B模型在常識推理、操作性、數學等任務的表現，可比擬GPT-4、GPT-4o和Claude 3.5 Sonnet。同時，規模較小的8B和70B模型表現，與其他同等規模的開源和閉源模型不遑多讓。在實際場景應用中，Llama 3.1 405B模型的整體性能，優於GPT-4o及Claude 3.5 Sonnet。Meta還更新了開源許可，允許開發者使用Llama模型（包括405B）的輸出以改進其他模型。儘管目前圖像、影片及語音整合功能還在開發，並未正式發布，但Meta指未來版本會整合這些功能。筆者非常認同，開源AI能夠促進創新、降低成本和提高安全性。開發者亦可以利用開源模型來訓練、微調自己的模型，以滿足不同需求。此外，開源模型的使用成本更低，效率更高，特別在運行推理任務時，成本約為封閉模型的一半，這使開發者能在自己的基礎設施上操作，加強數據安全。開源AI代表着世界上最大的經濟契機和安全保障，也可以創造更大的經濟價值和更高的全球安全水平。至今為止，所有版本的Llama模型已超過3億次下載量，其廣泛受歡迎的程度和影響力已不言而喻。至於開源與閉源大模型之爭，其實也取決於數據開放程度和算力效率等。