top of page

全球算力發展三大趨勢

在6月的2025台北國際電腦展(COMPUTEX 2025)主題演講中,美國晶片巨擘輝達(Nvidia)創辦人兼行政總裁黃仁勳,首次詳細披露下一代人工智能(AI)平台,Rubin GPU(R100)採用台積電的N3P(3納米增強版)工藝,並首次商業化集成HBM4高頻寬記憶體。 最引人注目的創新是,Rubin平台將集成一顆專門的神經處理單元(NPU)作為「智能體輔助處理器」(Agent Co-processor),旨在以極低功耗高效處理AI智能體在任務上的規劃、環境感知、工具調用時的決策邏輯,把大模型的核心推理與Agent的「思考」過程在硬件層面上分離,大幅提升複雜AI任務的執行效率。 另外,台積電在本月的技術論壇宣布,其備受期待的2納米N2已順利進入風險性試產階段,首批客戶包括蘋果和輝達。更重要的是,台積電首次公開了1.6納米A16的初步技術細節。A16將採用更先進的垂直堆疊納米片電晶體(CFET)與背面供電網路(Backside Power Delivery)技術,旨在把電晶體密度和效能再提升15%至20%。此舉目的是鞏固其在2027年至2028年技術節點上的領先地位,滿足未來訓練萬億級參數模型及「通用人工智能」(AGI)系統的超龐大算力需求。 這些突破性進展,共同描繪出全球算力發展的三大核心趨勢: 1. 從「單卡算力」到「系統頻寬」:競爭焦點已不再是單個圖像處理器(GPU)的浮點運算(FLOPs)值,而是整個計算集群的系統級性能,特別是節點間的互聯頻寬及記憶體頻寬,這決定了訓練萬億參數模型時的擴展效率和實際樽頸。 2. 推理成本成為核心戰場:隨着大模型應用的普及,AI推理的總算力消耗,已開始追平甚至超過訓練的算力需求。 3. 算力異構與軟件協同:中央處理器(CPU)、GPU、神經處理單元(NPU)以及各種專用加速器(ASIC)的異構計算成為常態。勝負在於軟件棧能否無縫地協同、調度不同類型的算力資源,為開發者提供統一、高效的程式設計介面。 有這樣卓越的硬件,怎能不提一下OpenAI向開發者小規模展示的GPT-5預覽版中,一個名為「持續認知」(Persistent Cognition)」功能所引起的熱議。該功能允許模型在長達數周的時間跨度內,使用記憶與特定用戶的交互歷史和偏好,並在不同任務中主動運用這些「記憶」推理。例如,它能記住用戶是一位心臟科專家,在後續討論中自動使用更專業的醫學術語,這標誌着模型從「無狀態」工具向有狀態的個性化邁出了關鍵一步。

Recent Posts

See All
AI重新定義網安行業

如果你在5年前問我網絡安全行業會走向何方,我會告訴你一個穩定增長的答案;但到了今天,答案完全不同。這個行業正在經歷一場結構性的重塑─不是線性的擴張,而是多重力量的疊加爆發。 全球網絡安全市場在2026年已達2480億美元,預計2034年將增長到7000億美元,年複合增長率13.8%。然而,更有趣的是某顧問公司的另一個數字,人工智能(AI)正在把這個市場的總可及規模推高至2萬億美元。為什麼?因為網絡

 
 
AI引發全球工作大洗牌

人工智能(AI)正在以深刻且不可逆轉的方式重塑經濟,以美國為例,從勞動力市場崗位結構到企業競爭格局,從生產率增長到行業營運模式,AI的影響已開始滲透到經濟體的核心。AI創造新機會的同時,也在打破舊有秩序。 美國哈佛大學的一項研究,透過分析美國人口普查數據,建構了「職業流失率」這一獨特指標。研究發現,1990年至2017年間,美國勞動力市場經歷了非常穩定的低流失期,但從2019年開始,變革驟然而至,

 
 
歐洲AI開闢新路向

我之前在文章裏說過,人工智能(AI)競爭正在從技術參數之爭,轉向「數據管道、標準制定、規模落地」的全鏈條控制權之爭。最近歐洲的舉動,恰好印證這個判斷,也帶來一個有趣的問題:歐洲AI能否走出一條有別於中美的新道路? 德國上月啟動了「人工智能創新園」,總投資數十億歐羅,號稱歐洲迄今最完整的AI產業集群。布局的方向很明確:工業AI、智能製造、自動駕駛、智能物流、AI倫理與安全,全是「製造業+人工智能」的

 
 
bottom of page