top of page

2024年5月29日

GPT-4o擅長識別情感具突破性 美企OpenAI近日發布新一代旗艦模型GPT-4o,這不僅是技術上的一次飛躍,也在人工智能(AI)與人類交互方式開闢了新道路。GPT-4o突顯了多模態輸入及輸出能力。多模態能力意指,它能同時處理文本、圖像和音頻數據之間的即時反饋和交互能力,例如以文字描述一個問題時,用戶可以加入圖像作補充;當AI應對時,又可以選擇生成音頻答案作輸出。 GPT-4o改善了回應速度,幾乎達到人類實時對話的流暢度。從技術數據來看,GPT-4o能在232毫秒內回應音頻輸入,這速度與人類對話的自然停頓相若,極大地增強了用戶體驗。這改進不僅讓AI助手在日常使用表現更趨自然,亦使它在緊急情況下提供指導和幫助,變得更加可行和高效。 情感識別能力是GPT-4o另一大突破。在直播示範中,ChatGPT能夠識別並了解用戶情緒,如透過聲音的抑揚頓挫來感知用戶壓力,並提出相應的建議來紓緩情緒。這種情感互動能力,使AI不僅僅是一個執行命令的工具,更是一個能夠提供情感支持的夥伴。 介面和用戶交互方面,OpenAI帶來了新變化。在新的桌面和手機應用介面,能夠通過快捷鍵和直接擷取熒幕討論等功能,用戶能更快速、更自然地與ChatGPT交流。這種設計不僅提升了效率,也讓用戶體驗更加流暢和愉悅。 OpenAI是次發布的「免費優先」產品理念和策略,也是值得注意的一點。這方針可能會加速AI技術普及和應用,尤其是在教育和開發的低資源地區,免費高質量AI服務,可能會帶來變革性影響。 在技術和應用上,雖然GPT-4o展示了顯著進步,但其推出亦引發批評和擔憂。有觀點認為,儘管GPT-4o能力多麼強大,OpenAI並未發布外界更為期待的GPT-5,這可能表明在更高級別的AI開發路上遇到障礙。筆者覺得,還有另一個可能性,就是隱藏實力,讓對手更難掌握其真正發展趨勢,我們不妨拭目以待。

Recent Posts

See All
AI重新定義網安行業

如果你在5年前問我網絡安全行業會走向何方,我會告訴你一個穩定增長的答案;但到了今天,答案完全不同。這個行業正在經歷一場結構性的重塑─不是線性的擴張,而是多重力量的疊加爆發。 全球網絡安全市場在2026年已達2480億美元,預計2034年將增長到7000億美元,年複合增長率13.8%。然而,更有趣的是某顧問公司的另一個數字,人工智能(AI)正在把這個市場的總可及規模推高至2萬億美元。為什麼?因為網絡

 
 
AI引發全球工作大洗牌

人工智能(AI)正在以深刻且不可逆轉的方式重塑經濟,以美國為例,從勞動力市場崗位結構到企業競爭格局,從生產率增長到行業營運模式,AI的影響已開始滲透到經濟體的核心。AI創造新機會的同時,也在打破舊有秩序。 美國哈佛大學的一項研究,透過分析美國人口普查數據,建構了「職業流失率」這一獨特指標。研究發現,1990年至2017年間,美國勞動力市場經歷了非常穩定的低流失期,但從2019年開始,變革驟然而至,

 
 
歐洲AI開闢新路向

我之前在文章裏說過,人工智能(AI)競爭正在從技術參數之爭,轉向「數據管道、標準制定、規模落地」的全鏈條控制權之爭。最近歐洲的舉動,恰好印證這個判斷,也帶來一個有趣的問題:歐洲AI能否走出一條有別於中美的新道路? 德國上月啟動了「人工智能創新園」,總投資數十億歐羅,號稱歐洲迄今最完整的AI產業集群。布局的方向很明確:工業AI、智能製造、自動駕駛、智能物流、AI倫理與安全,全是「製造業+人工智能」的

 
 
bottom of page