top of page

Sora降內容創作門檻

早前美企OpenAI發布首個文字生成視頻模型Sora,把文字生成技術應用於視覺媒體創作上。官網已上傳了示範影片,影片長達60秒。示例中,Sora不僅能準確呈現高度細緻的背景、複雜多角度鏡頭,還能理解物體在物理世界的存在,並生成具有豐富情感的角色。Sora似乎是一個創新的突破,此類模型對影視製作、遊戲開發、虛擬實境等領域來說,都是一個巨大飛躍。這樣的技術能大幅降低創建精細視覺內容的門檻,並可能開啟未來全新的創意表達方式。 其中一個情節中,模型能夠解讀文本中對場景的描述,當輸入提示「東京街頭」、「充滿溫暖霓虹燈光和動感城市標誌的街道」、「時髦的女士」、「黑色皮褸」和「紅色裙子」,Sora便能夠把這些描述轉化為視覺效果,創造出合適的角色及環境。在生成的影片中,主角(女士)行走的動作連貫和穩定,這需要高度的動作捕捉和渲染能力。 模型能夠提供從不同角度捕捉場景,包括全景和特寫等,這樣的切換可為視頻添加敍事深度。模型亦能反映細節,例如「潮濕的街道地面反射霓虹燈的光影效果」,顯示出模型在處理光線和材質方面的進階能力。這種技術能大幅度提升影視製作的效率,尤其是在預視(Previsualization)、概念藝術創作和動畫製作等方面。此外,還可以為廣告、遊戲場景設計和虛擬現實創造更加豐富和互動的體驗。 有專家發表對Sora的感想,他表示內容創作行業已徹底改變,並且毫不誇張地說入行20年了,這次真的讓他無言,動畫藝術家們有麻煩了。技術壁壘大大移除,反而內容背後的「構思」和故事,將變得更為重要。 Sora模型當前亦存在弱點,它可能難以準確地模擬和類比複雜場景的物理原理,例如物體如何在不同條件下相互作用、運動和反應。在影片內容製作中,這可能導致生成的敍事,在邏輯上不連貫或缺乏說服力。 舉例來說,假設要創作一個玻璃杯從桌子上滾落並破裂的場景,現時的模型生成一個看似合理的場景,但在處理杯子破裂時的碎片飛散、液體溢出和玻璃碎裂次序、聲音效果,以及與其他物體的互動等,可能會顯得不自然或不準確。當然,通過用戶反饋,相信很快會迭代改善,這亦是該類模型最巧妙之處。

Recent Posts

See All
AI重新定義網安行業

如果你在5年前問我網絡安全行業會走向何方,我會告訴你一個穩定增長的答案;但到了今天,答案完全不同。這個行業正在經歷一場結構性的重塑─不是線性的擴張,而是多重力量的疊加爆發。 全球網絡安全市場在2026年已達2480億美元,預計2034年將增長到7000億美元,年複合增長率13.8%。然而,更有趣的是某顧問公司的另一個數字,人工智能(AI)正在把這個市場的總可及規模推高至2萬億美元。為什麼?因為網絡

 
 
AI引發全球工作大洗牌

人工智能(AI)正在以深刻且不可逆轉的方式重塑經濟,以美國為例,從勞動力市場崗位結構到企業競爭格局,從生產率增長到行業營運模式,AI的影響已開始滲透到經濟體的核心。AI創造新機會的同時,也在打破舊有秩序。 美國哈佛大學的一項研究,透過分析美國人口普查數據,建構了「職業流失率」這一獨特指標。研究發現,1990年至2017年間,美國勞動力市場經歷了非常穩定的低流失期,但從2019年開始,變革驟然而至,

 
 
歐洲AI開闢新路向

我之前在文章裏說過,人工智能(AI)競爭正在從技術參數之爭,轉向「數據管道、標準制定、規模落地」的全鏈條控制權之爭。最近歐洲的舉動,恰好印證這個判斷,也帶來一個有趣的問題:歐洲AI能否走出一條有別於中美的新道路? 德國上月啟動了「人工智能創新園」,總投資數十億歐羅,號稱歐洲迄今最完整的AI產業集群。布局的方向很明確:工業AI、智能製造、自動駕駛、智能物流、AI倫理與安全,全是「製造業+人工智能」的

 
 
bottom of page