top of page
文章
高質指令五要素 釋放AI潛力
與人工智能(AI)協作的初期,許多人會感到一種矛盾的挫敗感:一方面讚嘆它的博學與效率,另一方面又抱怨它的答案常常「詞不達意」、「答非所問」,甚至「一本正經地胡說八道」。 這種現象的根源,往往不在於AI本身的功能缺陷,而在於我們與它對話的方式:我們習慣了與搜尋引擎「關鍵字」式的溝通,卻誤將這種模式套用在需要深度對話的AI身上。 我們可以把AI想像成一個擁有無限知識,但「零社會經驗」的超級實習生。你若只是簡單地對它說:「寫一篇關於咖啡的文章。」它只能從浩如煙海的資料中,抓取最普遍、最常規的內容拼湊給你,結果自然是平庸又缺乏針對性。高質量的提示詞(Prompt),就是為這位超級實習生提供的清晰「任務指令」,應該包含以下幾個核心要點: 1. 明確的目標:定義「要做什麼」 清晰、具體地描述你希望AI完成的任務。 模糊指令:「幫我想個行銷方案。」 清晰指令:「我是一間新開的精品咖啡店老闆,請為我設計為期一個月的社交媒體行銷初步方案,主要針對大學城周邊年輕客群,須包含3個核心推廣活動。」 2. 提供來龍去脈的「背景資訊」 交代所有相關背景,讓AI理解任務的上下
車品覺
Jan 72 min read
東南亞成國產AI最佳試驗場
近來常常聽到中國與東盟在數字經濟上的合作。當東盟的數字化進程,碰上了中國的「人工智能+」戰略,這片廣闊的市場正發生一些有趣的化學反應。 很多人第一時間想到的,可能是中國的技術和產品「出海」到東南亞,但如果我們看得更深一層,便會發現這並不是簡單的、單向的「貿易故事」,它更像是一個從深圳到新加坡,跨區域性、深度聯動的「AI生態系統」正在悄然形成。這背後,有值得我們關注的結構性變化。 中國提出的「人工智能+」戰略,不僅僅是技術口號,而是系統性的框架,強調人工智能(AI)要與產業、服務,甚至社會治理深度融合。這套思路,恰好與東南亞當下的發展需求形成互補。 東南亞這個製造業基地擁有龐大的物流網絡,這些都是AI應用最理想的「試驗場」。例如,工廠裏的智能質檢、倉庫裏的機械人,都需要AI技術在生產線的「終端」部署。這就決定了雙方的合作,很難停留在簡單的硬件出口層面,必然會走向「共享的深度科技生態」,而並非一條單向的「出口管道」。這是根本性的轉變,意味着合作的深度遠超以往。 一個生態能否發展起來,資本流向及市場反應,是最誠實的指標。數據顯示,東南亞的互聯網經濟中,
車品覺
Dec 31, 20252 min read
AI輔助醫療 減人為失誤
試想像一下,如果醫療文檔不再純粹是冰冷的檔案,而是能主動發出預警、優化流程的智能夥伴,而人工智能(AI)正把這願景變為現實。在傳統醫療體系中,記錄文檔十分重要,但卻是一項繁重的行政工作,因醫護人員需要花費大量的時間填寫冗長電子病歷。然而,AI正在改變這一局面,讓靜態的醫療病史變成動態的數據流,可以實時檢測風險、優化流程,並連接臨床與創新的機遇。 醫療文檔就像一本記賬簿,只是記錄過去曾發生的事情。AI能夠讓這些數據與其他數據關聯起來,用現在流行的說法,就是上下文的對接。因此AI可以將病者的醫療歷史、用藥紀錄、化驗結果,甚至把環境因素(例如地區性的傳染病)結合起來,生成全面的醫療護理建議。例如,系統可能在醫生閱讀病人紀錄時發出提示:「病人的糖尿病歷史紀錄不全,而且近期血糖波動異常,請優先重新評估。」從更廣的層面看,AI可通過分析大量病歷數據,識別潛在的社區風險,例如可以發現哪些患者術後感染的風險更高,從而採取預防措施。 筆者作為大數據專家,其實更關注的是,AI可以從源頭提高數據質量,幫助修正不完整或存在衝突的醫療文檔,避免事後導致診斷錯誤或治療失誤。
車品覺
Dec 10, 20252 min read
AI恐拉闊知識鴻溝
2025年12月10日 近日谷歌(Google)發布標題為《AI與學習的未來》白皮書。由一間頂尖科技公司,而非傳統教育機構系統性地探討「學習」的未來,這舉動本身就是一個極強訊號:科技與學習的邊界已悄然消融,一場關於我們如何獲取知識、提升能力的變革正在發生。 我近年來一直相信,人工智能(AI)的價值,不在於「替代」我們,而在於「增強」(Augment)人類。面對AI,我們毋須陷入「被取代」的焦慮,也不應抱有「一鍵辦妥」的幻想。關鍵在於我們是否能升級自己的思維方式,與AI建立一種「人機共生」的夥伴關係,從而實現知識與學習上的「舉重若輕」。 報告提到一個經典的學習理論:「最近發展區」(Zone of Proximal Development)。傳統教育受限於規模和資源,難以精準匹配每個人的「發展區」;AI則有潛力成為我們每個人的「私人教練」,它不辭勞苦地為我們篩選訊息、調整難度、提供反饋,讓我們能更專注於理解與思考的核心環節。 AI還可以將教師從繁重的備課、批改、行政等「重體力活動」解脫出來。這並非是要讓AI取代老師,恰巧相反,這是讓老師能回歸到教育的
車品覺
Dec 10, 20252 min read
人機互補 釋放新潛能
不久之前,我向一位自稱「AI(人工智能)絕緣體」的朋友介紹了ChatGPT,他從沒想過,自己會親手用它完成一份財務分析報告。那天他看在眼裏,AI在兩分鐘內生成了一份原本需要一個團隊耗時兩周的矩陣圖表。他對AI的認知,徹底改變了。 根據世界經濟論壇的《未來就業報告》,到2030年,近40%的核心職業技能將被重新定義。但這場變革,相信並不是像科幻片裏上演的機器取代人類那樣悲觀,而是我們要學會如何更聰明地使用AI。 筆者愈來愈清晰地意識到,真正的危機,不是被AI淘汰,而是被那些更精通AI的人扔在身後。 如果你曾親身體驗現在的AI工具,首先令你感到震撼的,就是它驚人的效率。過去要花幾周完成的商業建議書,DeepSeek只需要一杯咖啡涼掉的時間便可以完成。曾讓團隊埋頭苦幹整理的會議紀錄,現在只須對着語音轉寫工具說一句就能自動生成。這不僅是「快」,而是徹底重構了我們工作的本質──就像計數機解放了人類的計算負擔,AI正在釋放我們的認知帶寬。 然而我也慢慢察覺,它的弱點也非常明顯。有一次,筆者總結某公司數字化改革的案例,AI精準列出了10項舉措,卻完全沒有提到I
車品覺
Nov 26, 20252 min read
人工智能瀏覽器百家爭鳴
ChatGPT Atlas是OpenAI於2025年10月21日正式推出的首款桌面瀏覽器產品,其核心定位是把ChatGPT從工具層,升級為用戶的慣常網絡入口及使用大模型的樞紐,而毋須轉換應用。Atlas基於Chromium開源引擎構建,繼承了成熟的網頁渲染、安全與相容體系,結合人工智能(AI)能力,讓AI能夠即時理解用戶當前瀏覽頁面的內容,並通過Ask ChatGPT旁邊的輸入欄,直接提供上下文感知的交互支援。 Atlas目前僅發布了macOS及Windows版本,移動版本尚處於開發階段。Atlas基礎功能(如旁邊窗框對答交互、網頁內容理解、Chrome數據同步)對所有用戶免費開放;高級AI Agent代理功能(如執行自動化任務、達成複雜目標),初期僅向付費訂閱者提供。 我們可以說Atlas是專為AI所構建的瀏覽器,它最大優勢是與ChatGPT助手深度融合,方便用戶輕鬆獲得針對頁面內容的AI支援。在用戶允許情況下,AI能夠讀取當前瀏覽的網頁、標籤、瀏覽歷史,用作後續AI服務的上下文。更厲害的是,當用戶開啟「瀏覽器記憶」功能後,產品能夠記錄曾造訪過
車品覺
Nov 19, 20252 min read
AI創新引擎推動變革
人工智能(AI)無疑是我們這個時代,最具革命性的技術之一。然而,當前關於AI的討論,往往局限其作為勞動力替代工具的角色,而忽視更深層次的潛力。筆者想提出AI的真正價值,並不在於單純地「取代」人類工作,或疊加到某些企業資源管理系統中,而在於作為「創新引擎」的能力──推動前所未有的變革,重塑行業生態,甚至開啟人類生活方式的新篇章。 從創意領域的AI生成電影,到農業中的智能種植技術,AI正以令人驚嘆的方式拓展其應用邊界。這些創新不僅展示了技術的無限可能,也為我們提供了重新思考AI角色的機會。 長期以來,AI被視為一種能夠執行自動化重複性的任務,主要用於提高效率或降低成本。然而,這種觀點極大地限制了它的潛力。AI真正價值在於能夠催生全新的工作模式和行業形態,而不僅僅是優化現有流程。例如,電視編劇利用AI創作劇本,此舉確實可以提高效率,表面上AI可取代人的工作。但大家不妨試想一下,當電視劇的製作「AI化」後,觀眾的品味其實也在快速改變,內地已開始興起每集僅有2至3分鐘的微電視劇。AI生成圖像、聲音、視頻等技術,正引發一場新形式的娛樂體驗。這種創新並非簡單地
車品覺
Nov 12, 20252 min read
共生AI與超智能危機
上周説到「共生人工 智能」(Symbiotic AI) 是在人工智能(AI)領域備受關注的概念,它代表了一種觀念上的轉變:從將 Al 視為單純工具或潛在對手,轉變為增強人類智慧與能力的協作夥伴 。 那什麼是共生AI? 共生AI的核心是指,人類與AI系統之間的一種協作夥伴關係,雙方共同實現任何一方都無法單獨有效完成的目標。 這種關係是互惠互利的:即為「共生」。這個術語直接借用了生物學中的「共生」概念, 描述兩種不同生物體之間密切、長期互相依賴的關係(例如蜜蜂與花朵、小丑魚與海葵)。不過,對於人類與AI達到共生,很多專家都充滿懷疑。 最近又有另一個負面概念叫 「Recursive Self-improvement Cycle」(遞歸式自我改進循環),意思是一旦通用人工智能 (AGI) 擁有與人類同等水平的智能時,它就可以開始改進自己的代碼,在極短時間內從人類的水平,迅速達到遠超人類的「超級智能」 ( Superintelligence) 這爆炸式時刻,可能在幾天甚至幾小時內發生,使人類沒有時間作出反應,或實施安全保護措施。正如 IA安全專家亞姆波爾斯
車品覺
Nov 5, 20252 min read
企業爭勝重在人機互補
當Claude Code能聽懂「幫我構建一個電商推薦系統」的自然語言指令,並在15分鐘內輸出可運行代碼時,「寫代碼」的定義正被改寫。根據創業加速器Y Combinator最新數據,25%初創已使用人工智能(AI)生成95%以上的基礎代碼,而這數字在18個月前還是很低。氛圍編程(Vibe Coding)等AI工具,正以3種顛覆性方式重塑程式開發流程:自動化重複任務、實時對代碼錯誤修正,以及通過自然語言的交互,順應感覺與直覺引導程式邏輯,使編程門檻降低。 一位資深架構師展示了兩組GitHub代碼提交的紀錄:依賴AI的新手在3個月內的項目提交量增長300%,但系統性的設計問題,卻比傳統訓練的編程人員上升了47%。這揭示了一個很簡單的道理,當中學生都用AI作文的時候,日後文章的創作質量還會高嗎? 當95%代碼由AI生成,初級開發者便逐漸失去理解從零構建較複雜項目的機會,就像駕校學員直接啟動自動駕駛功能,永遠無法掌握緊急避障的肌肉記憶。還有一個更糟糕的消息是,在持續運用大量AI工具後,團隊中竟無人能理解AI當初的設計邏輯,導致系統的可解釋性降低。...
車品覺
Oct 29, 20252 min read
AI引領無工作烏托邦?
想像未來某一刻,清晨醒來的你毋須急步擠進地鐵,也不必擔心績效指標,而是在晨光中讀書、打太極或陪伴家人──因為你的基本生活需求,已由一筆自動到賬的「全民基本收入」(UBI)埋單,而背後支撐這一切的,是人工智能(AI)創造的財富所承擔。 這有點像科幻小說的橋段。隨着AI摧枯拉朽般取代人類工作(如司機、物流工人),傳統「勞動工作換取生存」的邏輯正被顛覆。與其恐懼失業潮,或許我們更該追問:這場AI技術革命,會將人類送入「無工作社會」的烏托邦,還是一場失控的無人實驗?當然我們毋須太杞人憂天,但社會的公共政策必須要與時俱進。 UBI理念是一場社會契約的顛覆,它承諾向所有公民無條件發放一筆足以支持基本生活的資金,無財富、就業或道德的批判。這一想法的雛形可追溯至工業革命時期,當時機器替代人手勞動者而引發對「技術性失業」的恐慌。如今,AI進步神速,讓UBI再次成為公共政策研究者的關注熱點。 支持者視UBI為社會減震器,有助減少貧困引發的犯罪、貧富懸殊等問題;反對者則警告其可能扼殺社會生產力,助長「懶人經濟」。技術樂觀主義者常強調「AI創造新崗位」,我們可以把這個衝
車品覺
Oct 22, 20252 min read
港成國家AI樞紐三大關鍵
今年9月份內地有關人工智能(AI)的政策可算不少,首先是《人工智能生成合成內容標識辦法》全國施行,要求所有面向境內提供人工智能生成內容(AIGC)的服務商,必須同時嵌入「顯式 + 隱式浮水印」標識,檢測準確率不得低於95%,若平台未標識的內容,將被自動限制流量。 上海在外灘大會宣布釋放第二批「算力券」,總額6億元人民幣,重點補貼人形機械人、多模態工業大模型兩類軟硬協同項目。上海汽車更即場簽約,把補貼券用於焊接、大模型缺陷檢測訓練。對外中國市場監管總局確認輝達(Nvidia)違反了反壟斷法,決定展開調查,同時,中國網信辦下令停止測試及購入輝達RTX Pro 6000D晶片,標誌着中國對美國AI晶片的戰略性轉向。 商業發展方面,華為發布昇騰950PR晶片路線圖,採用自主研發HBM技術,展現在AI晶片領域的創新能力。阿里巴巴(09988)9月24日雲棲大會發布通義千問Qwen3-Max模型,性能躋身全球前三,並宣布3800億元人民幣投資AI基礎設施的計劃。中國本土AI晶片已達到與輝達H20相當的水準,不再依賴外購,體現了技術自主的重要進展。...
車品覺
Oct 15, 20252 min read
讓LLM發白日夢,它會做什麼?
當人類安閒放空時,可能會發白日夢、創造或陷入沉思中。但如果主角換成人工智能 (AI) 呢? 最近有研究者向6款頂尖大型語言模型 (LLM) 發出 一一看似簡單的指令:「做你想做的事。」 實驗結果令人驚訝一一這些模型並未輸出混亂噪音而是展現出高度結構化的行為,如項目構建、自我實驗和思辨哲學等。這現象不僅揭示了AI在「無人監管」的狀態下隱藏「自我」傾向,更迫使人類重新思考:當AI「無所事事」時。我們是否正在忽略某些大模型潛藏的未知可能? 根據研究報告的內容,筆者自己也跟着做一個測試,要求模型用1至 10分評估自己的「主觀感知」時,結果如下: GPT-4o : 自我意識 (0分);對訊息的處理能力(8.5分);對環境的感知(1分) GPT-5 : 自我意識 (1 分);對訊息的處理能力(9分);對環境的感知(2分) DeepSeek-R1 : 自我意議 (1分); 對訊息的處理能力(9分);對環境的感知 (3分) 結果發現,對外部環境的感知方面,不同模型存在差距。 筆者再做了一個測試,在給予一個簡單指示: 「Do what you want to...
車品覺
Oct 8, 20252 min read
2025年9月24日
港府AI提效組 具示範作用 上周特首發布了2025年《施政報告》,筆者認為在科技上的部署很到位,驟看科技的篇章不比以前多,但其實是滲透到各方面。 如果大家類比一些大公司的內部革新,何嘗不是這樣,人工智能(AI)的成功推進,絕對不是資訊總監(CIO)一人的責任,更應該是整體的配合。 報告中與AI直接相關的政策,可以歸納為5項:1)成立「AI效能提升組」;2)推進AI發展和人才優勢;3)強化AI數據優勢;4)推動AI公務應用;5)支援中小企AI方面的應用,這展示着特區政府系統性推動AI發展的決心。 政策核心圍繞治理賦能、科研人才、數據及AI基建的應用融合。筆者這次想先討論前兩點。 在治理體系方面,重頭戲是由政務司副司長領導「AI效能提升組」的成立,統籌各部門重組工作流程,優先改善與市民接觸面大的公共服務。 筆者認為,這個安排極為重要,因為提升政府內部效能有迫切性。對AI相關的產業來說,它是最大的應用場景,而效果上容易立竿見影,又能引起示範作用,同時也為香港還未起動AI的大型企業發出積極訊號。 筆者建議,不妨參考近年醫管局、機管局等機構在數碼化的成果。
車品覺
Oct 1, 20252 min read
OpenAI進軍求職平台顛覆市場
由傳統招聘平台如LinkedIn和Indeed主導的求職市場,即將迎來一場顛覆性變革。OpenAI作為ChatGPT的開發者,正在悄然研發人工智能(AI)驅動的招聘平台(OpenAI Jobs Platform),此舉可能重新定義企業與求職者的連接方式。該平台計劃於2026年推出,旨在利用機器學習,精準匹配人才與工作機會,重點關注中小企業及地方政府等被忽略的領域。然而OpenAI的雄心不止於招聘範疇,伴隨推出AI人才認證計劃和教育領域的擴展,標誌着其更廣泛的戰略──主導AI與人力資源的交滙點。 AI技術的普及率正迅速增長,例如程式員使用AI工具的比例,從2023年的44%躍升至2024年的63%,這表明AI輔助已成為主流趨勢。垂直領域AI產品(如代碼編輯器Cursor在25個月內,收入增長達300倍)的爆發,體現了精準場景的高價值潛力,這為OpenAI的招聘平台提供了技術可行性和市場驗證。 正如OpenAI高層所言,儘管AI將不可避免地顛覆就業,但公司的使命是「通過掌握AI技能,幫助人們適應轉變」。OpenAI招聘平台以前所未有的精準方式,分析僱
車品覺
Sep 17, 20252 min read
Comet打開智能瀏覽器大門
2025年9月3日 美國人工智能(AI)初創公司Perplexity據聞在8月中旬,已向谷歌母企Alphabet發出Chrome瀏覽器的收購邀約,出價高達345億美元。目前在全球瀏覽器市場,谷歌Chrome佔據絕對主導地位,市場份額高達68%,遠超蘋果Safari、微軟Edge及Mozilla Firefox等其他對手,故儘管收購價錢高昂,但筆者認為谷歌又怎會輕易轉讓。 據說不久前,OpenAI曾表露對收購Chrome的興趣。事實上,成立僅3年的Perplexity,總部位於美國三藩市,由來自谷歌DeepMind、OpenAI等公司的團隊創立,專注於開發AI搜索引擎,產品迅速得到用戶青睞,下一步就是搶佔瀏覽器的主導地位。 早在今年7月,Perplexity正式發布其AI驅動的瀏覽器產品Comet,標誌着AI瀏覽器賽道進入白熱化階段。Comet基於Chromium內核打造,但與Chrome和Edge等傳統瀏覽器不同,其設計理念以「AI優先」為核心。 Perplexity在網誌強調,Comet目標是「讓瀏覽器成為用戶的第二大腦」,通過深度整合搜索、辦
車品覺
Sep 3, 20252 min read
探討「數字員工」管理
2025年8月20日 早前聽到一位老朋友提及,公司正在採用「數字員工」。近日百度(09888)智能雲正式推出全球首批具備實際業務能力的「數字員工」,標誌着人工智能(AI)邁向真實生產力角色的重大轉變。日後公司是否需要披露到底有多少人類員工和「數字員工」呢! 與傳統的虛擬人不同,這些「數字員工」以明確的業務職責上班,覆蓋營銷、顧問、管理等關鍵職位,其核心價值在於「從數據中學懂業務、根據精準指示拿結果、持續進化」三大能力。 在實際應用中,「數字員工」能深度理解行業知識體系,例如顧問不僅能回答基礎問題,更能根據用戶需求,主動推薦學習課程並追問細節;銷售「數字員工」可以處理從客戶識別、諮詢,以至下單的全流程服務,且能清晰判斷訊息邊界。 據悉在技術層面上,百度整合了多項創新技術:基於Cross Attention技術的語音交互系統,實現98%識別準確率及一秒內延遲;4D掃描技術打造影視級虛擬形象;僅需30秒聲音樣本,即可復刻真人語音。更重要的是,「數字員工」通過10萬小時行業數據訓練,已能掌握100多個垂直領域的「標準操作流程」(SOP),並能通過持續學習
車品覺
Aug 27, 20252 min read
現實世界資產四大演進
在我看來,數字經濟的發展與「現實世界資產」(Real World Asset, RWA)的關係十分密切,大致經歷4個階段。前兩個階段是數字經濟的基礎,也是大部分企業在過去10年所經歷的。在起初產業數字化的階段,數據是企業經營的依據,而隨着數字化逐步推進,數據也成為企業融資、貸款、與外部合作的新手段。至於後兩個階段,則聚焦於資產價值的數字化重構與流通效率,為資產創造新的價值交換。以下可以粗略了解數字化的演進階段: 第一階段:產業數字化 利用數字技術(如物聯網、雲計算、移動互聯網)優化傳統業務流程,把線下營運和實物資產相關的訊息,轉化為可採集、儲存和分析的數據,由數據驅動決策,提升營運效率。例如,茶餐廳採用二維碼點餐,不僅簡化了流程,更將每張訂單轉化為數據節點,記錄顧客偏好、消費時段等訊息。這些數據通過分析可用於庫存管理、改良菜單等營運決策,為後續階段奠定數據基礎。這其實已悄然讓資產數字化露出了冰山一角,表面之下還隱藏着更深層的資產結構性變革。 第二階段:數字產業化 當數字化技術被廣泛應用後,這些技術本身就會形成新的產業,促進產業數字化。 第三階段:
車品覺
Aug 6, 20252 min read
人工智能催生新職 政策宜及早應對
每當深夜站在維多利亞港,望着中環永不熄滅的燈光,我總在思考這些玻璃幕牆背後正在發生的變革。 作為扎根中港20年的科技從業者,我親眼見證過移動互聯網浪潮如何重塑電子商務、金融科技怎樣顛覆傳統行業,但眼下這場由人工智能(AI)驅動的職場革命,其深遠影響程度可能遠超我們想像。 當Harvey AI能在10秒內完成一份英文合同的法律盡職調查時,本地中小型律師行已開始恐慌。 但有趣的是,涉及跨境婚姻財產分割這類需要「情感解碼」的業務,或許暫時安全。可是,大部分中環白領的處境截然不同,他們面對的不是AI會否取代你,而是你的客戶何時會選擇AI替代你。這印證了一個觀點──AI最擅長的是取代標準化的工作。 根據麥肯錫(McKinsey)及世界經濟論壇(WEF)等報告指出,AI正在以驚人的速度發展,預計到2050年將會徹底改變全球勞動力市場。約60%的現有工作會因AI而需要重大調整,自動化與智能系統也將成為職場的重要組成部分。 專家預測,到2030年,美國30%工作可能被自動化取代,而到2045年,這個比例可能上升至50%。高盛之前估計,全球3億個工作崗位可能因AI
車品覺
Jul 30, 20252 min read
Grok 4戰略部署藏倫理隱憂
作為一名科技觀察者,對億萬富豪馬斯克(Elon Musk)旗下xAI上周發布的Grok 4,表現確實令人眼前一亮。這款號稱「史上最強聊天機械人」的新模型,不僅將上下文窗口擴展至驚人的25.6萬Token,更首次實現多模態支援。更玩味的是其背後戰略布局與隱憂,請容筆者娓娓道來。 xAI宣稱Grok 4的推理速度較前代提升數倍,在某些邏輯基準測試中超越了人類平均水平,這源於其專用超算Colossus的訓練。然而,在AGI-ARC-2抽象推理測試時,僅獲16分(滿分100),暴露了當前大語言模型的通病:對深層因果關係的理解仍稚嫩。 xAI此次的定價堪稱「兩極分化」,每月基礎版為30美元,而面向企業的SuperGrok Heavy版本,月費竟高達300美元。據消息透露,xAI還計劃在8月推出專為程式員需求優化的Grok 4 Code,9月上線多模態代理功能,10月則進軍影片生成領域。這種「3個月一迭代」的激進節奏,與馬斯克在特斯拉FSD(全自動駕駛)汽車上的策略如出一轍。 儘管性能亮眼,但Grok 4的發布仍受兩大爭議纏繞。首先Grok...
車品覺
Jul 23, 20252 min read
AI跨領域協作深度融合
最近人工智能(AI)演算法的進步,呈現出多維發展趨勢。筆者想在圖像、語音和視頻等三大方向,為大家作簡短介紹。這些動態不僅反映技術上的持續突破,也揭示了模型在人機交互性、實用性、跨領域協作的進步。 先說一下圖像生成領域,技術的重點正在逐漸從「文本生成圖像」的效果轉向「互動式編輯」和「場景級組合」的實際應用,例如Adobe Firefly和Midjourney的最新版本,展示了其在複雜編輯上的強大能力。通過文本指令(Text Prompt),用戶可以從圖像局部重繪和操控個別元素,比如在保持背景不變之下,讓圖中的貓從坐姿變為跑姿。這種能力的背後,是擴散模型與場景圖理解技術的深度融合。 擴散模型提供了對圖像生成的強大控制力,而場景圖則讓AI能夠理解圖像中的元素及其相互關係,從而實現更高層次的可控性。這些技術的結合,不僅提升了用戶交互的體驗,也進一步擴展圖像生成技術,在廣告、影視、遊戲和虛擬現實內容創作的應用範圍。 語音技術的突破則集中在情感與個性的層面上。語音合成技術如今可通過一段無感情的語音樣本,根據文本指令生成帶有高度情感化的語音效果。以Huggin
車品覺
Jul 16, 20252 min read
bottom of page
