top of page

資訊距離定量分析變得重要

Updated: Apr 28

資訊爆炸時代,海量資訊給予的好處很明顯,資訊給人愈多愈好的錯覺,但其實也會帶來負面影響,除了引起公眾特別關注個人隱私問題外,在操作層面上也會造成有效資訊難以提煉及品質控制的問題。其中一個元兇來自大數據的本質,這個「大」其實來自多源異構的資訊源,因此帶來「資訊距離」(Information Gap)。

資訊距離的簡單理解是,因為資訊換了情景之後原來的狀態或相關性出現改變,因而產生隔膜及有用知識的丟失。

舉個簡單例子,你在剛出來工作的時候開了一個銀行賬戶,填寫了工作類別。但過了3年後這個資訊會隨着個人狀態而變化,如果銀行繼續使用作為推薦服務的考量,這個資訊距離當然會造成誤差。另一情況是填寫工作類別的時候,並沒有「投資人」這個選項(事實上經常發生在我身上),所以僅選擇資訊科技,讀者可以想像這個資訊差距之大,但時效性和收集資訊時的格式是最容易被掉以輕心的資訊誤差。

商業運作通常是縱向的結構呈現,在網路化之後,商業模型開始探索着橫向合作的可能性,特別是資訊共用方式的改變更有利於新創造及知識挖掘,在這個前提下,資訊的轉移也少不免出現資訊距離容易被放大。例如某客戶欠交電話費,居然影響到向銀行按揭的風險控制模型,因此要多付了利息。

資訊的用途最少可以分為3方面:知識運作(學習/探索)、管理運作(監管/提效)、控制運作(製作/自動化)等。他們都有着共同的要求,就是如何尋找為其達到目標的最佳資源及保持穩定。

為了讓大數據能更廣範圍使用,為資訊距離作定量分析變得愈來愈重要。

當大數據被定義為未來經濟的要素之際,既然有Kg來度量物質的重量、Km來代表距離、焦耳(J)來測度能量、時分秒來形容時間之長短。那麼資訊是否也應該有它的量度的標準及方法呢?如果要我為目前的情況暫時下個評語,答案是:很不科學。

車品覺_紅杉資本中國專家合夥人、阿里巴巴商學院特聘教授暨學術委員會委員

Recent Posts

See All
AI預算黑洞 根源在架構設計

過去兩年。美國眾企業不約而同墮入一個速成陷阱: 認為購買了一個模型、聘請幾位演算法工程師、便能成功實現人工智能 (AI) 落地。然而,即使模型選擇正確數據卻 難以整合;數據成功整合,系統卻無法運行;系統成功運行,但業務部門不會操作;即使學會操作,3個月後模型又變得過時。 問題根源其實不在模型,而在架構。猶如建造大樓,若設計圖存在缺陷,再昂貴的材料也難以支撐。許多企業投入巨資購買「鋼筋水泥」(模型和

 
 
智能代理編程戰 懂人機協作致勝

上周把兩個消息放在一起看,很有意思。 第一個,Anthropic宣布Claude Code推出Artifacts,讓軟件工程師在寫程式的過程中,業務主管能同時打開網頁儀表板,就能看到軟件即時更新及開發的狀態。 第二個,中國人民大學和微軟亞洲研究院聯合推出一個叫Arbor開源自主人工智能體的新框架,系統能自動提出假設、修改代碼,運行真實實驗並從結果中學習,自動優化解決問題。 過去一年大家比併的是模型

 
 
集結舊手機算力 媲美當今伺服器

你可曾想過,你抽屜裏那部4年前的舊手機,可能很有價值? 這個星期,Google Research聯同加州大學聖地牙哥分校(UCSD)公布一項創新計劃:運用2000部退役的Pixel手機,構建一個真實可用的雲端計算平台。這不僅是概念驗證,更是一個供數百名學者與研究人員實際操作的生產級環境。處理方式十分直接,將舊手機的熒幕、電池、外殼全部移除,僅保留主機板,透過Kubernetes技術組成叢集,直接轉

 
 
bottom of page