top of page

選優測試 網企必備

Updated: Apr 28

公元前167年至164年之間的《但以理書》,講述了巴比倫尼亞國王尼布甲尼撒攻打耶路撒冷,俘虜了以色列囚犯,並將他們帶回巴比倫的故事。

尼布甲尼撒下令要挑選最英俊、聰明、健康的囚犯接受訓練,好讓他們在皇宮裏執勤。按照國王的命令,這些囚犯會有3年時間學習巴比倫語,並享用與皇室成員相同的酒食。但囚犯但以理暗暗發誓,他不會讓皇宮的酒食「玷污」自己的身心。他說服了守衞只給他和3位朋友吃素食,因此在這3年的訓練期內,得以延續他們的素食方式。

3年期滿後,這4個人的智慧和技能遠超常人,國王最終選擇了但以理和他的素食夥伴們,而沒有挑選雜食者。這一仗勝利可能不會讓如今的素食主義者感到訝異。

但以理似乎已經勾畫出現今臨床科學試驗的大致輪廓:他選擇自己和他的朋友們作為自願的受試對象;非素食者的囚犯則為對照組,測試的結果顯示素食者最低限度沒有因為素食而影響其優秀的體格及智慧。

最近一本新書Power of Experiments描述了上述的故事,並認為這是利用實驗方式作為選優方案的始祖。到了今天,這種選優測試已經是互聯網企業的必備技能,例如在淘寶的應用上,可能每天就有過千個選優測試在同時發生,找出最佳的用戶體驗。不過實驗的背後有一些關注點的定義是類似的,例如:

  • 對照組:該組作為與實驗組進行比較的基礎;實驗組:小組中的實驗參與者將被施加額外的測試因素;

  • 自變量:用作衡量影響的變量;

  • 因變量:關注的結果;

  • 平均效應:受測試對象加入處理因素後,通過比較實驗組與對照組所得出的平均效應。

你可能會問實驗選優的方式,為什麼現今這個時代如此重要?因為在過去線下的環境,很難做到像互聯網的出現後,擁有可以作出大量實時測試的技術能力。作為大數據的專家,筆者認為更有趣的是在接近全量數據的環境收集下,每天的自然「意外」結果可以給予我大量未來選優的靈感。例如某地方忽然停電,幾天後恢復供電,購買行為與平常有差異;「光棍節」凌晨的頭十分鐘到淘寶購買的顧客,裏面出現一群平時從來不光顧的用戶,這都會意味着什麼?

車品覺_紅杉資本中國專家合夥人、阿里巴巴商學院特聘教授暨學術委員會委員

Recent Posts

See All
AI預算黑洞 根源在架構設計

過去兩年。美國眾企業不約而同墮入一個速成陷阱: 認為購買了一個模型、聘請幾位演算法工程師、便能成功實現人工智能 (AI) 落地。然而,即使模型選擇正確數據卻 難以整合;數據成功整合,系統卻無法運行;系統成功運行,但業務部門不會操作;即使學會操作,3個月後模型又變得過時。 問題根源其實不在模型,而在架構。猶如建造大樓,若設計圖存在缺陷,再昂貴的材料也難以支撐。許多企業投入巨資購買「鋼筋水泥」(模型和

 
 
智能代理編程戰 懂人機協作致勝

上周把兩個消息放在一起看,很有意思。 第一個,Anthropic宣布Claude Code推出Artifacts,讓軟件工程師在寫程式的過程中,業務主管能同時打開網頁儀表板,就能看到軟件即時更新及開發的狀態。 第二個,中國人民大學和微軟亞洲研究院聯合推出一個叫Arbor開源自主人工智能體的新框架,系統能自動提出假設、修改代碼,運行真實實驗並從結果中學習,自動優化解決問題。 過去一年大家比併的是模型

 
 
集結舊手機算力 媲美當今伺服器

你可曾想過,你抽屜裏那部4年前的舊手機,可能很有價值? 這個星期,Google Research聯同加州大學聖地牙哥分校(UCSD)公布一項創新計劃:運用2000部退役的Pixel手機,構建一個真實可用的雲端計算平台。這不僅是概念驗證,更是一個供數百名學者與研究人員實際操作的生產級環境。處理方式十分直接,將舊手機的熒幕、電池、外殼全部移除,僅保留主機板,透過Kubernetes技術組成叢集,直接轉

 
 
bottom of page