增長(zhǎng)黑客進(jìn)階之路:關(guān)于A/A測(cè)試,看這篇文章就夠了

增長(zhǎng)黑客成長(zhǎng)之路上,想必大家對(duì)A/B測(cè)試已經(jīng)很熟悉了,但聽過、實(shí)踐過A/A測(cè)試的同學(xué)舉個(gè)手我看看,喏,還沒多少人。這篇文章我們就來(lái)講講A/A測(cè)試。

什么是A/A測(cè)試?

A/A測(cè)試可以理解成對(duì)兩個(gè)相同版本進(jìn)行的A/B測(cè)試。通常,這樣做的目的是為了驗(yàn)證正在使用的工具運(yùn)行試驗(yàn)在統(tǒng)計(jì)上是公平的。在A/A測(cè)試中,如果測(cè)試正確進(jìn)行,控制組和實(shí)驗(yàn)組應(yīng)該沒有任何區(qū)別。

在沒做A/A測(cè)試之前,你可能什么都不知道,這里的邏輯是這樣的:如果樣本的A/A測(cè)試結(jié)果達(dá)到統(tǒng)計(jì)顯著,那么A/B測(cè)試工具或測(cè)試方案就是不可信的。

如果說A/B測(cè)試用來(lái)測(cè)試比較幾個(gè)方案的優(yōu)劣,那么A/A測(cè)試就是驗(yàn)證A/B測(cè)試及工具置信度的有效方式。

為什么進(jìn)行A/A測(cè)試?

既然A/A測(cè)試的兩個(gè)版本變量沒有任何變化,為什么還要花時(shí)間精力來(lái)做?

商業(yè)活動(dòng)中,通常我們使用一切數(shù)據(jù)工具的目的,無(wú)外乎:用測(cè)量推動(dòng)決策優(yōu)化,同時(shí)用正確的決策獲取比競(jìng)爭(zhēng)對(duì)手更大的市場(chǎng)。可能通過數(shù)據(jù)能獲取的決策信息點(diǎn)有很多,那么通過A/A測(cè)試來(lái)確保你得到的數(shù)據(jù)能用來(lái)自信地作出決定,減小決策失誤。

通常情況下我們做A/A測(cè)試的目的有下面幾個(gè):

1.保證精確的流量分配,換句話說,驗(yàn)證隨機(jī)性實(shí)際上是通過確保每次試驗(yàn)產(chǎn)生的計(jì)數(shù)與統(tǒng)計(jì)范圍相似

2.識(shí)別假陽(yáng)性結(jié)果的頻率(假陽(yáng)性結(jié)果也可以理解為測(cè)試結(jié)果中的虛假繁榮,有相當(dāng)?shù)恼`導(dǎo)性)

3.確定方差“泡沫”幫我們更好的理解其他測(cè)試結(jié)果

關(guān)于假陽(yáng)性

A/A測(cè)試能被用來(lái)理解假陽(yáng)性結(jié)果的頻率。簡(jiǎn)單講,如果你在測(cè)試中采用95%置信水平,那么20次結(jié)果可能會(huì)出現(xiàn)1次假陽(yáng)性結(jié)果。這時(shí)候通過A/A測(cè)試,就能驗(yàn)證轉(zhuǎn)化率的顯著差異,比如,你運(yùn)行20次A/A測(cè)試,其中有2次結(jié)果明顯不同,這意味著假陽(yáng)性的比例可能高于5%。

方差“泡沫”

A/A測(cè)試能幫助確定轉(zhuǎn)化率中的方差“泡沫”,最小化對(duì)未來(lái)測(cè)試的影響。除了技術(shù)上的有效性,A/A測(cè)試能讓“泡沫”在可接受范圍內(nèi)。

比如,如果A/A測(cè)試中的泡沫是0.1%,測(cè)試轉(zhuǎn)化率是3%,那么你可以接受的范圍就是2.9%-3.1%。如果你看到0.1%的提升,那么你就知道這樣的結(jié)果是沒有意義的。

A/A測(cè)試的時(shí)候你不知道什么時(shí)候新變量和默認(rèn)變量的轉(zhuǎn)化率差別結(jié)果能達(dá)到統(tǒng)計(jì)顯著,因此,A/A測(cè)試中的任何錯(cuò)誤或置信度不應(yīng)被用來(lái)作為未來(lái)測(cè)試的基準(zhǔn),因?yàn)锳/A測(cè)試中本不應(yīng)有轉(zhuǎn)化率的明顯差異。

需要注意的是,有可能只是因?yàn)殡S機(jī)性,導(dǎo)致A/A測(cè)試的兩個(gè)試驗(yàn)結(jié)果有所不同,而不是工具或測(cè)試方案本身的問題。當(dāng)然,隨著樣本量的增大,這種差別會(huì)逐漸降低。這是因?yàn)椋颖鞠碌慕Y(jié)果是不可信的,小樣本從總體上意味著可能存在分配不均的數(shù)據(jù)段。要消除這點(diǎn),就需要A/A測(cè)試運(yùn)行足夠長(zhǎng)的時(shí)間,以及有足夠的樣本規(guī)模。

計(jì)算測(cè)試持續(xù)時(shí)間

測(cè)試持續(xù)時(shí)間是兩個(gè)因素的函數(shù):

1.達(dá)到一個(gè)可接受的樣本大小所需的時(shí)間

2.變量之間的不同表現(xiàn)差異大小

如果一個(gè)變量引起了50%的變化,測(cè)試就不必運(yùn)行很長(zhǎng)時(shí)間。這種情況,即使是在小樣本下,也可以忽略統(tǒng)計(jì)誤差。

如何設(shè)置A/A測(cè)試

A/A測(cè)試好在不必做任何創(chuàng)造性的或研發(fā)上的工作。當(dāng)設(shè)置A/B測(cè)試時(shí),你需要在A/B測(cè)試軟件上編程來(lái)改變、隱藏或刪除頁(yè)面的某些部分,對(duì)A/A測(cè)試來(lái)說這些都是不需要的。

A/A測(cè)試面臨的挑戰(zhàn)是正確的選擇運(yùn)行測(cè)試的頁(yè)面,通常做A/A測(cè)試的頁(yè)面都應(yīng)該有兩個(gè)特點(diǎn):

1)相對(duì)較高的流量。網(wǎng)頁(yè)流量越多,越早看到變量的對(duì)比。

2)訪客可以從頁(yè)面購(gòu)買或注冊(cè)。我們希望根據(jù)最終目標(biāo)來(lái)校驗(yàn)我們的A/B測(cè)試工具。

出于這些原因,通常我們會(huì)在網(wǎng)站主頁(yè)上運(yùn)行A/A測(cè)試。

運(yùn)行A/A測(cè)試的成本

運(yùn)行A/A測(cè)試的唯一成本:機(jī)會(huì)成本。有的人寧愿把A/A測(cè)試上投入的時(shí)間和流量用來(lái)多做幾次A/B測(cè)試也不是沒有道理的。

應(yīng)該考慮運(yùn)行A/A測(cè)試的唯一種情況:

1.你剛安裝了一個(gè)新的測(cè)試工具或更改了測(cè)試工具設(shè)置。

2.你發(fā)現(xiàn)了A/B測(cè)試與數(shù)據(jù)分析工具結(jié)果之間存在差異。



本文由 Zoran @吆喝科技(微信:appadhoc)編譯,轉(zhuǎn)載請(qǐng)聯(lián)系吆喝科技。

參考文章:

blog.analytics-toolkit.com/2014/aa-aab-aabb-tests-cro/

blogs.oracle.com/marketingcloud/optimization-shorts:-aa-testing

www.optimizely.com/optimization-glossary/aa-testing/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,431評(píng)論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,637評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,555評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,900評(píng)論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,629評(píng)論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,976評(píng)論 1 328
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,976評(píng)論 3 448
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,139評(píng)論 0 290
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,686評(píng)論 1 336
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,411評(píng)論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,641評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,129評(píng)論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,820評(píng)論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,233評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,567評(píng)論 1 295
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,362評(píng)論 3 400
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,604評(píng)論 2 380

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 134,829評(píng)論 18 139
  • 你也是個(gè)乳臭未干的成年人嗎 文集 余生很長(zhǎng),你聽我講
    太宰不治閱讀 215評(píng)論 0 1
  • 其實(shí)我知道,好多人,好多平臺(tái),都說多讀書,多讀書,多讀書,我心里也是接受的,理由無(wú)非也就那些,增長(zhǎng)見識(shí),學(xué)到更多...
    何水先生閱讀 266評(píng)論 0 1
  • 彭小六“夢(mèng)想領(lǐng)讀會(huì)”作業(yè)·彭小六早讀會(huì)日?qǐng)?bào)(2017-05-15) 作者:BigQ個(gè)人成長(zhǎng) 小六“夢(mèng)想領(lǐng)讀會(huì)”作業(yè)...
    BigQ個(gè)人成長(zhǎng)閱讀 559評(píng)論 0 51