上周三(7月26日),諸葛io創(chuàng)始人&CEO孔淼受邀出席了AWS技術(shù)峰會(huì)2017,本屆峰會(huì)圍繞多項(xiàng)云計(jì)算熱門(mén)議題,覆蓋大數(shù)據(jù)和人工智能、架構(gòu)、安全、IOT等十大技術(shù)分會(huì)場(chǎng),匯集眾多技術(shù)團(tuán)隊(duì)的大咖共同探討云計(jì)算的創(chuàng)新發(fā)展之路。
本文整理自諸葛io創(chuàng)始人&CEO孔淼在大數(shù)據(jù)技術(shù)專場(chǎng)論壇中發(fā)表的題為《 數(shù)據(jù)驅(qū)動(dòng)企業(yè)商業(yè)價(jià)值增長(zhǎng)》的演講:數(shù)據(jù)分析的核心是為業(yè)務(wù)服務(wù),圍繞如何整合線上線下的業(yè)務(wù)數(shù)據(jù)和用戶行為數(shù)據(jù),挖掘背后的商業(yè)價(jià)值。
孔淼從以下4方面進(jìn)行了深度解讀:
1、數(shù)據(jù)挖掘的“內(nèi)憂外患” 真正的大數(shù)據(jù)落地,既要結(jié)合行業(yè)場(chǎng)景化的需求,也要對(duì)行業(yè)有足夠深入的了解,更要認(rèn)清企業(yè)所處不同的大數(shù)據(jù)階段,從而實(shí)現(xiàn)大數(shù)據(jù)價(jià)值挖掘過(guò)程中的“對(duì)癥下藥”。
2、以用戶為中心,場(chǎng)景化驅(qū)動(dòng)數(shù)據(jù)價(jià)值釋放 諸葛io將“大數(shù)據(jù)賦能”的理想真正轉(zhuǎn)變?yōu)楝F(xiàn)實(shí)。人人都可以實(shí)現(xiàn)用戶特征與行為特征的交叉分析,通過(guò)豐富靈活的分析功能和場(chǎng)景,讓業(yè)務(wù)的人更懂?dāng)?shù)據(jù),也讓數(shù)據(jù)體現(xiàn)價(jià)值。
3、強(qiáng)大的數(shù)據(jù)采集能力 打通用戶與業(yè)務(wù)數(shù)據(jù) 諸葛io將數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)加工、數(shù)據(jù)加載、建模分析及可視化的全過(guò)程一站式的交付。
4、基于統(tǒng)一的ETL 實(shí)現(xiàn)SaaS和私有部署的統(tǒng)一 滿足不同企業(yè)的個(gè)性化需求。
諸葛io創(chuàng)始人&CEO孔淼在活動(dòng)現(xiàn)場(chǎng)發(fā)言
數(shù)據(jù)挖掘的“內(nèi)憂外患”
1、線上線下信息化 數(shù)據(jù)整合困難
企業(yè)管理信息化:ERP/PMS/CRM等信息化系統(tǒng)積累大量的數(shù)據(jù)
服務(wù)互聯(lián)網(wǎng)化:App和網(wǎng)站從信息平臺(tái)延伸成為了服務(wù)平臺(tái)的基礎(chǔ)
線下行為結(jié)構(gòu)化:人臉識(shí)別,紅外體感可以識(shí)別線下行為,非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化
線上線下的信息化背后,產(chǎn)生的大量數(shù)據(jù),如何整合,并發(fā)揮出商業(yè)價(jià)值?
2、紅利消盡,經(jīng)濟(jì)放緩,數(shù)據(jù)驅(qū)動(dòng)不可避免
流量時(shí)代結(jié)束:互聯(lián)網(wǎng)用戶增長(zhǎng)放緩,獲客成本增加
經(jīng)濟(jì)放緩:經(jīng)濟(jì)增長(zhǎng)放緩,人力成本增加,第三產(chǎn)業(yè)服務(wù)行業(yè)結(jié)構(gòu)上升
數(shù)據(jù)驅(qū)動(dòng)價(jià)值:(內(nèi))優(yōu)化內(nèi)部管理效率(外)減少客戶流失,提升客戶轉(zhuǎn)化
紅利消盡,經(jīng)濟(jì)放緩,如何通過(guò)精細(xì)化運(yùn)營(yíng)提升企業(yè)價(jià)值?
3、大數(shù)據(jù)幾波發(fā)展,新技術(shù)勢(shì)不可擋
早期信息化系統(tǒng)——第一階段“信息獲取時(shí)代”,只解決企業(yè)內(nèi)部管理問(wèn)題,采集的是一些少量的數(shù)據(jù),KPI、訂單、業(yè)務(wù),總結(jié)經(jīng)營(yíng)活動(dòng)等基本業(yè)務(wù)狀況。
隨著信息化系統(tǒng)對(duì)外使用,更多承載著客戶服務(wù),數(shù)據(jù)量猛增,如何結(jié)合數(shù)據(jù)思考規(guī)律,這也是諸葛io與傳統(tǒng)統(tǒng)計(jì)的區(qū)別,諸葛io全面采集數(shù)據(jù),幫助企業(yè)分析產(chǎn)品,運(yùn)營(yíng)策略,尋找更優(yōu)質(zhì)的市場(chǎng)渠道,這是第二個(gè)階段——“信息挖掘時(shí)代”。
第三個(gè)階段——信息輸出時(shí)代,融入更多自動(dòng)化的分析,找出高價(jià)值客戶,高流失客戶,自動(dòng)化的通過(guò)用戶后續(xù)行為,評(píng)估推廣渠道的質(zhì)量并實(shí)現(xiàn)自動(dòng)優(yōu)化,我(諸葛io創(chuàng)始人&CEO孔淼)相信這是下一步價(jià)值驅(qū)動(dòng)更多要解決的問(wèn)題,即,把信息和輸出價(jià)值結(jié)合在一起,但大多數(shù)企業(yè),更多的停留在第一和第二階段,如何幫助這些企業(yè)緊跟數(shù)據(jù)技術(shù)發(fā)展的趨勢(shì),這也是一個(gè)大問(wèn)題。所以,諸葛io的切入,其核心是為了解決這幾個(gè)問(wèn)題。
以用戶為中心,場(chǎng)景化驅(qū)動(dòng)數(shù)據(jù)價(jià)值釋放
1、打通數(shù)據(jù)源,整合用戶數(shù)據(jù)
“用戶-觸點(diǎn)-會(huì)話-事件”模型,挖掘數(shù)據(jù)關(guān)聯(lián)價(jià)值
對(duì)于一個(gè)企業(yè)而言,諸葛io將用戶數(shù)據(jù)打通,以用戶為中心,組織關(guān)聯(lián)不同數(shù)據(jù)源,比如,線下門(mén)店的會(huì)員積分體系,用戶輸入手機(jī)號(hào),然后購(gòu)買(mǎi)商品的價(jià)位等信息構(gòu)成一部分?jǐn)?shù)據(jù)源;用戶也可能通過(guò)微信公眾號(hào)、小程序、APP、網(wǎng)站等與企業(yè)進(jìn)行交互,這又構(gòu)成一部分?jǐn)?shù)據(jù)源,故,關(guān)聯(lián)不同數(shù)據(jù)源非常重要。
大數(shù)據(jù)發(fā)展初期,通常只是將數(shù)據(jù)統(tǒng)計(jì)后總結(jié)經(jīng)營(yíng)活動(dòng),這個(gè)按紐點(diǎn)了多少次,一個(gè)頁(yè)面訪問(wèn)了多少次;現(xiàn)在有一個(gè)概念叫“事件”,將靜態(tài)數(shù)據(jù)變成動(dòng)態(tài)的,將“指標(biāo)”賦予“描述業(yè)務(wù)”的活力。
諸葛io結(jié)合用戶和事件,將企業(yè)全年數(shù)據(jù)動(dòng)態(tài)化,因?yàn)槭录怯袝r(shí)間、地點(diǎn),詳細(xì)描述,可追蹤的,這是很多新型數(shù)據(jù)分析平臺(tái)所支持的,但諸葛io做得更好,我們有“觸點(diǎn)”和“會(huì)話”。觸點(diǎn)可還原用戶場(chǎng)景,挖掘背后價(jià)值;通過(guò)會(huì)話可以了解用戶在何時(shí)、何地做過(guò)什么。
比如,一個(gè)用戶一天訪問(wèn)5次還是1次,一個(gè)人去門(mén)店10次還是3次,用戶在應(yīng)用里訪問(wèn)10分鐘還是1個(gè)小時(shí)等會(huì)話數(shù)據(jù),均可反映用戶的粘性和深度。通過(guò)用戶、事件、觸點(diǎn)、會(huì)話,即可挖掘多個(gè)數(shù)據(jù)源中有價(jià)值的數(shù)據(jù)。不是采集的所有數(shù)據(jù)都有價(jià)值,只有先明確分析目標(biāo),找出有價(jià)值的數(shù)據(jù),才能發(fā)揮分析價(jià)值,這是諸葛io的數(shù)據(jù)分析理念。
2、豐富靈活的功能場(chǎng)景,企業(yè)數(shù)據(jù)驅(qū)動(dòng)的基石
基于這套理念,諸葛io提供了“一站式”的數(shù)據(jù)分析解決方案。何謂“一站式”?
首先,解決數(shù)據(jù)采集問(wèn)題,諸葛io隨著這兩年的發(fā)展,不停地在完善數(shù)據(jù)采集能力,從最初,我們獨(dú)具一格的業(yè)務(wù)驅(qū)動(dòng)埋點(diǎn)(大多數(shù)平臺(tái)采集“點(diǎn)擊行為”以及“頁(yè)面訪問(wèn)”背后的瀏覽量和人數(shù),,而諸葛io采集的是背后的所代表的業(yè)務(wù)行為和描述)。
第二,交互跟蹤的全埋點(diǎn)方案,通常存在數(shù)據(jù)不準(zhǔn)、影響性能等問(wèn)題,但在某些場(chǎng)景中可幫助了解用戶轉(zhuǎn)化情況,所以諸葛io同樣提供類似方案。
第三,開(kāi)放式的后端接入,把諸葛io的視野從線上APP、網(wǎng)站,拓寬到一個(gè)企業(yè)的各種數(shù)據(jù)源無(wú)疑需要支持后端接入,故諸葛io有非常開(kāi)放的后端接口,打通整合CRM等各種系統(tǒng)數(shù)據(jù),所以數(shù)據(jù)接入是諸葛io提供的第一道服務(wù)。
為了讓數(shù)據(jù)分析更有價(jià)值,諸葛io提供非常豐富的分析場(chǎng)景,之前大多數(shù)企業(yè)都需要懂?dāng)?shù)據(jù)的BI團(tuán)隊(duì),即,業(yè)務(wù)的人與數(shù)據(jù)的人溝通,然后由技術(shù)來(lái)實(shí)現(xiàn)最終通過(guò)報(bào)表呈現(xiàn)。此分析過(guò)程成本很高,所以諸葛io開(kāi)發(fā)出很多自助式分析模塊和場(chǎng)景,讓一個(gè)只懂業(yè)務(wù)的人可以通過(guò)諸葛io的模塊分析數(shù)據(jù)。之前,可能完全依賴于技術(shù)化的程序腳本,現(xiàn)在,在諸葛io平臺(tái),通過(guò)交互式點(diǎn)擊的操作,篩選出對(duì)應(yīng)人群,并實(shí)現(xiàn)不同人群間的交叉細(xì)分對(duì)比,查看轉(zhuǎn)化率差異,跟蹤運(yùn)營(yíng)活動(dòng)效果,評(píng)估產(chǎn)品功能設(shè)計(jì),監(jiān)測(cè)市場(chǎng)推廣活動(dòng)表現(xiàn),諸葛io為一個(gè)豐富自助式場(chǎng)景提供的一個(gè)價(jià)值輸出。
諸葛io自助式的分析場(chǎng)景,將分析結(jié)果的獲取,從天級(jí)降到秒級(jí),這也是一些大型公司之所以選擇諸葛io的原因,提高了分析的效率,降低了溝通的成本。
實(shí)現(xiàn)數(shù)據(jù)接入和自助式的分析場(chǎng)景后,因數(shù)據(jù)是非標(biāo)準(zhǔn)化的,不同行業(yè)、不同角色在不同場(chǎng)景,甚至不同時(shí)間內(nèi)所關(guān)注的指標(biāo)都是不一樣的,諸葛io不可能提出大而全的解決方案,但諸葛io有通用模型后,便可提出非常靈活的自助式分析的方案。
諸葛io支持企業(yè)靈活的二次開(kāi)發(fā),即,將底層進(jìn)行清洗和整合過(guò)的數(shù)據(jù)完整的開(kāi)放給企業(yè)客戶。所以,諸葛io有數(shù)據(jù)倉(cāng)庫(kù)的SQL查詢平臺(tái),進(jìn)行各種豐富的展示化,包括接入到可視化分析平臺(tái),諸葛io有Kafka,它能夠融入到企業(yè)自己的數(shù)據(jù)分析體系中,因?yàn)樵谄髽I(yè)中,有的可能喜歡用Excel給老板做匯報(bào),有的可能有自己內(nèi)部的分析服務(wù)和方案,所以諸葛io很靈活,提供了非常豐富的API,將企業(yè)內(nèi)部數(shù)據(jù)運(yùn)營(yíng)的體系融入。
為用戶提供了非常靈活的選擇,諸葛io提供SaaS和私有部署兩種方式,SaaS基于AWS,私有部署即部署在企業(yè)本地服務(wù)器上,使用的是一套獨(dú)立架構(gòu)??傊?,諸葛io平臺(tái)非常Open,滿足企業(yè)不同的需求。
3、專業(yè)體貼的分析服務(wù),幫助不同角色驅(qū)動(dòng)價(jià)值
諸葛io提供數(shù)據(jù)分析服務(wù)團(tuán)隊(duì),讓數(shù)據(jù)分析的門(mén)檻變低,讓數(shù)據(jù)分析不再成為一件難事。通過(guò)數(shù)據(jù)分析服務(wù)團(tuán)隊(duì),諸葛io可以幫助客戶建立有效的指標(biāo)體系;幫助市場(chǎng)營(yíng)銷辨別渠道的好壞;幫助運(yùn)營(yíng)保護(hù)留存,去設(shè)計(jì)好的活動(dòng),設(shè)計(jì)好的產(chǎn)品;幫助產(chǎn)品經(jīng)理把產(chǎn)品的核心價(jià)值更好的進(jìn)行輸出等等。
諸葛io通過(guò)精細(xì)化的分析,以工具為底層,通過(guò)漏斗、事件,多種采型組件以及分析組件為基礎(chǔ),支持企業(yè)進(jìn)行精細(xì)化分析。同時(shí)諸葛io還可根據(jù)不同的應(yīng)用場(chǎng)景覆蓋用戶的不同生命周期。
比如,此前寶馬和奧迪通過(guò)諸葛io做廣告投放,通過(guò)諸葛io的廣告監(jiān)測(cè)平臺(tái)可實(shí)現(xiàn),從曝光-監(jiān)測(cè)-落地的監(jiān)測(cè),諸葛io還有功能優(yōu)化和獲取分析,用戶落地后獲取的來(lái)源,渠道的歸因分析等。此外,諸葛io提供智能觸達(dá)解決方案,通過(guò)給合適的用戶在合適的時(shí)間精準(zhǔn)推送合適的內(nèi)容,比如:短信/APP內(nèi)的PUSH或者通過(guò)Webhook實(shí)現(xiàn)其他形式的推送。
諸葛io全面覆蓋從曝光到付費(fèi)到留存(流失)的全生命周期鏈條,相信未來(lái)的服務(wù)一定是以用戶的生命周期和價(jià)值為基礎(chǔ)的。所以,讓業(yè)務(wù)的人更懂?dāng)?shù)據(jù),讓數(shù)據(jù)更好的服務(wù)業(yè)務(wù)是基礎(chǔ)。
諸葛io每個(gè)月已處理超過(guò)百億有效的數(shù)據(jù)量,目前已覆蓋包括科技金融、SaaS,O2O等八大行業(yè)方案。眾多知名企業(yè)都是諸葛io服務(wù)的客戶,有很多大家熟悉的企業(yè),比如工具類產(chǎn)品微天氣,ToB平臺(tái)智聯(lián)招聘,科技金融平臺(tái)人人貸等,最近成功與陽(yáng)光保險(xiǎn)達(dá)成戰(zhàn)略合作,這只是諸葛io的一個(gè)開(kāi)始,我相信接下來(lái)的發(fā)展會(huì)更加迅速。
強(qiáng)大的數(shù)據(jù)采集能力 打通用戶與業(yè)務(wù)數(shù)據(jù)
諸葛io是一個(gè)支持二次開(kāi)發(fā)的平臺(tái),豐富的采集方式,包括安卓、iOS、JS和微信小程序,全埋點(diǎn)、代碼埋點(diǎn)以及可視化埋點(diǎn),最近還上線了支持靈活添加屬性的功能,諸葛io提供的應(yīng)該是業(yè)內(nèi)功能最豐富的可視化埋點(diǎn)方式。代碼埋點(diǎn)一直是諸葛io的強(qiáng)項(xiàng),很多企業(yè)從中獲益。此外,諸葛io還支持服務(wù)端上傳,能幫助企業(yè)更好地應(yīng)用數(shù)據(jù),支持工具導(dǎo)入數(shù)據(jù),打通企業(yè)數(shù)據(jù)與用戶行為數(shù)據(jù)。
打造具有“開(kāi)放性”的二次開(kāi)發(fā)平臺(tái)
諸葛io為數(shù)據(jù)分析師特別提供具有“開(kāi)放性”的二次開(kāi)發(fā)平臺(tái):
1、SQL查詢平臺(tái):有時(shí)復(fù)合指標(biāo)是非常復(fù)雜的,無(wú)法通過(guò)交互式的圖表獲得分析結(jié)果,那么諸葛io直接開(kāi)放底層的數(shù)據(jù)倉(cāng)庫(kù)(數(shù)據(jù)倉(cāng)庫(kù)開(kāi)放接口),此外,諸葛io還支持各種圖表的繪制;
2、API接口訪問(wèn):將諸葛io采集到的用戶行為數(shù)據(jù)導(dǎo)入企業(yè)內(nèi)部系統(tǒng)中,可通過(guò)API來(lái)實(shí)現(xiàn);若要獲取諸葛io非常精細(xì)化的用戶檔案列表數(shù)據(jù),也可以通過(guò)API渠道;若要加工數(shù)據(jù)倉(cāng)庫(kù),也可以通過(guò)API接口;
3、HDFS數(shù)據(jù)訪問(wèn):因?yàn)橹T葛io的用戶體系與企業(yè)的用戶體系是打通的,企業(yè)若有機(jī)器學(xué)習(xí)模型,若要獲取更多諸葛io采集到的數(shù)據(jù),那么企業(yè)可以把諸葛io的維度與企業(yè)自身業(yè)務(wù)的維度結(jié)合起來(lái)建立新的模型,此時(shí)可通過(guò)HDFS數(shù)據(jù)訪問(wèn);
4、Kafka實(shí)時(shí)數(shù)據(jù)訂閱:企業(yè)可通過(guò)諸葛io的Kafka實(shí)時(shí)數(shù)據(jù)訂閱。
諸葛io的基礎(chǔ)架構(gòu)分為兩層,提供SaaS和私有部署兩種方式:
→SaaS的海量數(shù)據(jù)存儲(chǔ)是基于S3的,數(shù)據(jù)倉(cāng)庫(kù)是基于Redshift,Redshift是硅谷頂尖公司的選擇,我們?yōu)槊恳粋€(gè)SaaS的付費(fèi)客戶都提供這樣優(yōu)質(zhì)的基礎(chǔ)設(shè)施,保障其分析性能
→私有部署的存儲(chǔ)是基于HDFS的,數(shù)據(jù)倉(cāng)庫(kù)是基于Greenplum的,現(xiàn)在我們最新的實(shí)時(shí)私有部署平臺(tái),采用的是Impala作為查詢視圖。
基于統(tǒng)一的ETL實(shí)現(xiàn)SaaS和私有部署的統(tǒng)一
基于統(tǒng)一的ETL(Extract-Transform-Load)架構(gòu),諸葛io實(shí)現(xiàn)SaaS和私有部署的統(tǒng)一。
從“采集-接收-轉(zhuǎn)換-加載-實(shí)時(shí)計(jì)算”,諸葛io通過(guò)使用同一套架構(gòu)降低了成本,但是諸葛io的倉(cāng)庫(kù)不同,比如實(shí)時(shí)計(jì)算可監(jiān)測(cè)當(dāng)天的活動(dòng)數(shù)據(jù)。此外,SaaS和私有化的模型也稍有區(qū)別,早期是一樣的,后來(lái)發(fā)現(xiàn)存在問(wèn)題。
諸葛io的很多Saas模型早期是為了更符合范式設(shè)計(jì),可在去年出現(xiàn)了爆發(fā)式數(shù)據(jù)增長(zhǎng)時(shí),事件表、時(shí)間表等整個(gè)數(shù)據(jù)量特別大導(dǎo)致計(jì)算性能?chē)?yán)重下降。所以,在私有化模型中諸葛io采用寬表方式:
SaaS的數(shù)據(jù)加載及存儲(chǔ):Kafka->S3 -> Merge S3 -> Redshift or Greenplum
私有化部署的數(shù)據(jù)加載及存儲(chǔ):數(shù)據(jù)流: Kafka->Kudu->HDFS(Parquet),impala視圖 : Kudu + HDFS(Parquet)
諸葛io以用戶為中心,找到數(shù)據(jù)源的共性,將跨用戶的數(shù)據(jù)打通,將數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)加工、數(shù)據(jù)加載、建模分析及可視化的全過(guò)程一站式的交付,結(jié)合用戶和事件的交叉分析,諸葛io能夠把企業(yè)全年的數(shù)據(jù)動(dòng)態(tài)化起來(lái),讓業(yè)務(wù)更懂?dāng)?shù)據(jù),讓數(shù)據(jù)體現(xiàn)價(jià)值。
未完待續(xù)···
1、動(dòng)輒數(shù)百TB級(jí)數(shù)據(jù)的企業(yè)客戶,諸葛io在技術(shù)上如何完美提供支持的?
2、諸葛io提供的SaaS和私有部署服務(wù),這兩種方式在技術(shù)方面有哪些差異?
····
還包含活動(dòng)現(xiàn)場(chǎng)因時(shí)間有限未能詳盡的干貨,敬請(qǐng)期待~
本文首發(fā)微信公眾號(hào) 諸葛io(ID:zhugeio1)
諸葛io,你身邊的數(shù)據(jù)驅(qū)動(dòng)教練,點(diǎn)擊我,免費(fèi)試用~點(diǎn)擊我,免費(fèi)試用~
歡迎添加微信:zhugeio2016一起探討交流