這篇是讀書筆記。
常見的數據獲取方式:網站日志文件,web beacons打點,js頁面標記。
網站日志與js標記:
網站日志形式常見的是apache日志格式,記錄服務器的每次請求。所以網站的日志記錄的是網站分析的最原始數據
包括:
1)訪問終端IP地址,移動設備也有IP地址
2)訪問時間點,有了時間點就可以判斷用戶頁面瀏覽的先后順序。
3) 訪問地址路徑
4)訪問來源
下面再來了解一下JS獲取數據的方式,通過在網站也main實施JS代碼來獲取數據是目前較為流行的方法,很多工具都在用這個方法,無論是omniture,webtrends,還是免費的google analytics,CNZZ和百度統計
上面有幾個有用的參數:
Utmcc:cookie里存儲的數據流量來源,訪問次數等
用戶識別:
IP地址:弊端是偽IP,代理,IP,局域網共享同一公網IP出口會干擾獲取的IP地址的唯一性和準確性
IP+User agent:對于用戶而言,當使用相同的終端瀏覽網站時,user agent的信息是相對固定的操作系統和瀏覽器
Cookie:是網站以小段文本的形式存放在用戶本地終端信息,以便網站之后的讀取,cookie有有效期限,google analytics是2年。
Userid:如果網站需要注冊,那注冊后有個id,這個id是唯一且標識用戶身份,網站會把它寫入到cookie以便下次訪問判斷用戶身份
網站一個用戶每次完整訪問的過程,通過每次訪問記錄整理后先后順序呈現:
網站分析中的各指標:
1)IP:
google將IP地址匯總并只顯示到市/縣,可以很好保護隱私
2)瀏覽量和唯一身份瀏覽量:
瀏覽量:網站頁面被加載的總次數=每個訪問者*每個訪問者的總訪問次數
唯一身份瀏覽量:匯總由同一用戶在同一會話旗艦生成的瀏覽量
3)網站停留時間,頁面停留時間:
4)跳出率與退出率:
跳出針對的是訪問者來到網站后訪問的第一個頁面,即訪問者的登錄頁面
5)某段時間的訪問時長和訪問深度: