統計網站訪問日志Shell腳本

作為一個網站的管理員,web日志有很多信息值得去關注,但每天去查看海量的日志效率很低,于是寫了個腳本來統計web日志,結合排程就可以每天定時發送到指定郵箱,方便管理員更直觀的了解網站情況。
腳本統計了:
1、總訪問量
2、總帶寬
3、獨立訪客量
4、訪問IP統計
5、訪問url統計
6、來源頁面統計
7、404統計
8、搜索引擎蜘蛛統計(谷歌,百度,搜狗)
9、搜索引擎來源統計(谷歌,谷歌HK,百度)

腳本中需要修改的變量:log_path、domain、email

#!/bin/bash
# @Date    : 2017-05-17
# @Author  : yangfannie
# @Name    : aoto_web_log.sh  --Automatic statistics website access log


log_path=/www/logs/yangfannie.com.log
domain="yangfannie.com"
email="admin@yangfannie.com"
maketime=`date +%Y-%m-%d" "%H":"%M`
logdate=`date -d "yesterday" +%Y-%m-%d`
total_visit=`wc -l ${log_path} | awk '{print $1}'`
total_bandwidth=`awk -v total=0 '{total+=$10}END{print total/1024/1024}' ${log_path}`
total_unique=`awk '{ip[$1]++}END{print asort(ip)}' ${log_path}`
ip_pv=`awk '{ip[$1]++}END{for (k in ip){print ip[k],k}}' ${log_path} | sort -rn | head -20`
url_num=`awk '{url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
referer=`awk -v domain=$domain '$11 !~ /http:\/\/[^/]*'"$domain"'/{url[$11]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
notfound=`awk '$9 == 404 {url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
spider=`awk -F'"' '$6 ~ /Baiduspider/ {spider["baiduspider"]++} $6 ~ /Googlebot/ {spider["googlebot"]++} $6 ~ /Sogou web spider/ {spider["sogouspider"]++}END{for (k in spider){print k,spider[k]}}'  ${log_path}`
search=`awk -F'"' '$4 ~ /https:\/\/www\.baidu\.com/ {search["baidu_search"]++} $4 ~ /https:\/\/www\.google\.com\.hk/ {search["googlehk_search"]++} $4 ~ /https:\/\/www\.google\.com/ {search["google_search"]++}END{for (k in search){print k,search[k]}}' ${log_path}`
echo -e "概況\n報告生成時間:${maketime}\n總訪問量:${total_visit}\n總帶寬:${total_bandwidth}M\n獨立訪客:${total_unique}\n\n訪問IP統計\n${ip_pv}\n\n訪問url統計\n${url_num}\n\n來源頁面統計\n${referer}\n\n404統計\n${notfound}\n\n蜘蛛統計\n${spider}\n\n搜索引擎來源統計\n${search}" | mail -s "$domain $logdate log statistics" ${email}

博客地址:http://yangfannie.com

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 中國互聯網用戶群已經成為世界最大的互聯網群體。與此同時,中國互聯網網站的發展也歷經了幾個階段,從單純的網絡媒體到現...
    零一間閱讀 4,394評論 1 41
  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 173,548評論 25 708
  • 聲明:本地圖炮由來自河南、安徽等地域歧視大省的編輯制作,不服也別打他們。 北京市 天津市 河北省 山東省 東北三省...
    網易王三三閱讀 2,352評論 17 42
  • “今天,你所能給孩子最危險的建議就是:去學校,好好念書,然后找個安全的工作?!?書里提出三個概念 1.不為金錢工作...
    聽風看樹望天空閱讀 630評論 2 9
  • 賣點、噱頭 賣點分為一級賣點、二級賣點 一級賣點往往只有一個,是最重要的 二級賣點可能有2-4個,相對重要 噱頭屬...
    易卿閱讀 398評論 0 1