
IP屬地:上海
你好 嗯嗯 好的 然后了
包括表過濾、列標(biāo)簽過濾、值過濾
輸出MySQL的表 需要向MySQLstats_visitor_basic表和stats_visitor_browser表中插入數(shù)據(jù),插入數(shù)據(jù)的...
多個(gè)Reducer操作同一張表可能出現(xiàn)的錯(cuò)誤 假設(shè)有兩個(gè)Reducer,R1和R2,都需要操作MySQL的Dimension表(封裝成getDi...
Flume監(jiān)聽Nginx日志 要求:1. 日志文件每十分鐘生成一次,日志內(nèi)容達(dá)到 1M 時(shí)也生成一次2. HDFS上的日志文件名稱為:nginx...
Nginx配置 修改${nginx_home}/conf/nginx.conf配置文件 找到http節(jié)點(diǎn),添加日志格式# 定義日志格式# log...
日志格式 數(shù)據(jù)清洗 對(duì)日志進(jìn)行解析,得到ip信息(所在國(guó)家、省份和城市)、事件類型等,并且過濾無(wú)效日志。將解析后的結(jié)果存入HBase,為后續(xù)任務(wù)...
本地運(yùn)行 解壓Hadoop安裝包hadoop-2.5.0-cdh5.3.6.tar.gz 設(shè)置HADOOP_HOME環(huán)境變量(最好在用戶變量和系...