三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

^{<blockquote id="aa38b"><i id="aa38b"></i></blockquote>}

<legend id="aa38b"><track id="aa38b"></track></legend>

登錄注冊寫文章

hadoop體系的簡單學習筆記

hadoop體系的簡單學習筆記

Mahout

mahout：運行在hadoop集群上的機器學習庫

使用mahout：

下載，解壓安裝包
設置環境變量，編譯配置文件
鍵入mahout --help命令，檢查Mahout是否安裝完好
在hdfs的目標目錄中，輸入mahout xxxx執行mahout作業
mahout會在根目錄建立output新文件夾，保存計算結果

Hive

值得注意的特性：

Hive的實時性很差
Thrift服務使得不同的編程語言都可以調用Hive接口

Hive 的使用：

安裝SQL
進入mysql命令行，創建hive用戶并賦予所有權限
使用hive用戶登錄，創建hive數據庫
安裝并部署Hive（包括一系列復雜的配置blablalba...)
啟動metastore和hiveserver服務
進入hive命令行，使用HQL進行操作。

Pig：

Pig 有兩種運行模式：
Local 模式和 MapReduce 模式。
Pig的三種調用方式：
Grunt shell方式：通過交互的方式，輸入命令執行任務；
Pig script方式：通過script腳本的方式來運行任務；
嵌入式方式：嵌入java源代碼中，通過java調用來運行任務。
Pig的使用

下載，解壓Pig程序，配置環境變量及Pig運行模式，編譯配置文件
啟動hadoop集群，在shell中輸入pig，看到pig連接到hadoop集群的信息并且進入了grunt shell命令行模式
然后調用hadoop上傳本地文件命令hadoop fs -xxx把該文件傳到HDFS上
在pig shell中輸入相關命令，執行job
在執行過程中可在JobTracker頁面觀察運行情況
在hdfs中查看運行結果

Hbase

Hbase在Hadoop體系中的位置：

層級構件	描述
HDFS	文件系統
Hbase	數據庫管理系統
Hive	高級數據庫管理語言（Hive）

HBase訪問接口

Native Java API，最常規和高效的訪問方式，適合Hadoop MapReduce Job并行批處理HBase表數據
HBase Shell，HBase的命令行工具，最簡單的接口，適合HBase管理使用
Thrift Gateway，利用Thrift序列化技術，支持C++，PHP，Python等多種語言，適合其他異構系統在線訪問HBase表數據
REST Gateway，支持REST 風格的Http API訪問HBase, 解除了語言限制
Pig，可以使用Pig Latin流式編程語言來操作HBase中的數據，和Hive類似，本質最終也是編譯成MapReduce Job來處理HBase表數據，適合做數據統計
Hive，當前Hive的Release版本尚沒有加入對HBase的支持，但在下一個版本Hive 0.7.0中將會支持HBase，可以使用類似SQL語言來訪問HBase

Sqoop

Sqoop即 SQL to Hadoop ，是一款方便的在傳統關系型數據庫與Hadoop之間進行數據遷移的工具，它充分的利用了MapReduce并行特點以批處理的方式加快數據傳輸。

Flume

Flume是一個分布式、可靠和高可用的海量日志采集、聚合和傳輸的系統。

Flume的輸入端（數據源）可以是：

console（控制臺）
RPC（Thrift-RPC）
text（文件）
tail（UNIX tail）
syslog（syslog日志系統，支持TCP和UDP等2種模式）
exec（命令執行）

Flume的輸出端可以是：

console（控制臺）
text（文件）
dfs（HDFS文件）
RPC（Thrift-RPC）
syslogTCP（TCP syslog日志系統）

最后編輯于：2017.12.09 00:41:39

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明：文章內容（如有圖片或視頻亦包括在內）由作者上傳并發布，文章內容僅代表作者本人觀點，簡書系信息發布平臺，僅提供信息存儲服務。

推薦閱讀更多精彩內容

史上最全，100+大數據開源處理工具匯總
http://geek.csdn.net/news/detail/210469http://www.36dsj.c...
Albert陳凱閱讀 5,216評論 1贊 21
Hadoop大數據平臺架構與實踐 | hadoop概述與安裝
e> Hadoop大數據平臺架構與實踐--基礎篇目錄內容概要Hadoop前生Hadoop的功能與優勢Hadoo...
拾壹北閱讀 3,113評論 0贊 20
Hadoop概論淺學
Hadoop生態圈可以把hadoop想象成一個很大的生態圈(本來就是)，或者說想象成一個動物園吧，之后的東西就比...
mrlevo520閱讀 817評論 0贊 4
[dataguru]Hadoop數據分析平臺2016-10-22
//Hadoop_v4_14.pdf Hadoop生態圈 UDF? 什么是UDF? 支持UDF的項目:例如Pig,...
葡萄喃喃囈語閱讀 677評論 0贊 1
[資源列表]史上最全的“大數據”學習資源
史上最全的“大數據”學習資源（上）-博客-云棲社區-阿里云https://yq.aliyun.com/articl...
葡萄喃喃囈語閱讀 2,397評論 0贊 50

1贊2贊

贊賞

手機看全文

主站蜘蛛池模板：金沙县| 青神县| 宁南县| 磐石市| 温州市| 兴文县| 黔西县| 新乡县| 榕江县| 丹棱县| 定南县| 土默特右旗| 金阳县| 沽源县| 南靖县| 仪陇县| 读书| 建瓯市| 嵊泗县| 临夏县| 驻马店市| 马关县| 娄底市| 白河县| 南昌市| 灵丘县| 醴陵市| 长顺县| 儋州市| 汝州市| 和田县| 勐海县| 海门市| 屯门区| 枣庄市| 旬阳县| 全椒县| 江安县| 旬邑县| 滁州市| 赣榆县|

^{<blockquote id="svqch"></blockquote>}

<cite id="svqch"></cite>