1. 將csv或Excel文件轉換為文本,以逗號或者制表符都可以:
xigua.txt
id,color,root,stroke,venation,umbilical,touch,status
1,青綠,蜷縮,濁響,清晰,凹陷,硬滑,是
2,烏黑,蜷縮,沉悶,清晰,凹陷,硬滑,是
3,烏黑,蜷縮,濁響,清晰,凹陷,硬滑,是
4,青綠,蜷縮,沉悶,清晰,凹陷,硬滑,是
5,淺白,蜷縮,濁響,清晰,凹陷,硬滑,是
6,青綠,稍蜷,濁響,清晰,稍凹,軟粘,是
7,烏黑,稍蜷,濁響,稍糊,稍凹,軟粘,是
8,烏黑,稍蜷,濁響,清晰,稍凹,硬滑,是
9,烏黑,稍蜷,沉悶,稍糊,稍凹,硬滑,否
10,青綠,硬挺,清脆,清晰,平坦,軟粘,否
11,淺白,硬挺,清脆,模糊,平坦,硬滑,否
12,淺白,蜷縮,濁響,模糊,平坦,軟粘,否
13,青綠,稍蜷,濁響,稍糊,凹陷,硬滑,否
14,淺白,稍蜷,沉悶,稍糊,凹陷,硬滑,否
15,烏黑,稍蜷,濁響,清晰,稍凹,軟粘,否
16,淺白,蜷縮,濁響,模糊,平坦,硬滑,否
17,青綠,蜷縮,沉悶,稍糊,稍凹,硬滑,否
2. 在hive中新建表:
create table watermelon (id String,
color String,
root String,
stroke String,
venation String,
umbilical String,
touch String,
status String)
ROW format delimited fields terminated by ',' STORED AS TEXTFILE;
可以desc看一下對不
3. 將本地數(shù)據導入到hive表:
load data local inpath '/home/johnny/storage/xigua.txt' into table watermelon;
查看數(shù)據是否準確
select * from watermelon limit 10;
hive> select * from watermelon;
OK
1 青綠 蜷縮 濁響 清晰 凹陷 硬滑 是
2 烏黑 蜷縮 沉悶 清晰 凹陷 硬滑 是
3 烏黑 蜷縮 濁響 清晰 凹陷 硬滑 是
4 青綠 蜷縮 沉悶 清晰 凹陷 硬滑 是
5 淺白 蜷縮 濁響 清晰 凹陷 硬滑 是
6 青綠 稍蜷 濁響 清晰 稍凹 軟粘 是
7 烏黑 稍蜷 濁響 稍糊 稍凹 軟粘 是
8 烏黑 稍蜷 濁響 清晰 稍凹 硬滑 是
9 烏黑 稍蜷 沉悶 稍糊 稍凹 硬滑 否
10 青綠 硬挺 清脆 清晰 平坦 軟粘 否
11 淺白 硬挺 清脆 模糊 平坦 硬滑 否
12 淺白 蜷縮 濁響 模糊 平坦 軟粘 否
13 青綠 稍蜷 濁響 稍糊 凹陷 硬滑 否
14 淺白 稍蜷 沉悶 稍糊 凹陷 硬滑 否
15 烏黑 稍蜷 濁響 清晰 稍凹 軟粘 否
16 淺白 蜷縮 濁響 模糊 平坦 硬滑 否
17 青綠 蜷縮 沉悶 稍糊 稍凹 硬滑 否
Time taken: 0.185 seconds, Fetched: 17 row(s)