柚子快報激活碼778899分享:hive學(xué)習(xí)筆記之四:分區(qū)表
柚子快報激活碼778899分享:hive學(xué)習(xí)筆記之四:分區(qū)表
create table t9 (name string, age int)
partitioned by (city string)
row format delimited
fields terminated by ‘,’;
查看:
hive> desc t9;
OK
name string
age int
city string
Partition Information
col_name data_type comment
city string
Time taken: 0.159 seconds, Fetched: 8 row(s)
創(chuàng)建名為009.txt的文本文件,內(nèi)容如下,可見每行只有name和age兩個字段,用來分區(qū)的city字段不在這里設(shè)置,而是在執(zhí)行導(dǎo)入命令的時候設(shè)置,稍后就會見到:
tom,11
jerry,12
導(dǎo)入數(shù)據(jù)的命令如下,可見導(dǎo)入命令中制定了city字段,也就是說一次導(dǎo)入的所有數(shù)據(jù),city字段值都是同一個:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t9
partition(city=‘shenzhen’);
再執(zhí)行一次導(dǎo)入操作,命令如下,city的值從前面的shenzhen改為guangzhou:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t9
partition(city=‘guangzhou’);
查詢數(shù)據(jù),可見一共四條數(shù)據(jù),city共有兩個值:
hive> select * from t9;
OK
t9.name t9.age t9.city
tom 11 guangzhou
jerry 12 guangzhou
tom 11 shenzhen
jerry 12 shenzhen
Time taken: 0.104 seconds, Fetched: 4 row(s)
前面曾提到分區(qū)實際上是不同的子目錄,來看一下是不是如此,如下圖,紅框是t9的文件目錄,下面有兩個子目錄city=guangzhou和city=shenzhen:
查看子目錄里面文件的內(nèi)容,可見每條記錄只有name和age兩個字段:
[hadoop@node0 bin]$ ./hadoop fs -ls /user/hive/warehouse/t9/city=guangzhou
Found 1 items
-rwxr-xr-x 3 hadoop supergroup 16 2020-10-31 16:47 /user/hive/warehouse/t9/city=guangzhou/009.txt
[hadoop@node0 bin]$ ./hadoop fs -cat /user/hive/warehouse/t9/city=guangzhou/009.txt
tom,11
jerry,12
[hadoop@node0 bin]$
以上就是以單個字段做靜態(tài)分區(qū)的實踐,接下來嘗試多字段分區(qū);
靜態(tài)分區(qū)(多字段分區(qū))
新建名為t10的表,有兩個分區(qū)字段:province和city,建表語句:
create table t10 (name string, age int)
partitioned by (province string, city string)
row format delimited
fields terminated by ‘,’;
上述建表語句中,分區(qū)字段province寫在了city前面,這就意味著第一級子目錄是province值,每個province子目錄,再按照city值建立二級子目錄,圖示如下:
第一次導(dǎo)入,province=‘shanxi’, city=‘xian’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘shanxi’, city=‘xian’);
第二次導(dǎo)入,province=‘shanxi’, city=‘xian’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘shanxi’, city=‘hanzhong’);
第三次導(dǎo)入,province=‘guangdong’, city=‘guangzhou’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘guangdong’, city=‘guangzhou’);
第四次導(dǎo)入,province=‘guangdong’, city=‘shenzhen’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘guangdong’, city=‘shenzhen’);
全部數(shù)據(jù)如下:
自我介紹一下,小編13年上海交大畢業(yè),曾經(jīng)在小公司待過,也去過華為、OPPO等大廠,18年進入阿里一直到現(xiàn)在。
深知大多數(shù)Java工程師,想要提升技能,往往是自己摸索成長或者是報班學(xué)習(xí),但對于培訓(xùn)機構(gòu)動則幾千的學(xué)費,著實壓力不小。自己不成體系的自學(xué)效果低效又漫長,而且極易碰到天花板技術(shù)停滯不前!
因此收集整理了一份《2024年Java開發(fā)全套學(xué)習(xí)資料》,初衷也很簡單,就是希望能夠幫助到想自學(xué)提升又不知道該從何學(xué)起的朋友,同時減輕大家的負擔(dān)。
既有適合小白學(xué)習(xí)的零基礎(chǔ)資料,也有適合3年以上經(jīng)驗的小伙伴深入學(xué)習(xí)提升的進階課程,基本涵蓋了95%以上Java開發(fā)知識點,真正體系化!
由于文件比較大,這里只是將部分目錄截圖出來,每個節(jié)點里面都包含大廠面經(jīng)、學(xué)習(xí)筆記、源碼講義、實戰(zhàn)項目、講解視頻,并且會持續(xù)更新!
如果你覺得這些內(nèi)容對你有幫助,可以掃碼獲?。。。▊渥ava獲取)
最后
面試前一定少不了刷題,為了方便大家復(fù)習(xí),我分享一波個人整理的面試大全寶典
Java核心知識整理
Java核心知識
Spring全家桶(實戰(zhàn)系列)
其他電子書資料
Step3:刷題
既然是要面試,那么就少不了刷題,實際上春節(jié)回家后,哪兒也去不了,我自己是刷了不少面試題的,所以在面試過程中才能夠做到心中有數(shù),基本上會清楚面試過程中會問到哪些知識點,高頻題又有哪些,所以刷題是面試前期準(zhǔn)備過程中非常重要的一點。
以下是我私藏的面試題庫:
《一線大廠Java面試題解析+核心總結(jié)學(xué)習(xí)筆記+最新講解視頻+實戰(zhàn)項目源碼》,點擊傳送門即可獲?。?.(img-cOwat4e6-1711972093734)]
Step3:刷題
既然是要面試,那么就少不了刷題,實際上春節(jié)回家后,哪兒也去不了,我自己是刷了不少面試題的,所以在面試過程中才能夠做到心中有數(shù),基本上會清楚面試過程中會問到哪些知識點,高頻題又有哪些,所以刷題是面試前期準(zhǔn)備過程中非常重要的一點。
以下是我私藏的面試題庫:
[外鏈圖片轉(zhuǎn)存中…(img-3ezmfFxl-1711972093735)] 《一線大廠Java面試題解析+核心總結(jié)學(xué)習(xí)筆記+最新講解視頻+實戰(zhàn)項目源碼》,點擊傳送門即可獲??!
柚子快報激活碼778899分享:hive學(xué)習(xí)筆記之四:分區(qū)表
推薦文章
本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權(quán),聯(lián)系刪除。