柚子快報激活碼778899分享:hive學習筆記之四:分區(qū)表
柚子快報激活碼778899分享:hive學習筆記之四:分區(qū)表
create table t9 (name string, age int)
partitioned by (city string)
row format delimited
fields terminated by ‘,’;
查看:
hive> desc t9;
OK
name string
age int
city string
Partition Information
col_name data_type comment
city string
Time taken: 0.159 seconds, Fetched: 8 row(s)
創(chuàng)建名為009.txt的文本文件,內(nèi)容如下,可見每行只有name和age兩個字段,用來分區(qū)的city字段不在這里設置,而是在執(zhí)行導入命令的時候設置,稍后就會見到:
tom,11
jerry,12
導入數(shù)據(jù)的命令如下,可見導入命令中制定了city字段,也就是說一次導入的所有數(shù)據(jù),city字段值都是同一個:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t9
partition(city=‘shenzhen’);
再執(zhí)行一次導入操作,命令如下,city的值從前面的shenzhen改為guangzhou:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t9
partition(city=‘guangzhou’);
查詢數(shù)據(jù),可見一共四條數(shù)據(jù),city共有兩個值:
hive> select * from t9;
OK
t9.name t9.age t9.city
tom 11 guangzhou
jerry 12 guangzhou
tom 11 shenzhen
jerry 12 shenzhen
Time taken: 0.104 seconds, Fetched: 4 row(s)
前面曾提到分區(qū)實際上是不同的子目錄,來看一下是不是如此,如下圖,紅框是t9的文件目錄,下面有兩個子目錄city=guangzhou和city=shenzhen:
查看子目錄里面文件的內(nèi)容,可見每條記錄只有name和age兩個字段:
[hadoop@node0 bin]$ ./hadoop fs -ls /user/hive/warehouse/t9/city=guangzhou
Found 1 items
-rwxr-xr-x 3 hadoop supergroup 16 2020-10-31 16:47 /user/hive/warehouse/t9/city=guangzhou/009.txt
[hadoop@node0 bin]$ ./hadoop fs -cat /user/hive/warehouse/t9/city=guangzhou/009.txt
tom,11
jerry,12
[hadoop@node0 bin]$
以上就是以單個字段做靜態(tài)分區(qū)的實踐,接下來嘗試多字段分區(qū);
靜態(tài)分區(qū)(多字段分區(qū))
新建名為t10的表,有兩個分區(qū)字段:province和city,建表語句:
create table t10 (name string, age int)
partitioned by (province string, city string)
row format delimited
fields terminated by ‘,’;
上述建表語句中,分區(qū)字段province寫在了city前面,這就意味著第一級子目錄是province值,每個province子目錄,再按照city值建立二級子目錄,圖示如下:
第一次導入,province=‘shanxi’, city=‘xian’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘shanxi’, city=‘xian’);
第二次導入,province=‘shanxi’, city=‘xian’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘shanxi’, city=‘hanzhong’);
第三次導入,province=‘guangdong’, city=‘guangzhou’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘guangdong’, city=‘guangzhou’);
第四次導入,province=‘guangdong’, city=‘shenzhen’:
load data
local inpath ‘/home/hadoop/temp/202010/25/009.txt’
into table t10
partition(province=‘guangdong’, city=‘shenzhen’);
全部數(shù)據(jù)如下:
自我介紹一下,小編13年上海交大畢業(yè),曾經(jīng)在小公司待過,也去過華為、OPPO等大廠,18年進入阿里一直到現(xiàn)在。
深知大多數(shù)Java工程師,想要提升技能,往往是自己摸索成長或者是報班學習,但對于培訓機構動則幾千的學費,著實壓力不小。自己不成體系的自學效果低效又漫長,而且極易碰到天花板技術停滯不前!
因此收集整理了一份《2024年Java開發(fā)全套學習資料》,初衷也很簡單,就是希望能夠幫助到想自學提升又不知道該從何學起的朋友,同時減輕大家的負擔。
既有適合小白學習的零基礎資料,也有適合3年以上經(jīng)驗的小伙伴深入學習提升的進階課程,基本涵蓋了95%以上Java開發(fā)知識點,真正體系化!
由于文件比較大,這里只是將部分目錄截圖出來,每個節(jié)點里面都包含大廠面經(jīng)、學習筆記、源碼講義、實戰(zhàn)項目、講解視頻,并且會持續(xù)更新!
如果你覺得這些內(nèi)容對你有幫助,可以掃碼獲?。。。▊渥ava獲?。?/p>
最后
畢竟工作也這么久了 ,除了途虎一輪,也七七八八面試了不少大廠,像阿里、餓了么、美團、滴滴這些面試過程就不一一寫在這篇文章上了。我會整理一份詳細的面試過程及大家想知道的一些問題細節(jié)
美團面試經(jīng)驗
字節(jié)面試經(jīng)驗 菜鳥面試經(jīng)驗 螞蟻金服面試經(jīng)驗 唯品會面試經(jīng)驗
因篇幅有限,圖文無法詳細發(fā)出 《互聯(lián)網(wǎng)大廠面試真題解析、進階開發(fā)核心學習筆記、全套講解視頻、實戰(zhàn)項目源碼講義》點擊傳送門即可獲??! g-q4FWZNof-1712576420402)] 菜鳥面試經(jīng)驗 [外鏈圖片轉(zhuǎn)存中…(img-wQbmlvxY-1712576420402)] 螞蟻金服面試經(jīng)驗 [外鏈圖片轉(zhuǎn)存中…(img-2kPG1xVo-1712576420402)] 唯品會面試經(jīng)驗 [外鏈圖片轉(zhuǎn)存中…(img-RarqmzDY-1712576420402)]
因篇幅有限,圖文無法詳細發(fā)出 《互聯(lián)網(wǎng)大廠面試真題解析、進階開發(fā)核心學習筆記、全套講解視頻、實戰(zhàn)項目源碼講義》點擊傳送門即可獲?。?/p>
柚子快報激活碼778899分享:hive學習筆記之四:分區(qū)表
相關文章
本文內(nèi)容根據(jù)網(wǎng)絡資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點和立場。
轉(zhuǎn)載請注明,如有侵權,聯(lián)系刪除。