Hive建表和內外部表的使用

2020-11-23 分享電腦學習

一、普通建表方式

create table stu_info(

id int,

name string

)ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '

載入數據

load data local inpath '/data/hivetest/stu_info_local' into table stu_info;

load data inpath '/data/hivetest/stu_info_local' into table stu_info;

另外的方式

官網

二、子查詢方式建表

我們練習下

創建一個練習庫

創建一個普通表

create table normal(

id int,

name string

)ROW FORMAT DELIMITED FIELDS TERMINATED BY ' '

我們裝載數據

load data local inpath '/data/hivetest/stu_info_two' into table normal;

我們看數據是存在的

我們利用子查詢生成新表

create table normal_zcx_t as select * from normal;

實際在跑MapReduce

我們查看表和數據

我們可以看到元數據也存在

表結構也一樣

我們再看下HDFS

所以子查詢將查詢的數據和表的結構賦予一張新的表

三、Like建表

我們建表

create table normal_like_t like normal;

只有表結構,沒有數據,但是相對於子查詢沒有MapReduce執行,速度會快很多。

元數據和HDFS都有

四、數據共享

我們重新創建一個資料庫

創建員工表

創建部門表

導入數據

我們創建表引用另外一個表的文件,比如引入我們的dept表的文件

可以看到表

元數據也有

數據也有

我們把dept_yr數據清空,會發現dept的數據竟然也沒有了

那我們重新加載數據呢?

這時候我們明白了,它倆在一起關聯的,添加和清除在一起。

如果刪除的話 drop table dept_yr;數據還是清空

所以這種方式建表,他們是互相影響的。

數據共享一份數據,刪除的時候就把共享的數據刪除

刪除表也會把元數據數據刪除,清除HDFS上的文件

建表中,這有兩個關鍵字

如果我們不加這兩個關鍵字,表默認是管理表

我們先看TEMPORARY

我們創建

我們導入數據

去查詢元數據,發現沒有信息

用desc formatted查看,信息是有的

我們看其中的數據存放路徑

查看一下HDFS

這就是臨時表的一些特點

如果關閉的話,就會自動刪除臨時表,也可以手動刪除,常作為臨時結果使用。

如果用location+temporary共享數據會發生什麼呢?可以做個練習。(1)關閉客戶端對原始數據的影響?(2)刪除臨時表對原始數據的影響?(3)如果是清空臨時表呢?

我們創建EXTERNAL表

我們看元數據

Formatted

我們再dept中加載數據

發現數據在外部表也是有的

如果我們清空外部表,就會報錯

FAILED: SemanticException [Error 10146]: Cannot truncate non-managed table dept_ext.

那我們刪除外部表呢?不會對原始數據產生影響

元數據也沒了

練習:如果不使用location,直接創建的話,刪除表會怎麼樣?

總結:刪除表時,內部表元數據和數據一起刪除,而外部表只刪除元數據,不會刪除數據,以及HDFS上表對應的目錄及文件都不會刪除。

相關焦點

  • Hive數據倉庫實戰
    Hive SQL操作Hive做查詢數據、更新數據前提需要先建表,有了表之後我們可以往表裡寫入數據,之後才可以查詢和更新等操作。以上我們講的Hive常用SQL和UDF,以及怎麼用Shell腳本觸發執行SQL,怎麼去做定時的調度。實際工作中,並不是盲目隨意的去建表,一般都會制定一個規範,大家遵守這個規則去執行。這個規範就是我們下面要講的數據倉庫規範和模型設計。
  • hive中兩個數的和怎麼超市_hive中hive中月,天的數據導入兩級分區...
    暑假實習使用了兩個月的odps ,回學校看了下hadoop 的hive ,讓我對資料庫與數據倉庫增進了一些理解,記錄下來。簡而言之,資料庫是面向事務的設計,數據倉庫是面向主題設計的。資料庫一般存儲在線交易數據,數據倉庫存儲的一般是歷史數據。
  • 大數據開發:Hive調優的幾種思路
    一、本地模式當一個MapReduce任務的數據量和計算任務很小的時候,在MapReduce框架中Map任務和Reduce任務的啟動過程佔用了任務執行的大部分時間,真正的邏輯處理其實佔用時間很少,但是給用戶的感受就是:很小的任務,同樣執行較長的時間。
  • HiveSql基礎函數使用(一)
    一、hive函數1、關係函數2、日期函數3、條件函數4、字符串函數5、統計函數二、hiveQL1、DDL2、DML三、其它1、in()函數2、lateral view 函數3、row_number() 和rank
  • 【實驗技能】電流表內外接法選擇
    電流表內外接法選擇
  • 第04篇:資料庫中如何使用代碼實現建庫、建表、建約束
    前面在第一篇中,曾主要講解通過資料庫管理系統(DBMS)的圖形化界面實現建庫、建表、建約束。雖然簡單易操作,但如果不小心將資料庫、表格意外刪除,就需要重新創建;如果多次執行這樣的操作就會感覺非常繁瑣。再者當項目測試完成後,需要部署在客戶的真實電腦上。
  • 濟南市內外環氧粉末塗塑管道生產廠家使用和連接
    濟南市內外環氧粉末塗塑管道生產廠家使用和連接 ,「ls8rrqa8n」   濟南市內外環氧粉末塗塑管道生產廠家使用和連接    鋼管道水泥砂漿襯裡所形成隔水隔氣的緻密保護依賴於水泥砂漿與鋼管道緊密檢查,塗塑鋼管生產廠家就是用肉眼檢查塗覆鋼管的外觀質量。
  • 農村自建房講究風水寶地,蜜蜂建巢講究內外兼備,有何淵源嗎
    農民在選擇農村宅基地的自建房屋時,都相信風水寶地這樣的說法,也都希望自家能夠建在風水寶地上,但是從科學的角度來說,風水寶地,其實就是地理環境。說到農民建房子的嚴謹,就不得不說說蜜蜂建巢的講究。蜜蜂建巢需要滿足內外條件,還需要養蜂人及時配合,才能發揮最大的作用,這到底是怎麼回事呢?
  • 建表時索引面板上的clustered意思
    選中該項,則表在顯示時會按照選擇的順序排列顯示。使用clustered建索引時慢,但以後的檢索速度快. unclustered構建設索引時快,以後使用時不如clustered的索引速度快.一個表或視圖只允許同時有一個聚集索引。 具有聚集索引的視圖稱為索引視圖。必須先為視圖創建唯一聚集索引,然後才能為該視圖定義其它索引。 在創建任何非聚集索引之前創建聚集索引。創建聚集索引時重建表上現有的非聚集索引。 如果沒有指定 CLUSTERED,則創建非聚集索引。
  • 如何正確使用內外循環功能_易車網
    >NEWSPAPER今日速遞TODAY''S NEWSFLASH如何正確使用內外循環功能究其原因,很有可能是車友們在行車過程中,沒有正確使用內外循環引起的。在城裡行車遇到擁堵的情形時,車內會充滿尾氣味,這就是由於使用外循環造成的。內循環—阻隔汙濁氣體內循環狀態是關閉了車內外的氣流通道,不開風機就沒有氣流循環,開風機時吸入的氣流也僅來自車內,形成車輛內部的氣流循環。
  • 麗水市內外塗環氧複合管和鋼塑複合管
    在道路運輸中,作為輸送的關鍵點,管道系統的質量問題往往是後期使用的評價標準,尤其是直埋管道系列,不僅要用於運輸系統,還要具有隔熱和防腐功能。那麼如何確定直埋管道的質量問題呢?大成星偉業採用實驗室測試和現場測試兩個步驟,其中實驗室測試主要測量層數。機械性能:能承受苛刻的使用條件:塗層韌性好,機械強度高,承載能力強,優於其他礦用塑料管。牆面光滑,功能性強,不導電,抗彎性好等。,似乎是為地鐵管道而生。
  • 西安市給水用內外外PE內EP防腐鋼管產品理論重量表
    西安市給水用內外外PE內EP防腐鋼管產品理論重量表   使用時必須加強清潔。以上因素,短期塗塑鋼管價格在庫存的衝擊下,繼續下跌的概率很大。塗塑鋼管的質量,用戶如果能了解塗塑工藝就簡單的多了,好的塗塑鋼管制造工藝,進行噴塗、熱浸工藝,這樣製造的塗塑鋼管的表面質量更加光滑。
  • 帶表內卡規的規格參數及使用方法
    ,可用於測量內外徑、深孔溝槽直徑、板厚等尺寸及其偏差,檢測直觀,使用方便,是一種通用型量具所無法替代的檢測工具。3級量塊與量塊夾子組成的內尺寸進行檢驗;帶表外卡規的示值誤差是用3級量塊組成的外尺寸進行檢驗。
  • 第01篇:使用SQLServer客戶端工具界面建庫、建表、建約束
    主要包括:SQLServer2008工具的基本操作、SQL語言的基本語法、資料庫設計的三大範式以及多表查詢、存儲過程、事務、函數、索引、觸發器等相關高級應用。01為什麼要使用資料庫?前期的數據管理,要麼數據不共享、要麼數據不保存;出現資料庫管理系統後,程序和數據的聯繫開始通過資料庫管理系統來實現。這種方式具有較高的數據獨立性,資料庫系統為用戶提供了方便的用戶接口。
  • 雅安鋼套鋼直埋蒸汽管道內外滑動廠家產品質量標準對照表
    雅安鋼套鋼直埋蒸汽管道內外滑動廠家產品質量標準對照表 ,「ls8rrqa8o」   雅安鋼套鋼直埋蒸汽管道內外滑動廠家產品質量標準對照表    管道的保護管的要問題是嚴密防水的可靠性,此外要有良好的機械強度,鋼套管由於強度高採用焊接連接,防水的密封性能可靠性十分高
  • 雙金屬焊接內外塗塑鋼管郴州廠家常見使用壽命多少年?
    雙金屬焊接內外塗塑鋼管郴州廠家常見使用壽命多少年?   固化扶著力強,附著力大於等於、優越的抗靜電性能、耐腐蝕、不結垢、可承受苛刻的使用條件。
  • 南平市排水用內外塗塑螺旋鋼管使用規格選擇
    南平市排水用內外塗塑螺旋鋼管使用規格選擇 ,「ft4g5p2y」   南平市排水用內外塗塑螺旋鋼管使用規格選擇    分析環氧鋼管的特性,除了粘性指標較好外,其它諸如塑性、溫度穩定性、大氣穩定性等指標都較差;但又因其含有酚、蔥油、蔡油等有毒物質,使它的性能
  • 電工常用儀表使用方法:電流表和電壓表
    電流表   電流表串接在被測量的電路中,測量其電流值。按所測電流性質可分為直流電流表、交流電流表和交直兩用電流表。就其測量範圍又有微安表、毫安表和安培表之分。按動作原理分為磁電式、電磁式和電動式等。