頂級Hadoop管理員面試問題與回答

2021-02-14 光環智慧IT

在2010年,沒有人知道什麼是Hadoop.但在今天,房間裡的「大象」標誌讓Hadoop已儼然成為了大數據的寵兒。程式設計師、架構師、系統管理員和數據倉庫員都在千方百計地學習存儲和處理大數據集的Hadoop。與此同時,市場上關於Hadoop管理的招聘也在如火如荼的進行著。

那麼,為了幫助大家更快速的找到一份Hadoop管理方面的工作,數據妞與大家分享一篇頂級Hadoop管理員的面試問題及答案,讓大家輕鬆應對未來求職之旅。

Hadoop管理員面試,圍繞Hadoop軟體安裝,配置和維護,測試一個考生的知識範圍,一個Hadoop管理員需要基於利益相關者的需求研究,實現特定的平臺大數據解決方案。這是一個面試者為Hadoop管理員面試所必要的,精通大型數據管理的概念。

為了證明自己是一位合格的Hadoop管理員的候選人,你需要具備對於處理Hadoop項目的知識和管理能力,展示特定領域的興趣和專業知識,具有多任務處理能力和領導能力。

如果你已經申請了Hadoop的管理員工作,那麼它值得你花一些時間去回顧這些列在下面的面試問題。

1、解釋不同的配置文件以及它們位於何處?

配置文件位於conf子目錄。Hadoop有3個不同的配置文件,hdfs-site.xml, core-site.xml mapred-site.xml

2、要求運行Hadoop集群的進程是什麼?

Namenode,DataNode,TaskTracker和JobTracker

3、你將如何重新啟動節點?

最簡單的做法是運行停止運行命令shell腳本,即點擊stop-all.sh。一旦這樣做了,重啟NameNode點擊start-all.sh

4、解釋在Hadoop上的不同的調度程序。

FIFO調度——調度系統中不考慮系統中的異質性,但命令工作是基於排隊達到的時間。

COSHH——這個計劃考慮工作量,調度決策的聚類和用戶異質性。

公平分享——Hadoop調度為每個用戶定義。這個地方包含一個資源地圖以及減少資源上的狹縫。每個用戶都可以使用自己的資源去執行這個作業。

5、列出幾個用於執行複製操作的Hadoop命令。

fs –put

fs –copyToLocal

fs –copyFromLocal

6、什麼是指揮用的JPS?

JPS命令用於驗證程序,這種程序運行Hadoop集群是否工作。它命令顯示輸出者的NameNode的現狀,Secondary NameNode, DataNode, TaskTracker 和 JobTracker。

7、當Hadoop部署生產環境時,什麼重要的硬體因素應該考慮?

基於應用程式的工作服務和管理服務之間的內存系統的內存需求會有所不同。

作業系統——一個64位作業系統,避免了任何限制,可用於在工作節點上的內存量。

存儲——最好是通過移動計算活動數據實現可擴展性和高性能的Hadoop平臺設計。

容量——大形的因子磁碟(3.5」)磁碟的成本比較低,相比比較小的形式因素磁碟允許存儲更多內容。

網絡——兩個TOR網絡交換機提供了較好的冗餘。

計算能力可以在Hadoop集群的Mapreduce槽可用的數量節點決定。

8、有多少節點可以運行在一個單一的Hadoop集群?

只有一個。

9、當Hadoop集群上的節點下來會發生什麼呢?

文件系統脫機時,Namenode下來了。

10、什麼是hadoop-env.sh下的文件和在文件應設置為Hadoop的工作上的變量?

這個文件提供hadoop的運行環境,包括以下variables-hadoop_classpathjava_homehadoop_log_dirjava_home變量應為Hadoop運行。

11、除了利用JPS的命令還有任何其他什麼方法,你可以檢查是否它是工作?

使用命令/ etc / init.d/hadoop-0.20-namenode狀態。

12、在一個MapReduce系統,如果HDFS塊大小為64 MB,有3個文件的大小127mb,64K和65mb與fileinputformat。在這種情況下,有多少輸入將很可能是由Hadoop框架組成?

2個分別為127 MB和65 MB的文件或者一個是64KB的文件。

13、哪個命令是檢驗HDFS是否被破壞?

hadoop fsck(文件系統檢查)命令用於檢查丟失塊。

14、列出了一些使用Hadoop生態系統的案例。

文本挖掘,圖分析,語義分析,情感分析,推薦系統。

15、你怎樣讓一個Hadoop不工作?

Hadoop的工作–清除工作ID。

16、我想看到所有的工作在Hadoop集群上運行。你該怎麼做?

使用命令–Hadoop作業–列表,給出了在Hadoop集群上運行的工作列表。

17、是否可以在多個集群中複製文件?如果是,你怎麼能做到這一項呢?

是的,它可能的複製文件到多個Hadoop集群,這可以使用分布式複製實現。distcp命令用於內部或跨集群複製。

18、什麼是最好的運行Hadoop作業系統?

Ubuntu和Linux是首選的運行Hadoop的作業系統。雖然Windows作業系統也可以用來運行Hadoop的但它會導致一些問題,所以並不推薦。

19、運行Hadoop的網絡要求是什麼?

SSH是需要運行啟動伺服器進程從屬節點。

一個密碼需要更少的SSH在主人,機器,和所有的苦工之間的連接。

20、將mapred.output.compress屬性設置為true,以確保所有的輸出文件壓縮在高效的空間使用Hadoop集群上。在特定情況下,如果群集用戶不需要對工作進行壓縮數據。你建議他做什麼?

如果用戶不想壓縮數據的一個特定的工作就應該創建自己的配置文件並且設置mapred.output.compress屬性為false。這個配置文件之後作為一個資源加載到相關工作。

21、什麼是實施一次最佳實踐的NameNode?

它始終是在一個單獨的獨立的機器更好地部署第二個Namenode。當次級節點部署在一個單獨的機器不受主節點幹擾的操作。

22、應該多長時間給NameNode重新格式化嗎?

Namenode不能格式化。這樣做會導致數據完全的丟失。NameNode是一次格式化開始之後,它創造了整個文件系統的元數據和命名空間ID目錄結構。

23、如果Hadoop產生了100個任務工作,並且其中一個任務失敗。Hadoop該怎麼做呢?

任務將再次開始一個新的TaskTracker,並且默認設置逾期不超過4次,(默認值是可以改變的),工作將會失敗。

24、你如何添加和刪除節點的Hadoop集群?

在HDFS集群中添加新節點,主機名應該被添加到文件然後在DataNode和TaskTracker開始在新的節點。

刪除或退役從HDFS集群的節點,主機名應該是從slaves–refreshnodes刪除文件執行。

25、您增加複製級別,但注意到該數據已複製。什麼原因導致錯誤?

其實沒有任何錯誤,如果有大量的數據,因為數據複製通常需要在時間的基礎上的數據大小作為集群進行數據複製,它可能需要幾個小時。

當你第一次Hadoop集群啟動安裝過程,你會怎樣設置安裝程序?

你將如何安裝新組件或添加到現有的Hadoop集群服務?

如果Hive的元數據服務在下降,那麼將對Hadoop集群有什麼影響?

當你建立一個Hadoop集群,你將如何決集群的大小?

你怎麼在同一集群運行Hadoop和實時進程?

如果你得到一個拒絕連接的案例-當登錄到一臺機器上的集群,可能是什麼原因?你將如何解決這個問題?

你如何識別和解決長期運行的工作?

你怎麼決定一個NameNode和Hadoop服務的堆內存的限制?

如果Hadoop服務在Hadoop集群上運行緩慢,什麼是它的根源,你將如何鑑別呢?

有多少數據節點可以運行在一個單一的Hadoop集群?

在Hadoop2.0和Hadoop 1.0配置

在高可用性的情況下,如果連接待機和活躍節點丟失。這種Hadoop集群將如何影響?

ZooKeeper服務在Hadoop 2和Hadoop1所需的最小數目是多少?

如果一個Hadoop集群的一些機器硬體質量很低。如何影響集群的性能和整體性能?

如何確定一個特定的節點,節點是死的嗎?

解釋「黑名單節點」和「死區節點」之間的區別。

你怎麼增加NameNode的內存?

在Hadoop的調度配置能力。

重新啟動後的集群之後,如果MapReduce之前的工作現在沒有實現,當重新開始的時候可能會出什麼錯誤?

說明添加和刪除一個節點的Hadoop集群的步驟。

在一個大且繁忙的Hadoop集群,如何識別長期運行的工作?

當Namenode關閉時,JobTracker做什麼?

當手動配置Hadoop,這屬性文件的修改應配置槽?

如何將新用戶添加到集群中?

推測執行的優勢是什麼?在什麼情況下,推測執行可能不會是有益的?

這些面試題是以個案為基礎的,根據你在哪裡申請Hadoop管理員角色,你在這個角色是否有一些經驗 。請在下面的評論中分享你的Hadoop管理員面試經驗。

你目前的Hadoop工作符合你目前的項目角色和責任描述嗎?

哪些工具用在你的項目監測的hadoop集群和節點?

你認為在一個集群中會出現多少個節點?

你在任何組織中致力於go-live工程嗎?

哪一種MapReduce版本適合配置你的Hadoop集群?

說明在公司任何明顯的Hadoop案例情況,有助於最大限度地提高其盈利能力?

你怎麼從無到有建立Hadoop集群?

你遵從什麼標準程序部署Hadoop?

你將如何管理一個Hadoop系統?

你會更喜歡使用哪種工具監控Hadoop和HBase的集群?

上面的列表只是對Hadoop管理員的不同類型的面試問題的概述。然而,Hadoop管理員面試問題基於你的工作經驗,來自的業務領域的不同而完全不同。

你是否擔心沒有經驗,如果你清楚你的基礎以及Hadoop項目的工作經驗,公司是願意僱傭你的。開始最重要的事情,是準備在hadoop管理中準備一個偉大的職業生涯,並且你一定可以成功的掌控一個hadoop管理員面試。為追求卓越和成功努力吧。

文章源自:來自36大數據(36dsj.com)

朋友們,不要忘記分享、點讚哦!

相關焦點

  • Hadoop大數據面試題全版本
    以下資料來源於網際網路,很多都是面試者們去面試的時候遇到的問題,我對其中有的問題做了稍許的修改了回答了部分空白的問題,其中裡面有些考題出的的確不是很好,但是也不乏有很好的題目,這些都是基於真實的面試來的,希望對即將去面試或向繼續學習hadoop,大數據等的朋友有幫助!
  • Hadoop高頻面試題(建議收藏)
    往往大家關於大數據的其他內容準備得非常充分,反倒問你什麼是Hadoop卻有點猝不及防,回答磕磕絆絆,給面試官的印象就很不好。另外,回答這個問題,一定要從事物本身上升到廣義去介紹。面試官往往通過這個問題來判斷你是否具有最基本的認知能力。Hadoop是一個能夠對大量數據進行分布式處理的軟體框架。以一種可靠、高效、可伸縮的方式進行數據處理。
  • 面試必備!Hadoop常見面試題匯總
    面試題二:請簡述Hadoop常用的配置文件及Hadoop集群搭建過程1、配置文件:Hadoop2.x的配置文件有core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、slavesHadoop3.x
  • 18個常見的項目經理面試問題及回答技巧
    僱主邀請你參加項目經理面試。但是,不知道面試官會問些什麼,也不知如何回答,下面的一些關於項目經理面試問題及回答技巧,希望能對你有所幫助。1.請簡要描述一下你自己,你的背景實際上,這是一個典型的求職面試問題。你不僅可以在項目經理面試中面對這個問題,還可以在任何面試中面對這個問題。
  • 面試技巧 | 「你為什麼離職?」這個問題到底怎麼回答?
    很多人擔心這個問題回答不好,會影響面試成績,因此各種理由也就應運而生,而實際上什麼樣的答案更能打動HR,我們今天就來一探究竟。你為什麼離職?我因為……幾分鐘內的一問一答,看似簡單,而實際上HR正在做著各種價值和風險評估。所以,作為面試者,一定要慎重看待這個問題。從這個問題上,HR想考驗面試者的是什麼呢?
  • 2016年國家公務員面試技巧:15個經典面試問題回答思路之「談談你的...
    下面,中公教育為大家總結公務員面試技巧:15個經典面試問題回答思路之「談談你的家庭情況」。希望即將參加面試的考生們認真複習,考出理想成績。更多國家公務員面試技巧,請點擊國家公務員考試網。國家公務員面試過程中,面試官會向應聘者發問,而應聘者的回答將成為國家公務員面試官考慮是否接受他的重要依據。
  • 24 個必知必會的系統管理員面試問題
    (給Linux愛好者加星標,提升Linux技能)轉自:linux中國linux.cn/article-11673-1.html即將進行系統管理員工作面試嗎
  • Hadoop面試題答案出爐!!你得了多少分?
    (錯誤 )分析:它是可以被修改的Hadoop的基礎配置文件是hadoop-default.xml,默認建立一個Job的時候會建立Job的Config,Config首先讀入hadoop-default.xml的配置,然後再讀入hadoop-site.xml的配置(這個文件初始的時候配置為空),hadoop-site.xml中主要配置需要覆蓋的hadoop-default.xml的系統級配置
  • 面試常見問題的巧妙回答!
    並且,經過面試讓招聘者認可自己,向主管或老闆推薦錄用你,也證明了你的能力。面試過程主要是面試官和應聘者之間的一問一答,。面試官需要在應聘者的回答中,了解她的職業素養、技能、能力、性格特點等,看這些是否滿足崗位要求。
  • 【職業指導】面試常見問題及面試問題回答技巧
    面試中會遇到一些極為棘手的問題,大家知道要如何回答才能打動面試官嗎?來看看小編整理的面試常見問題及面試問題回答技巧介紹了解下吧。
  • 考博面試問題經典回答
    考博複試專業課的面試形式大概有5種方式:1、複試中,專業課面試,導師問專業課問題,學生一一進行回答。2、個別院校單獨設定專業課面試,學生在面試過程中,回答老師的專業課問題。所以同學們要根據不同的面試形式做準備。二、考博複試專業課面試除了參考書的問題還有什麼樣的問題呢?複試面試導師問的問題非常廣泛,問參考書問題只是一部分,對於跨專業考生,也許導師會對你原來的專業感興趣,所以也是要準備的。
  • 常見面試問題及回答技巧
    回答提示:每個人的價值觀不同,自然評斷的標準也會不同,但是,在回答面試官這個問題時可不能太直接就把自己心理的話說出來,尤其是薪資方面的問題,不過一些無傷大雅的回答是不錯的考慮,如交通方便,工作性質及內容頗能符合自己的興趣等等都是不錯的答案,不過如果這時自己能仔細思考出這份工作的與眾不同之處,相信在面試上會大大加分。14、為什麼要離職?
  • 土建工程師面試常規問題及回答
    土建工程師面試有哪些常規問題,又怎麼回答呢?這通常是求職者常搜索的問題,築招網小編為大家整合了一份面試情況網友投稿,希望可以幫助到大家!一、社會招聘1.專業問題面試官會詢問很多專業知識的問題:PKPM規範條例、幾何原理、鋼結構、混凝土、材料力學、結構力學,彎矩圖怎麼畫,抗震、高層建築。專業基礎知識紮實的人,一一按照提問回答就好,如果回答不上來,直接跟面試官說下一個問題會幹脆一點。
  • 求職者如何回答面試優缺點的問題?
    面試優缺點是面試過程中最常見的問題,但仍有不少人把它答成一道送命題。面試官之所以詢問求職者他們的優缺點,是想通過這個來了解面試者的自我認知,分析他們是否符合公司崗位要求。常見的面試優缺點的問題應該如何回答呢?
  • 新媒體運營面試常見問題及回答技巧 面試中個人優缺點回答技巧
    今天就給大家分享一些新媒體運營面試常見的面試問題及如何回答的技巧。  1,請你先簡單的做個自我介紹  這個問題雖然是面試所有崗位都會問的問題,但是每個行業及崗位的回答技巧是不一樣的。那麼面試新媒體運營崗位時應該如何自我介紹呢?
  • 面試技巧 | 那些棘手的面試問題要怎麼回答?
    玲子在上個星期的面試中被問住了,一時不知道該如何回答。面試官問了她簡歷裡面的內容之後,本以為要結束面試了,誰知,面試官最後問她,「你為什麼想來這裡上班?」玲子就被問懵了。玲子是海投簡歷的,她事先沒有仔細了解過這家面試公司,只好草草地回答了幾句。結果,面試官委婉地說玲子下次記得好好準備面試。最後,玲子沒有收到錄用通知。
  • 頂級hadoop管理工具專題及常見問題 - CSDN
    Impala隨時準備處理程序,並且其守護進程在引導時啟動,而Hive出現「冷啟動」問題。 From: https://bytes.com/topic/apache/insights/970427-apache-impala-gets-top-level-status-open-source-hadoop-tool
  • 大學面試的常見問題及回答技巧
    如果適合您的個性,回答這個問題時,有點古怪和幽默就可以給招生官留下很深的印象。從現在開始十年後,您會看到什麼?如果您遇到這樣的問題,您無需假裝自己已經弄清楚了。進入大學的學生很少能準確預測他們的未來職業。但是,您的面試官確實希望看到您的想法。如果您看到自己在做三件事,那就這麼說-誠實和開放的態度將對您有利。
  • 24 個必知必會的系統管理員面試問題 | Linux 中國
    因此,我認為走上系統管理員之路是正確的路徑。在我的職業生涯中,我對求職面試過程非常熟悉。現在來看一下對該職位的預期、職業發展道路,以及一系列常見面試問題及我的回答。系統管理員的典型任務和職責組織需要了解系統工作原理的人員,以確保數據安全並保持服務平穩運行。你可能會問:「等等,是不是系統管理員還能做更多的事情?」你是對的。
  • 面試當中如何回答優缺點的問題?
    面試中大多數情況都會遇到優缺點的問題,以下是江湖哥收集的相關信息,供大家閱讀參考!  關於優點  如果面試官向同學們提問優點,一般有兩個目的:第一,判斷同學們是否對自己的優點真實地闡述。第二,同學們所闡述的優點是否是這個職位所需要的素質。需要注意的是,咱們要根據職位特點有針對性地回答,不能表現出太過自信、自戀。另外,最好能有一些經歷能夠說明自己的優點在實際中表現在哪些地方。