現在越來越多的企業都部署了虛擬化,主流的虛擬化平臺有PowerVM、VMware、Citrix等,隨著虛擬機的使用也越來越多,對虛擬機的運維及故障處理成了運維人員的一項新的日常工作,例如PowerVM的備份、PowerVM的集中管理、VMware網絡優化、Citrix應用停止響應等故障的處理。
社區近日組織活動,邀請會員交流分享虛擬化平臺部署、虛擬化運維技巧、難點解決等。現由社區專家崔哲匯總整理,重點介紹以下14個知識點和難點處理。
1、企業中的哪些業務系統可以遷移到虛擬化平臺上來?
可以從非核心業務系統開始遷移到虛擬化平臺,檢測這些業務系統的運行狀況,並積累一定的運維經驗。
基本上都可以仿造虛擬化平臺,如辦公應用、生產業務等,不過負載比較大的資料庫、圖形設計、高性能計算和大數據應用不適合。
每個企業的情況不同。業務也不同。不能一概而論。但步驟可以從非生產業務開始,再逐步到生產業務。
對於一些零散的,不需要高運算、高負荷的業務比較適合。資料庫等業務就不太建議在虛擬化平臺上。
2、企業現有的業務系統遷移到虛擬化平臺之前需要做哪些準備工作?
舊系統跑在X86/Power上,各自有解決方案
1、X86使用P2V工具遷移到虛擬化平臺。P2V對windows成功率還高點,Lin就弱了。大部分遷移的工作量其實還是數據這塊,舊系統架構決定了遷移的難度和複雜度。
2、Power平臺遷移到虛擬化,其實相對簡單,作業系統可以有多重方式備份恢復。共享存儲數據也有很多工具,利用AIX或者存儲本身技術實現數據的遷移工作。
3、PowerVM備份方式與傳統的備份有哪些差別?如何實現?
VIO Server其實是一個經過封裝的AIX,它的備份恢復有兩種方式,一種為NIM備份恢復,但在恢復時一定注意把「是否作為NIM server的client標記為否」,另一種是viosbr命令進行備份恢復。
VIO Client的備份與傳統的備份相同,作業系統可以通過NIM備份恢復,其它的也可以用備份軟體實現lan-free的備份恢復。
PowerVM不多的情況下,我覺得用磁帶機做個作業系統備份就可以了。畢竟作業系統級別的備份不用做得那麼頻繁。客戶分區可以採用磁帶機的方式,當然這會有很多次的設備映射操作,比較麻煩。可以在VIOS上做個虛擬鏡像庫。
4、PowerVM如何實現集中管理?
PowerVC,這個是基於OpenStack架構開發的,它可以對PowerVM進行納管,實現圖形化的快速部署與維護。
5、生產環境不能停機的情況下,PowerVM動態加個硬碟做鏡像如何操作?
實際上PV做鏡像,也就是在做PV中LV層次的鏡像,可以用lspv -l hdisk0,hdisk1查詢。比如說rootvg做鏡像的時候就有dumplv的鏡像。在已經建好鏡像的rootvg中新建LV,默認是不選擇同步的,即此新建的lv只會在一個PV中建立,而另一個PV是不建有這個LV的。
6、如何處理Citrix平臺上發布的應用無法使用的問題?
發現Citrix上發布的應用程式用不了,登錄Citrix客戶端報CGP錯誤。登錄到Xenapp伺服器檢查日誌錯誤來源Reliability Server,描述為Unable to connect to the CGP tunnel destination (127.0.0.1:1494),伺服器前一天晚上有自動重啟的記錄。前一天一切應用還是正常的,懷疑跟系統升級補丁有關係,選擇卸載掉所有前一天更新的補丁,重啟伺服器,再測試Citrix 一切應用正常。因為當時急著用,所以沒有一個一個補丁去卸載做測試,初步判斷跟.net的補丁關係最大。隨後關掉了該伺服器的自動更新。
7、如何優化VMware的網絡設計實現網絡高可用?
對於計算節點高可用來講,除了在資源數量上要保證其冗餘性之外,策略設置也非常重要。可以參考以下幾個點:
1 Admission Control Policy:對於生產環境來講,一般認為選擇(Host Failure the cluster tolerates =1)比較合適,當然如果你的資源非常空閒,可以適當調大。
2 對於每一臺物理機上的虛擬機根據其重要程度不同,設置其啟動的優先級(高中低)。
3 當一臺物理機上的虛擬機遠超過集群當中的物理機數量時,可以考慮設置虛擬機HA互斥分離規則。
4 生產環境當中儘量把DRS的策略設置的不要太激進。尤其是前段具有負載均衡設備的時候建議把DRS打成建議模式。
對於存儲來講,必須保證集群內所有節點看到的外部存儲視圖是一樣的,完全共享的,才能很好保證其HA及DRS功能。另外說到存儲,有以下幾個點:
1 卷屬性裡面,把Storage IO Control 選項Disable。不建議vwmare層幹預底層IO,反而有尤其性能故障的風險。
2 將卷的多路勁策略設置為(Round Robin)。
VMware提供了VMware HA和FT兩種高可用,但只能做到esxi主機級別的故障監測和恢復。一般會從應用級別上來做高可用,根據不同的業務角色,使用相應的群集或負載均衡,對於後端資料庫角色,一般會部署在物理機上,如果非要在虛擬機上可以考慮veritas公司的infoscale系列中的群集軟體(原vcs),可以與VMware的vmotion和其他管理手段有聯動,也可以不需要裸設備等支持來避免腦裂,還支持不同優先級的應用按指定順序啟停。同類群集基本只能做到基礎的功能。
8、VMware逃逸問題?
VMware有一個增強工具,允許和實體機複製粘貼文件。這是不是就為虛擬機穿透增加了便利?這樣虛擬機是不是也不安全了?
虛擬機逃逸是指利用虛擬機軟體或者虛擬機中運行的軟體的漏洞進行攻擊,以達到攻擊或控制虛擬機宿主作業系統的目的。
「VMware Workstation和Fusion的拖放(drag-and-drop,DnD)功能中存在一個越界內存訪問漏洞。在運行Workstation或Fusion的作業系統上,攻擊者可以利用這個漏洞實現客戶機逃逸,在宿主機上執行代碼。在Workstation Pro和Fusion上,如果拖放功能和複製粘貼(copy-and-paste,C&P)功能都被禁用,那麼這個漏洞就無法利用」。
9、VMware快照刪除時的合併策略問題?
如,有快照A->B->C->當前位置
當虛擬機關閉時
問題1.如果刪除快照B,快照B的內容是合併到A還是C?
問題2.如果刪除快照C,快照C的內容是合併到B還是當前位置?
當虛擬機打開時
問題3.如果刪除快照B,快照B的內容是合併到A還是C?
問題4.如果刪除快照C,快照C的內容是合併到B還是當前位置?
如果回滾的快照不包含內存狀態,伺服器將關閉,在重啟後使用前一快照狀態。如果快照中包含了內存狀態,虛擬機只是簡單中斷一下後恢復到之前快照的磁碟和內存狀態。
當用戶對VMware虛擬機快照進行操作時,要注意,當需要刪除虛擬機所有快照時,所有創建的delta文件首先被合併到原VMDK文件然後進行刪除,如果您選擇僅刪除某個快照,那麼只有該快照被合併到上一級快照中,如果選擇回滾快照,那麼現有的磁碟和內存狀態都被拋棄,系統恢復到所選擇的回滾時間點狀態。無論您選擇了哪一級的快照進行回滾,它都成為新的父級快照。而父級快照並非代表最新的快照,如果選擇之前的時間點進行回滾,虛擬機就恢復到老時間點的狀態。在Snapshot Manager中,父級快照總是帶有標籤「You are here」,代表虛擬機的當前狀態。
10、VMware 和 VirtualBox 有什麼區別?
VMware和VirtualBox虛擬機孰優孰劣,相信每個使用虛擬機產品的用戶都有自己的一套理論。
但就我個人而言,還是比較傾向於使用VMware。 首先在資源佔用上,無論是作業系統在其上的安裝還是使用的時候,VMware虛擬機的CPU佔用率大多數時間都是維持在100%;而VirtualBox虛擬機的CPU佔用率在相比之下佔用不是很多,最高在60%左右,平均在30%。當然這只是在我使用的PC機上。順便大概提一下我的電腦配置:奔騰D處理器主頻2.81×2、2個GB內存,160GB硬碟7200轉。我在使用VirtualBox的時候一般都需要手工分配一個內核給它使用,因為如果不這樣的話,我的其他工作就沒有辦法進行了。 其次在網絡設置上,VirtualBox虛擬機的網絡類型設置明顯沒有VMware的種類齊全。至少橋接這一項我沒有找到,如果有的話也說明在簡單易用性方面VirtualBox虛擬機沒有VMware做得更好。
雖然VirtualBox虛擬機在許多方面存在不足,但與VMware虛擬機相比還是有許多優點的。第一,免費使用,即使收歸Sun旗下之後,其還是免費使用的;第二,跨平臺使用,VirtualBox虛擬機不僅僅支持Windows平臺,其他的一些主流平臺,如Linux,Unix等等,有許多用戶使用VirtualBox虛擬機很大一部分原因也在於此;第三,最新的版本支持的作業系統也相當豐富。 單就從個人用戶單機安裝虛擬機用於學習、工作或者程序的開發調試等VirtualBox虛擬機完全可以勝任這些工作;但是在企業級應用,如在一臺伺服器上搭建多虛擬伺服器,我個人認為VMware在易用性和管理的方便性,還有在資源的利用等方面的優勢將使其更適合這方面的工作。
11、PowerVM、VMware、Citrix幾種虛擬化平臺的對比?
PowerVM適用於power主機虛擬化,VMware適用於x86伺服器虛擬化,citrix適於用桌面虛擬化。
12、商業虛擬化架構與開源虛擬化架構的優勢對比?
ESX的物理驅動是內置在Hypervisor中,所有設備驅動均是由VMware預植入的。因此,ESX對硬體有嚴格的兼容性列表,不在列表中的硬體,ESX將拒絕在其上面安裝。
Hyper-V的Hypervisor是一個非常精簡的軟體層,不包含任何物理驅動,物理伺服器的設備驅動均是駐留在父分區的Windows Server 2008中,驅動程序的安裝和加載方式與傳統Windows系統沒有任何區別。因此,只要是Windows支持的硬體,也都能被Hyper-V所兼容。
XEN的Hypervisor層非常薄,少於15萬行的代碼量,不包含任何物理設備驅動,這一點與Hyper-V是非常類似的,物理設備的驅動均是駐留在Dom 0中,可以重用現有的Linux設備驅動程序。因此,XEN對硬體兼容性也是非常廣泛的,Linux支持的,它就支持。
KVM利用修改的QEMU提供BIOS、顯卡、網絡、磁碟控制器等的仿真,但對於I/O設備(主要指網卡和磁碟控制器)來說,則必然帶來性能低下的問 題。因此,KVM也引入了半虛擬化的設備驅動,通過虛擬機作業系統中的虛擬驅動與主機Linux內核中的物理驅動相配合,提供近似原生設備的性能。從此可 以看出,KVM支持的物理設備也即是Linux所支持的物理設備。
13、虛擬機備份容量及快照原理?
前幾天和同事在討論虛擬機的快照技術,討論到快照備份的容量變化問題。
我同事認為首次快照備份後備份容量會隨著虛擬機磁碟數據的容量增大而增大,但有一定界限。
我認為快照備份就像是WINDOWS的還原點一樣,有完全快照和差異快照之分,快照備份容量是不會變化的,首次是做的快照是完全快照,而後面再做快照是差異快照,但備份量會和第一次的快照合併,而不是像我同事說的不做快照自動隨虛擬機的容量變化而變化。
請問虛擬機的快照到底是怎麼樣的!
當你創建一個虛擬機快照時,這是一個特定的文件。它也是redo-log日誌。delta文件是在基礎VMDK(虛擬機磁碟)上的變更位圖,因此,它不能增長到比VMDK還大。為虛擬機創建每一個快照時,都會創建一個delta文件。當快照被刪除或在快照管理裡被恢復時,這些文件將自動刪除。
這些文件用於存儲關於快照的元數據和信息。這個文件是文本格式的,裡面包括諸如快照顯示名稱、UID(編號)和磁碟文件名等信息。在你沒創建虛擬機快照之前,這個文件的初始大小為0位元組。這樣說來,只要進行快照,這個文件就會增大和持續更新。
在快照被移開後,這個文件不能被完全清除。一旦你刪除了個快照,它將仍然在文件裡為每個快照遺留位置,不過僅增加編號並在「Consolidate Helper」裡放置名稱,這可能是用來整合備份*.vmsn file
這是快照狀態文件,裡面存儲的是使用快照時,一臺虛擬機精確的運行狀態。這個文件大還是小取決於你選擇保留這臺虛擬機的存儲作為快照的一部分。如果你選擇保留虛擬機的存儲,那麼,這個文件將比較大,然後分配給虛擬機最大化的RAM。
這個文件類似於VMware暫停狀態文件.vmss。虛擬機每個快照都將創建一個.vmss文件;當移動快照時,這些文件自動刪除。
大多數情況下,應該避免為同一臺虛擬機創建多個快照;每次為系統創建新的快照,其運行速度都會變慢。每個快照都會建立相應的delta磁碟文件,如果虛擬機需要讀取多個delta文件,必然會增加系統的I/O負載。這個過程無疑會延長虛擬機的響應時間,並且產生額外的磁碟操作。
如果你只想保存一系列快照當中的最新版本,可以將它們整合為單一快照。這種方式可以幫助提升系統運行速度和管理效率。選擇目標虛擬機,單擊滑鼠右鍵,之後選擇整合。你可以在虛擬機和模板視圖當中查詢虛擬機是否需要整合,並且在列表當中顯示所有需要進行整合的虛擬機。
14、虛擬化平臺的運維中最關鍵的是什麼?
運維中最關鍵的還是這幾點:
1、高效
主要還是根據你虛擬化平臺的規模來看,如果規模比較大,則使用python、PowerCLI(僅VMware)這類腳本運維方式會很省事,可以完成從虛擬化控制中心、主機、虛擬機、虛擬網絡、存儲等相關資源的新建、修改、刪除等操作,尤其是批量操作更是方便,比如批量新建虛擬機。
有實力的可以用puppt、ansible這種自動化配置工具對虛機進行日常運維操作;
2、隨時隨地全局掌控
主要依賴監控和日誌,zabbix、ELK之類或者商業版的,可以隨時了解虛擬化平臺健康狀態並作出響應;
3、安全
主要在虛擬機和數據備份,即使虛擬機或數據損壞,還有備份可以恢復。
崔哲,目前於長春市房地產交易服務中心進行運維工作,工作至今10年,主要參與單位的系統集成、機房遷移,子系統升級,統一平臺搭建等項目。精通pc伺服器的搭建與維護,熟悉ibm的中低端存儲設備及國產存儲設備。
更多相關文章請點擊閱讀原文
長按二維碼關注公眾號