新聞中心
在錯誤中成長 VMware管理員五大誤區(qū)
2011-04-07 10:08:11
云計算
虛擬化 當VMware管理員談論工作中所犯的錯誤時,我經(jīng)常說,如果你沒在犯錯,那么你就沒在學習。以下是特約專家Mike Nelson曾經(jīng)看到、聽到和經(jīng)歷過的令人難忘的VMware管理員所犯的錯誤。

當VMware管理員談論工作中所犯的錯誤時,我經(jīng)常說,如果你沒在犯錯,那么你就沒在學習。
一些錯誤是由于嘗試導致,其他一些是由于缺乏知識。而還有一些是我們應該已經(jīng)知道不該去做的蠢事。但是最后,因為曾經(jīng)犯的錯誤,我們成為了更好的VMware管理員。
以下是特約專家Mike Nelson曾經(jīng)看到、聽到和經(jīng)歷過的令人難忘的VMware管理員所犯的錯誤。
VMware管理員錯誤1:虛擬機重命名
這種錯誤非常典型。在vCenter中對虛擬機重命名非常簡單:右鍵單擊客戶機,選擇“重命名”,然后輸入新的名字。
但是這個操作僅僅是重命名vCenter數(shù)據(jù)庫中的對象指針,和虛擬機關(guān)聯(lián)的目錄和文件仍然在原來的名字下。對于VMware管理員來說,快速清理數(shù)據(jù)存儲過程,刪除虛擬機目錄和文件,只需要點一下鼠標,非常容易,尤其是在沒有客戶機和當前目錄相匹配的情況下。我已經(jīng)看到過這種事情發(fā)生,而且后果很嚴重。
VMware管理員錯誤2:塞滿整個LUN
我多年前參加一個會議,是和VMware ESX 3新特性有關(guān)的活動。演示人員在SAN上創(chuàng)建了一個100GB的LUN,并把它分配給一個用于演示的包含兩個節(jié)點的集群。
他在這個LUN上創(chuàng)建了三個虛擬機,每個虛擬機有32GB的硬盤以及2GB ISO共享數(shù)據(jù)存儲。計算一下,使用的存儲空間為:(32GBx3)+ 2GB = 98GB.對于一個100GB的LUN來說,還有足夠的空間,是這樣嗎?
他一個個地啟動了所有的虛擬機。當啟動第三個虛擬機時,所有的虛擬機都死機了??磥硎撬浟藛犹摂M機時會創(chuàng)建交換文件。這些交換文件填滿了整個LUN,更有趣的是因為他不知道為什么會發(fā)生這種情況,所以他再次嘗試啟動虛擬機。
是的,他是一個VMware工程師。
VMware管理員錯誤3:網(wǎng)絡(luò)名稱
我曾經(jīng)是Citrix公司一個小機構(gòu)項目的顧問,這個機構(gòu)的存儲工程師在管理新的虛擬化環(huán)境。一天,我接到了他的一個電話。在進行vMotion操作時,他遇到了問題,并且分布式資源調(diào)度(DRS)也產(chǎn)生了許多錯誤。(我提到這家伙是個存儲工程師了嗎?
我登錄到vCenter上,發(fā)現(xiàn)所有的ESX主機并沒有設(shè)置在相同的網(wǎng)絡(luò)上。每個虛擬交換機在每個主機上具有不同的名字,當ESX主機沒有被同時創(chuàng)建或者沒有遵循命名規(guī)則(或者甚至不存在命名規(guī)則)時,這是一個很常見的錯誤。VMotion要求DRS集群中所有主機的虛擬交換機名稱是相同的。
VMware管理員錯誤4:蜜月和角色
有個VMware管理員在去度蜜月前不得不修復一個虛擬化問題。在他離開前,他確定在vCenter中從角色中移除人員,鎖定基礎(chǔ)設(shè)施。
但是他移除了vCenter對象--不僅僅是虛擬機或集群,具有訪問權(quán)限的角色。這個操作阻止任何人有權(quán)限去訪問vCenter對象。
我從他的新娘那聽到了這個故事,因為錯誤操作導致蜜月擱淺,她壓根兒就不高興。
VMware管理員錯誤5:網(wǎng)卡全軍覆沒
了解的VMware主機配置文件在一年后才出現(xiàn),我有些等不及了,迫不急待地在超過500個主機的基礎(chǔ)實施中快速部署標準的主機。但是當我最終使用主機配置文件時,一下子全錯了。
我創(chuàng)建了一個新的主機配置文件并在實驗室主機上進行測試。在主機上測試一些虛擬機后,看起來并沒有任何問題。因此我決定在生產(chǎn)環(huán)境中包含16個主機的集群上應用主機配置文件。
稍后,vCenter看起來一切正常。我剛剛高興了5秒鐘,就產(chǎn)生了告警。我所有的虛擬機和主機都不能通過網(wǎng)絡(luò)進行訪問。
ESX主機配置文件的一個問題就是不管網(wǎng)卡速率在配置文件中設(shè)置為多少,所有讀取配置文件的主機速率默認都設(shè)置為自適應模式(當然,VMware稱之為它的一個特性)。
這個設(shè)置在網(wǎng)絡(luò)中交換機端口被硬編碼為1000M或者無故障恢復的Full模式時,不能運行(實驗室網(wǎng)絡(luò)端口是auto模式,所以能夠正常運行)。一旦將這個設(shè)置應用到所有的主機上,整個集群被拖垮了。我不得不在重新每個主機上手動配置14塊網(wǎng)卡,這整整花費了一天時間。
神馬?VMware自己也犯錯?
記得ESX 3.5 Update 2嗎?世界各地上千臺主機在慘敗之后宕機了。
VMware不會輕易承認用戶群發(fā)現(xiàn)的bug是存在的。如果你安裝了ESX 3.5 Update 2,一旦時鐘改到2008年8月12日上午12:01,你不能進行vMotion或者啟動任何的虛擬機。
VMware最終承認問題是由于一段代碼導致了許可證過期,并且這段代碼以某種方式通過了測試版的測試和質(zhì)量控制而引起的。 這個“計時炸彈”bug造成了嚴重的問題,唯一的解決辦法就是禁用服務器上的網(wǎng)絡(luò)時間協(xié)議(NTP),并且設(shè)置時鐘可追溯至2008年8月10日。 VMware在8月14日發(fā)布了一個補丁,但眾多的客戶將會對VMware的產(chǎn)品和它所做的測試持謹慎態(tài)度。
VMware首席執(zhí)行官Paul Maritz先生給客戶發(fā)送電子郵件,就bug進行了道歉,表示這種問題將永遠不再發(fā)生。
【編輯推薦】
- 解決五大VMware不容忽視的安全漏洞
- 全方位比拼 Windows Azure VS VMware vFabric
- 在VMware vSphere上運行XenDesktop考慮三方面
- 別發(fā)愁了 基于VMware環(huán)境的虛擬化平臺這樣選型
- 六問六答 快速解析VMware Workstation
標題名稱:在錯誤中成長VMware管理員五大誤區(qū)
當前地址:http://m.fisionsoft.com.cn/article/ccojsdc.html


咨詢
建站咨詢
