在數據備份和恢復行業,實現遠程數據中心和移動設備的高效備份也許是最后一個有待開發的技術領域。對許多公司來說,遠程系統和移動設備的備份并非關鍵問題,相關的項目計劃通常排在較低的優先級處理。因此我們看到,遠程數據中心、用戶的筆記本電腦和其他移動設備經常被忽視,只做簡單的數據保護,甚至根本什么都不做。與此相對的是,企業主數據中心往往擁有最先進的備份和恢復環境,而且每天都在重復嚴格的備份的流程。但如今越來越多的數據是由主數據中心以外的遠程設備和移動設備創建并攜帶,因而傳統的應用和備份模式也必然發生改變。
問題產生的根源
以往,企業的分支機構通常使用一套獨立的備份系統,很少與主數據中心的備份系統相連接。由于需要處理的數據量較小,分支機構基本會使用一些簡單、廉價的軟件和硬件。常見的情況是,企業的主數據中心使用企業級備份產品,將數據備份到大型去重裝置或者磁帶庫中,而分支機構的數據中心往往使用工作組級備份產品,硬件用小型的Autoloader(入門級磁帶庫),甚至是單獨的磁帶機。
此外,主數據中心還有可能跟專業的介質保存公司簽訂服務合同,以保證每天的備份介質可以安全地離線保存。有些更高級的做法是在主數據中心采用重復數據刪除裝置,將備份數據實時復制到遠程系統。令人擔憂的是,分支機構的數據中心完全是另外一種情況,備份系統經常處于無人監控的狀態,而備份出來的數據還有可能被人隨意帶走。
移動設備備份的情況則更加糟糕。很多公司根本沒有相關策略,另外一些公司則只是告訴用戶要將重要數據拷貝到文件服務器上。這說明大多數人都在忽視這個問題,而沒有采取有效的可執行的策略。
大多數移動計算機的用戶通常不會想到要定期備份數據這種事情。企業雖然有要求他們將重要數據同步到文件服務器,但卻忽略了一個基本的事實,即他們經常處于移動的狀態,而且他們也沒有足夠的網絡帶寬用于同步那些大文件或許多小文件。
考慮到當今員工的移動性大大增加,企業必須耗費大量的精力去考慮私有知識產權信息的保護問題,依靠那些沒有備份保護的單點遠程設備是不行的。
移動設備的備份為何如此困難
現狀令人沮喪,遠程系統和移動設備的備份看起來有些混亂。這其中有些原因我們必須清楚,只有了解了它們之后,我們才能嘗試解決問題。
遠程和移動設備上的數據之所以沒有像企業主數據中心里的數據那樣被嚴格的保護,其中原因顯而易見,因為它們并不在數據中心。遠程機構與主數據中心之間、個人與主數據中心之間并沒有高速的網絡連接,這就決定了我們不可能使用主數據中心里常見的備份軟件去備份這些數據。在主數據中心里,傳統的備份應用必須保證有高速的網絡連接到服務器端,在這種技術體系下,一旦換成連接到遠程的服務器,性能會非常差。帶寬的限制使得軟件無法傳輸大量的數據,網絡延遲還會帶來更多不必要的流量開銷,因為備份應用是一種基于會話的機制,網絡延遲會導致服務器和客戶端之間反復進行通訊連接。
另一個問題是我們準備做備份的計算機設備并不能保證全天都處于開機狀態,而主數據中心里的服務器都是24小時運行的。眾所周知,多數用戶在不使用筆記本電腦或其他移動設備時,會將它們關機或置于休眠狀態。而大多數人可能不知道,遠程分支機構的用戶通常也會做類似的事情,關掉臺式機和服務器的電源。這不是什么大問題,但對于實施備份計劃來說,必須先解決它。
還有一個挑戰是,某些用戶的計算機雖然是24小時開機,但卻從來不關閉應用程序。根據這種情況,任何支持遠程備份的系統都必須支持打開文件備份,或支持對正在修改的文件做備份。
最后,裸機恢復功能也是一個基本的需求。有很多種方案可以解決硬件故障問題,比如切換到備用的鏡像系統,不過前提是必須在企業級數據中心才能夠實現。對于遠程用戶來說,最理想的環境是有一條可以高速下載的廣域網鏈路,并且能夠得到來自總部的IT支持。如果遠程分支機構使用的服務器和個人計算機有現場保修服務還好,廠商可以上門更換損壞的硬盤或其他部件。但是除了硬件之外,用戶仍然需要系統和數據的自動恢復,最基本的步驟也少不了,比如插入光盤,、重啟系統等。
可行的解決方案
遠程備份最典型的難題是帶寬不足。今天,我們已經可以通過使用永久塊級增量備份技術來解決這個問題。如果條件有限,只能在低帶寬的網絡環境下做備份,那么關鍵的一點是不能重復傳輸已經備份過的數據,只能傳輸最新的、唯一的數據塊。因此,絕對不能使用全備份的策略,甚至傳統的增量備份也被視為有太多的冗余數據。
網絡延遲是另一個問題。一個產品如果只是采用了塊級增量備份技術,并不能說明它就是針對遠程備份應用而設計。我們必須確認該備份軟件能夠識別遠程鏈路環境,而且還能盡量避免網絡通訊的開銷。如果備份軟件不具備這樣的機制和功能,即使我們有足夠的廣域網帶寬,網絡的延遲也會嚴重地影響備份性能。
解決之道1:重復數據刪除必不可少
為了解決以上問題,大多數人采用了重復數據刪除的解決方案。它可以大幅度縮減需要傳輸的字節數。去重系統能夠識別且只備份多個設備或應用上的全局增量數據塊,而非僅僅針對單個遠程或移動設備做增量數據處理。因此,如果(保存在筆記本電腦A)一個文件已經備份過了,那么相同的文件(保存在筆記本電腦B)就不會再做備份。
有兩種基本的數據去重類型:1、基于目標端(裝置)的去重;2、基于源端(備份軟件)的去重。目標端去重裝置使用標準的磁盤驅動器,設計目的是用來取代現有備份環境中的磁帶設備。備份軟件將備份數據發送到該裝置,經裝置處理之后只留下最新的、唯一的數據塊。使用去重裝置有一個額外的好處是:隨著磁帶到磁盤的轉換,備份設備的可靠性會有所提高。
如果用戶希望使用目標端去重,則每個遠程分支機構都必須部署一臺去重備份裝置,數據直接備份到這些裝置上。經過去重之后,再由這些裝置將數據復制到主數據中心站點保存。因為需要特定的設備,因此基于目標端的重復數據刪除并不適合移動裝置的備份。
源端重復數據刪除的機制是由備份軟件在備份流程的最初環節進行去重處理。應用服務器或移動設備首先要同備份服務器進行通信,告知它們有哪些數據段需要做備份。如果備份服務器發現某個數據段已經有了備份,該數據段就不必在網絡上重復傳輸。該技術不但節約了備份服務器端的磁盤空間消耗,同時也減少了相關的網絡開銷。
遠程站點或移動設備都可以使用源端重復數據刪除。用戶需要做的是在計算機上安裝源端重復數據刪除備份軟件,然后就可以開始備份了。(這個過程本身很簡單,當然,我們得承認完成初始化的全備份會有一些挑戰。)
解決之道2:遠程持續數據保護
另一種可以嘗試的技術是CDP(持續數據保護),它同樣可用于遠程或移動設備的備份。CDP是一種帶有回滾機制的復制技術。像復制技術一樣,它會不間斷地連續地運行,將最新的增量數據塊源源不斷的發送到遠程的備份服務器。但是,CDP與標準的復制產品并不完全相同,其機制在于CDP系統維護著一份記錄了數據改變信息的日志,因此受保護的應用系統數據能夠依據日志信息回滾,恢復到任意的(日志記錄保存周期之內)歷史時間點,而恢復過程只需要幾秒鐘甚至更短。而傳統的備份系統(包括哪些使用了重復數據刪除的產品)只能將數據恢復到最后一次備份的狀態,CDP則可以將數據回滾到故障發生之前幾秒鐘的狀態,因為它的機制是持續數據保護。CDP也屬于永久塊級增量備份技術,既可以用于遠程站點,亦可備份移動設備。
解決之道3:集成的數據保護
遠程站點的數據保護可能還有一個辦法,即利用我們時常提及的“自愈存儲”設備。這是一個廣義的術語,泛指集成了備份和恢復功能的存儲系統。通常,“自愈存儲”這個詞用于描述那些集成了重定向寫快照技術(redirect-on-write snapshot),能夠將被保護卷上的數據塊和文件恢復到歷史版本的存儲系統。這些快照還能夠被復制到其他系統上,變成可用的獨立卷,以便做歷史數據查詢或異地保護。有了這些功能,就不必再使用傳統且復雜的備份/恢復策略了。用戶可以利用這樣的存儲系統做遠程站點的數據備份。當然,每個遠程站點都需要部署同樣的設備,然后各自將數據復制到主數據中心里一個更大的存儲系統上。
解決之道4:云備份怎么樣?
云備份服務也是一個很方便的選擇,有些云備份服務使用源端去重技術,還有一些使用CDP。有些服務運營商會為用戶提供一個前置的備份裝置,由這個裝置負責把備份數據復制到運營商的云存儲平臺,或者將該裝置直連在用戶的去重裝置之后,起到數據復制功能。還有些自愈存儲系統會與云服務集成,可自動將數據復制到云上。
裸機恢復問題只能靠內置相關功能的備份軟件或服務來解決。對于用戶的應用環境來說,必須要仔細考慮這個功能的重要性。同時,IT技術之外的因素很多,不能只相信廠商的一家之言,對產品和服務的詳細測試很重要,只有這樣才能讓我們準確知道廠商提供的東西是不是我們需要的。
用戶還應該咨詢廠商,如果他們的備份應用不能連續運行,或者廣域網連接中斷了怎么辦?雖然大多數產品和服務都能處理這些意外情況,但顯然會嚴重影響到用戶的應用體驗。假設一個環境,用戶的筆記本電腦很長一段時間沒有連接到互聯網,而當它一旦上網之后,備份系統會開始對積累了很長時間的數據做備份。看起來似乎是個不錯的功能設計,但是,備份處理也許會消耗掉筆記本電腦全部的計算資源。這時候,用戶也許不得不打電話向技術人員求助,或者為了處理其他工作而關閉備份進程。所以,在最后,我們一定要理解,在不同應用環境下備份操作對系統所帶來的壓力。
遠程的初始化備份
遠程站點計算機的第一次備份,通常叫初始化備份或全備份。用戶必須在備份方案的設計階段就考慮初始化的問題,這很關鍵,除非需要備份的數據量特別小(幾個GB),用戶必須找到一個合適的方法將首次備份數據發送到主數據中心。常見的方法是將數據備份到可移動的存儲介質上,然后將介質運送到主數據中心,并將數據拷貝到備份服務器。在這里提示用戶,一定要同備份廠商討論他們所提供的相關功能。
移動設備越來越多
iPad的用戶一般分成兩類:有的用戶經常使用iPad查看數據,另外一些則使用iPad創建或修改數據。第一類用戶可能無需在意數據備份的事情。但是后一類用戶經常在移動過程中創建或更新數據信息,他們實際上需要知道該如何對移動設備做數據備份。最簡單的方法是將iPad與筆記本或臺式機相連,然后同步數據,以保證重要信息的有效備份。雖然這并不是一個完美的方案,但對于iPad這樣的設備來說,也許是目前最好的方法。我們面對的一個挑戰是:iPad為每個應用分配了獨享的文件存儲空間。即使出現一個可以通過因特網實現遠程備份的程序,它也沒辦法訪問到其他應用所創建或修改的數據。