云計算儲存必將代替磁帶存儲 |
發布時間: 2012/8/11 11:43:18 |
當歸檔工作意味著把磁帶上的數據轉移至遠程設施中供長期保存時,這項技術已與其早期形式之間產生了巨大的變化。如今的歸檔技術,既可以如同自動歸檔電子郵件信息一樣輕松,又可以如同在一個外場存儲站點中放置傳統物理存儲磁帶一樣負擔沉重。
其中,云歸檔是一個特別具有吸引力的選擇,因為這項技術提供了可訪問功能和數據保護功能,而其成本僅為構建一個現場歸檔基礎設施的一小部分。我們將討論評估基于云計算技術歸檔時需考慮的關鍵因素,其中包括:價格與性能、云計算歸檔的優缺點、服務等級、可訪問性、災難恢復選項、合規性等等。
雖然“歸檔”一詞意味著數據將被存儲很長一段時間,但是其具體的時限卻是隨行業不同而各有差異。例如,大多數的財務數據要求的歸檔時間為七年,藥品研究數據則要求二十年,而那些醫療記錄和核記錄數據則必須保存長達五十年之久。一般來說,在磁盤上保存數據長達十年甚至更長時間的的成本是非常昂貴的。
同樣,我們也很難預測哪一種歸檔技術將存在十年之久,因此,本文中用于云歸檔的“長時間”一詞是指一年至七年的時間。
價格與性能。云歸檔恰恰實現了成本與可訪問性之間一個“恰到好處”的平衡。存儲磁帶一直以來都是,甚至仍將是長時間存儲數據方法中成本最低的一種。一個典型的LTO存儲磁帶存儲數據的成本約為35美元/TB?每月。即使是最便宜的云存儲也無法在這個價格方面體現其競爭優勢。而其不利的一面在于,存儲磁帶歸檔的正常檢索時間為次日交付加上安裝和恢復所需的時間。這就意味著用戶在能夠訪問所要求信息之前必須等待不少于一個工作日。
歸檔與備份。雖然眾多IT公司仍然考慮采用他們傳統的備份磁帶進行“歸檔”工作,但也有一些具有不同于歸檔、用于數據備份的特殊用例和訪問需求。執行備份可保護目前正在被使用的數據;如果必須把數據從備份中恢復出來,那么該操作必然發生在完成備份工作之后不久。一般來說,備份數據的保存時間相對較短。
歸檔數據是一組出于合規性、公司管理或知識產權等目的而將被保存相對較長一段時間的數據集合。歸檔數據可被不定期訪問,但具有較高的易搜索性,因此可相對較快和較容易地恢復特定數據。
存儲網絡行業協會為云備份和云歸檔服務的區別給出了一個定義:“對于云計算備份來說,云計算是一種備份數據的簡單存儲,而對于云計算歸檔和存儲來說,云計算是執行具體操作的所在,以便于確保數據的長期存儲、保存以及存在。”
另一方面,云存儲的價格為10美分/GB?美元及以上(根據容量不同而不同)。當涉及數以百計TB時其成本就相當可觀了,但是它往往仍然要比在一個中央數據中心中采購、部署和管理陣列低。而存儲磁帶的檢索時間要以工作日為單位,而訪問在基于云計算技術存儲中托管的數據,其單位則是以秒來計算的。對于某些應用程序,這可能是價格與性能之間最為理想的平衡點。
云歸檔的優缺點
但是在真正實施云歸檔之前,IT人員需要權衡云歸檔和內部歸檔兩者各自的優點。從技術上來說,云計算供應商無法提供任何可供內部實施的東東哦。例如,一家公司可能會選擇一個具有三層高容量SATA磁盤的層存儲基礎設施來實現一個更低的平均成本(每GB)。
通常情況下,如果組織無法承受與遠程場所連接中斷的風險,那么他們往往會傾向于實施一個內部實現的解決方案,這個解決方案有監管要求,要求具備嚴格的數據安全監督或數據檢索需求,而其中是無法接受遠程延遲的。這是一個相當嚴格的列表,但是仍然還有眾多的應用程序適用基于云計算技術的歸檔。
即便IT組織可以把遷移至云計算的物流工作量進行量化,但是他們卻不應忽視這樣一個可預測而不可預見的調整:從以技術為中心的角度到一個服務等級管理角度的心態轉變。之前已習慣于進行技術決策和部署的IT人員們需要更深入地了解云計算供應商的架構和“建議”產品或特定技術的實施。
當供應商完全承擔管理云計算基礎設施的全部責任時,很少有這樣保證的請求。如果合同中規定的服務等級已得到滿足,那么IT部門確實不應該關心底層技術。隨著經驗的進一步積累,工作人員的注意力應逐漸從底層細節轉移至高層次的管理。
服務是云歸檔的關鍵因素
那么,服務等級管理是進行云歸檔最初決策以及日常運行中至關重要的環節。當選擇一個云歸檔服務供應商時,應當考慮如下的服務等級問題:
正常運行時間。對于大多數的應用程序來說,三個九或四個九等級的可用性就足以滿足它們的業務需求了。如果你對可用性的要求達到了五個九等級,那么可能你的數據服務需求并不適合于一個歸檔層。根據定義,在歸檔層中托管的數據一般都是非關鍵數據。
正常運行時間需求很大程度上決定了供應商必須提供多少的基礎設施,因此該指標對于托管成本的影響較大。不要去猜測;在實踐中確定訪問數據的實際時間、訪問模式以及停機成本。這些計算方法可比較各種保證正常運行時間的成本,根據比較結果可以較容易地提出有說服力的理由采納或拒絕。
由于違反云計算存儲服務等級協議(云計算SLA),供應商會經常推出托管費用折扣或其他的性能補償。但是,相關附加說明常以小字形式顯示,所以請仔細找到并認真閱讀。
可訪問性。可訪問性和正常工作時間并不一定相同。存儲可能是忙碌的,但是子組件會導致一個應用程序無法使用。例如,如果你需要實現數據鏈接的冗余或多個冗余,那么你必須為它們支付額外費用,但是不這么做可能帶來的后果就是無法接受的應用程序中斷。請確定服務等級能夠確保數據的可用性。
性能。對你應用程序需要的IOPS數量進行量化,請確保這個數字是SLA的一部分。IOPS數量可取其均值或峰值。如果你要求的IOPS保證數量是峰值,那么你就必須支付費用讓供應商來確保這一指標。有些供應商可能會提供計量計費,但是很多企業組織并不希望采用這種方式,因為其中存在著潛在的不確定性。大多數企業都會減少一定量的約束操作(尤其是對歸檔層)以實現一定成本的回報。在這種情況下,SLA可保證IOPS,而不是最終用戶所體驗的絕對性能。如果應用程序要求超過合同規定的IOPS容量,那么那就是IT組織的問題了;總是可以購買額外的IOPS.
數據可恢復性。正如他們為內部應用程序所做的那樣,IT組織需要為云計算歸檔指定恢復點對象(RPO)和恢復時間對象要求。這關系到正常運行時間,而且還覆蓋諸如數據損壞這樣的意外事故或不影響整體正常運行時間但有些個別應用程序的組件故障。供應商應有RPO和RTO的默認值,其值已可滿足歸檔層。再次強調,不要試圖猜測。了解何種數據丟失和應用程序不可用是業務單位在財務上可以容忍的。在很多情況下,它要直觀得多。
災難恢復(DR)。如果云計算歸檔被用于異地復制存儲以滿足數據冗余的需求,那么可能不必考慮這一層的災難恢復策略。但是買家應注意:大多數托管存儲并不包括任何的災難恢復意外事故。如果托管數據是混合云計算存儲提供的“隨時可用”數據,那么災難恢復計劃是必要的。托管供應商可能會定時備份數據,但是他們一般不會把數據轉往異地,即使他們這么做了,他們也不會經常這么做(例如每月)。雖然在一個SAS-70兼容數據中心發生災難是不可能的,但也不是完全不可能的。托管公司的災難恢復容量通常是一個額外顯眼的費用支出,并可以快速改變托管的經濟性。確保數據不會處于脆弱的狀態。
備份和恢復。即使托管供應商定期地備份數據和頻繁地轉至異地,IT組織可能仍然無法走出困境。通常,托管公司擁有數量有限的備份軟件選擇和磁帶技術。這意味著他們的備份格式(硬件、軟件或兩者)可能并不與你的IT系統兼容。如果一個組織被迫從供應商的存儲磁帶中進行恢復,那么在獲得必要基礎設施時就可能會出現一個重大延誤。請確保在最壞的情況下仍然有一個脫困方法。
合規性。要求特殊合規性對待的歸檔數據可能仍然是云計算托管應用的一個理想對象。如果有必要的話,你將需要確定數據是否保存在永久存儲介質上。你可能還需要確保,遵循和審計嚴格的訪問指引;SAS-70供應商就已具備了這樣的程序。
成本的確定性和粒度。對歸檔采用云計算存儲托管技術而不是使用內部基礎設施的主要好處之一在于,你只需為存儲的消費支付費用。雖然計費是有一個最低消費的,但是它也應根據實際使用而變化。
放棄存儲磁帶使用云存儲
很顯然,對于擁有大量存儲在相對昂貴內部基礎設施中歷史數據的公司來說,基于云計算技術的歸檔是具有相當吸引力的。更多的質疑在于,將基于存儲磁帶的歸檔轉變為云計算歸檔是否真的有意義。更大型規模的組織可能在異地歸檔中有著數以萬計的存儲磁帶。
檢索所有這些存儲磁帶并將它們讀取寫入至云計算歸檔基礎設施中的整個過程是令人望而生畏的。它還假定,供應商擁有必要的硬件以讀取所有的存儲磁帶,其中部分的數據格式可能已過時。
此外,云計算供應商也無法以接近于磁帶歸檔的成本來管理這樣一個數據量。磁盤壓縮和重復數據刪除技術將極大地幫助實施這項工作,但是成本方面的差異仍然是一個問題。
即使從存儲磁帶歸檔到云計算歸檔的轉變難度極大,它可能仍然是一個可供考慮的選項。使用期限超過七年的磁帶是非常昂貴的,同時可能在數據恢復方面也存在問題。最好的實踐表明,組織每隔五年時間進行一次檢索和磁帶重寫入可確保數據可讀、格式不過時。這是一個不容小覷的任務。例如,如果一個公司擁有10,000個磁帶歸檔,而其更新周期為五年,那么它就必須每年更新2000個磁帶。
也就是說,每個工作日更新近八個磁帶,這是可行的,但是這就要求近一年的時間都花費在基本上無生產產出的工作上。這里再次強調,問題的癥結在于檢索的概率。一些組織選擇允許磁帶在存儲中過時,其恢復過程是相當痛苦的,但是需要修復的概率已低至可承受由其產生的風險本身。
另一方面,如果你知道恢復是不可避免的,那么你可以選擇在眼前承擔把數據從磁帶轉移至云計算所帶來的時間和花費,從而在未來可以預見的緊急情況中節省大量的時間和精力。
我們并沒有認為,存儲磁帶已在歸檔應用中失去了其地位和意義。它仍然是大多數應用的成本最低選擇。此外,LTO的線性磁帶文件系統(LTFS)可使磁帶在四層存儲中承擔新的角色,它可作為云計算(或數據中心)中的另一層,從而為0、1、2和3層配置。
在一個云計算歸檔環境中,這將有效地實現混合云計算,從而提供相對高速的訪問(分鐘級),但其訪問數據的價格與磁帶幾乎無差。磁帶還將擁有內置壓縮、加密以及WORM等功能。使用自動分層軟件,數據可自動轉移至歸檔層。
不可回避的“如果”
到目前為止,我們已描繪了云計算歸檔服務的一個相當正面積極的輪廓。通常,只需努力就能夠實現預期的效果,但事實并不總是如此。組織應當考慮到,他們把數十TB的數據遷移至供應商所帶來的可能后果,因為有可能會發生不希望發生的事件或合同違約事件。
當然,賠償可能有所心理安慰,但是小額的經濟賠償完全不能彌補對企業組織的交付聲譽所帶來的實際成本、惡化或損害。
一旦發生意外事故,如果無法滿足特定的性能等級,合同可能就會終止且無任何賠償。它還應當包括一個替換托管服務的計劃,要么是內部的要么是另外一家供應商。雖然云計算歸檔的風險相對較低。 本文出自:億恩科技【www.sunshares.net】 |