監(jiān)理公司管理系統 | 工程企業(yè)管理系統 | OA系統 | ERP系統 | 造價咨詢管理系統 | 工程設計管理系統 | 甲方項目管理系統 | 簽約案例 | 客戶案例 | 在線試用
X 關閉
南昌OA系統
聯系方式

成都公司:成都市成華區(qū)建設南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統

QQ在線咨詢

歸檔不同于備份

申請免費試用、咨詢電話:400-8352-114

周濤

目前,較普遍的歸檔應用只是簡單地把備份數據保存很長時間,每周或每月不加選擇地進行全數據備份,再根據商業(yè)要求保存幾年甚至幾十年。但是,歸檔與備份有本質的不同,因為歸檔的數據可能幾個月甚至幾年未被使用,而一旦需要時則必須盡快獲取。在備份數據中尋找特定的信息不僅耗時,而且代價很高。將備份當作歸檔會帶來許多問題。

備份系統用于歸檔的困境

首先,當用戶需要查找?guī)啄昵暗囊恍┫嚓P資料時,就必須記住這些文件存放在什么地方。這不是一件容易的事,即使用戶能記住,由于計算機平臺和軟件的日新月異,要找到當年的讀取設備、操作系統和應用程序,甚至還需要訪問權限去打開這些文件是相當費力的。

其次,用備份數據來滿足電子發(fā)現的要求就更加困難。例如,公司要獲取某個員工在3年前某兩個月內從Exchange服務器上發(fā)出的所有電子郵件,或許可以花很長時間從備份系統中恢復特定時間內在Exchange服務器上保存過的電子郵件,但如果接收者在收到該員工電子郵件的同一天把它刪除了,那么被刪除的電子郵件就沒能在當晚的備份作業(yè)中保存。因此,嚴格說來,即使找到了所有已備份的電子郵件,也不能符合電子發(fā)現的特定要求。

第三,恢復備份數據并進行查找會消耗大量時間和費用。試想一下,如果要把過去10年中滿足某些條件的Exchange服務器上的電子郵件找出來,而公司每星期做一次備份,那么該公司的IT管理員就必須把每個恢復到Exchange服務器中的滿足條件的電子郵件存入一個.pst文件,這樣的手工作業(yè)至少要重復500多次。

此外,備份系統用于保存歸檔數據是相當低效的。一個歸檔系統對每個文件通常保存1~2份拷貝就足夠了,而備份系統卻沒有這樣的邏輯,特別是全備份系統,每次備份總是把未刪除的舊數據又保存一次,浪費了很多存儲空間。隨著備份格式和磁帶介質更新換代,許多企業(yè)耗費了相當大的精力進行設備升級和數據拷貝、遷移以及各種轉換,同時又保留舊的備份格式和舊磁帶上的數據,導致不同格式數據的許多副本分散在不同的設備和介質中,對這些數據進行有效管理和查詢幾乎不可能。

有效歸檔系統的特征

一個有效的歸檔系統最重要的特征是包含了足夠多的元數據,并能通過邏輯方式獲取信息。例如,一個電子郵件歸檔系統的元數據應至少包括發(fā)件人、收件人、主題、時間等信息,通常還會把電子郵件主體放入數據庫用于全文搜索,甚至把附件的相關信息和關鍵詞也提取出來作為元數據保存。

歸檔系統的另一個重要特征是能夠保存預定數量的副本。例如,一個公司可以決定把一份歸檔數據存放在磁盤介質的存儲設備中,把另一份相同的數據存放在光盤或磁帶庫里,以確保數據萬無一失。

兩類主要的歸檔系統

根據保存數據方式的不同,歸檔系統大致可分為兩類。

一類是傳統的依附于備份軟件的歸檔系統,允許用戶對所選擇的文件進行歸檔,并把有限的元數據附加上去,然后把這些歸檔數據的備份文件刪除,以減少重復數據。這種歸檔的缺陷在于,如果用戶想通過不同的元數據查找歸檔信息,就必須建立幾個附加不同元數據的歸檔文件。因此,這類系統基本上只適用于訪問率較低的歸檔數據。

第二類歸檔系統意識到任何歸檔數據可能有不同的用途,因此需要用不同的元數據來描述。實現這類系統的關鍵在于對實際的歸檔數據只保存一份,而把所有的元數據都保存在可搜索的數據庫中。這就是近年來逐漸興起的內容尋址存儲(CAS)。與第一類只在備份后才成為歸檔數據的歸檔系統不同,CAS歸檔系統對所有的數據都自動不間斷地進行歸檔。一個文件或電子郵件一經產生,其中一個拷貝以及相關的元數據就被保存到歸檔系統中去。

CAS歸檔的另一個優(yōu)勢在于,使用了單一實例和增量保存的手段。它對所有的文件或電子郵件都只保存一個拷貝,當該文件或電子郵件被修改后再次發(fā)送和保存時,歸檔系統能夠只保存變化的字節(jié),因而極大地節(jié)省了磁盤空間,簡化了管理。這種特性使CAS歸檔系統頻繁地出現在分級存儲管理和重復數據刪除應用中。

CAS歸檔系統

國外主要的存儲廠商如EMC和HP,以及一些初創(chuàng)企業(yè)如Bycast和Permabit等都相繼推出了CAS歸檔產品。這些產品雖然技術路線相近,但各自的特點和針對的應用不盡相同。比如,HP RISS系統主要用于電子出件歸檔,而Bycast的方案局限于醫(yī)療影像的歸檔。國內歸檔市場才剛剛起步,也出現了一些歸檔產品。谷數科技的D-Mesh集群CAS系統可以滿足多種歸檔的應用需求,其最顯著的特點是內嵌了非結構化搜索引擎,極大地提高了元數據生成、管理和數據查找的效率,把歸檔技術推向一個新的高度。

來源:CIO時代

發(fā)布:2025-12-17 15:50    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]