成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓
當(dāng)前位置:工程項目OA系統(tǒng) > 泛普各地 > 江西OA系統(tǒng) > 南昌OA系統(tǒng) > 南昌OA信息化
數(shù)據(jù)大清理
數(shù)據(jù)分類工具提供了基于策略管理數(shù)據(jù)的功能,從而為主存儲器騰出了空間。但這些工具大多數(shù)處理的只是非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件和文件服務(wù)應(yīng)用創(chuàng)建的數(shù)據(jù)),而不是數(shù)據(jù)庫記錄。
美國國家核安全局的IT經(jīng)理Matt Decker知道自己不能只通過添加昂貴的高端存儲陣列,來跟上該局?jǐn)?shù)據(jù)每年增長40%的迅猛勢頭。而人工刪除回收箱和臨時文件又無法釋放足夠的存儲空間。他說: “當(dāng)數(shù)據(jù)不斷增多時,你突然成了它的奴隸?!?
Decker想知道到底是哪類數(shù)據(jù)在塞滿高端磁盤,那樣就可以評估數(shù)據(jù)價值,決定怎樣把數(shù)據(jù)轉(zhuǎn)移到較便宜的存儲介質(zhì)上,或聯(lián)機(jī)方式或離線方式。
這時,總部設(shè)在加州的Arkivio公司有了用武之地。兩年前,Decker請來這家公司進(jìn)行數(shù)據(jù)審查。Arkivio的發(fā)現(xiàn)結(jié)果讓他大為震驚: 存放的數(shù)據(jù)大部分是重復(fù)文件、臨時文件和電子郵件的附件,多達(dá)3.5TB。Decker說: “要是有人發(fā)給我一封郵件,我認(rèn)為其中的附件沒有問題,就會保存下來,而別人收到附件后也會這么做。”
如今,Decker使用Arkivio公司的Auto-xplor工具,就可以自動標(biāo)記這些數(shù)據(jù),然后備份起來,并設(shè)置策略引擎,根據(jù)數(shù)據(jù)重要性決定如何存儲。
這種數(shù)據(jù)分類或者標(biāo)記工作過去要靠人工完成。而如今許多新興供應(yīng)商出售的工具則把代理放在應(yīng)用服務(wù)器上,由它們來搜尋磁盤卷。然后,分類軟件會生成有關(guān)這些卷的報告,并把該信息放入可以搜索的數(shù)據(jù)庫當(dāng)中。
譬如,數(shù)據(jù)分類軟件有“創(chuàng)建日期”和“上一次訪問日期”這樣的字段,就可以根據(jù)關(guān)鍵字進(jìn)行搜索。隨后,管理員就可以制訂策略,確定數(shù)據(jù)一旦分類完畢,應(yīng)存放在何處。
許多公司很早就向市場推出了能夠跨多種應(yīng)用(如電子郵件和文件服務(wù)器)對數(shù)據(jù)進(jìn)行分類及存儲的軟件,譬如Arkivio、倫敦的Njini公司、加州的Kazeon系統(tǒng)公司以及StoredIQ公司。
Gartner公司的分析師Carolyn Dicenzo說,電子郵件最占用主存儲陣列上的空間。其次是文本文件。而保存這些數(shù)據(jù)風(fēng)險很高: 如果保存時間超過必要期限,就很難理清大量電子郵件的頭緒,以便合法取證,還會讓公司面臨訴訟。
迄今為止,數(shù)據(jù)分類技術(shù)廠商幾乎全都提供用于處理非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件和文本文件)的產(chǎn)品。數(shù)據(jù)庫里面的結(jié)構(gòu)化數(shù)據(jù)用不著加以分類,不過越來越需要為這部分?jǐn)?shù)據(jù)編制索引,以便它們也能夠加以搜索。企業(yè)戰(zhàn)略集團(tuán)公司的分析師Steve Duplessie說,目前惟一在處理結(jié)構(gòu)化數(shù)據(jù)索引編制的一家公司是開發(fā)Greenwich軟件的英格蘭公司: CopperEye。
一切為了遵從法規(guī)
美國伊利諾斯州年產(chǎn)值57億美元的技術(shù)分銷商CDW公司預(yù)計,自己用于實施數(shù)據(jù)分類及分層存儲架構(gòu)所需的軟硬件上的開支將超過100萬美元。目的是為了更好地管理多達(dá)250TB的數(shù)據(jù),而大部分放在主存儲器上。
CDW的IT業(yè)務(wù)部門高級主管K.C. Tomsheck說: “對《財富》500強(qiáng)公司而言,法規(guī)遵從問題在過去一年事關(guān)重大。這讓我們把注意力轉(zhuǎn)向了記錄管理和信息生命周期管理?!?
于是Tomsheck在6月份開始實施數(shù)據(jù)分類項目。在第一個階段,他的法律事務(wù)部門對于如何對待不同類型的數(shù)據(jù)制訂了相應(yīng)策略。在第二個階段,項目管理辦公室對數(shù)據(jù)進(jìn)行了分類。而在最后一個階段,網(wǎng)絡(luò)技術(shù)小組將確認(rèn)由哪項技術(shù)來支持分層存儲架構(gòu)。
Tomsheck說,公司的主數(shù)據(jù)中心和備用數(shù)據(jù)中心都集中放在芝加哥,這為他的數(shù)據(jù)分類工作提供了極大幫助。他說: “數(shù)據(jù)庫、電子郵件、文件共享文檔,包括非結(jié)構(gòu)化數(shù)據(jù),它們都放在兩個地方的存儲設(shè)備上。我們的數(shù)據(jù)放在一個主存儲站點,然后可從該站點評估數(shù)據(jù),這很有幫助。”
該公司購買了EMC公司的12個網(wǎng)絡(luò)附加存儲(NAS)陣列,包括Centera內(nèi)容尋址存儲陣列。如果一切按計劃發(fā)展,大約150TB的數(shù)據(jù)將從主存儲陣列遷移到輔助的NAS陣列上。Tomsheck說: “我們把這看成是‘現(xiàn)在獲得回報還是以后獲得回報’的問題?!彼M茉谌哪陜?nèi)獲得投資回報。
Duplessie強(qiáng)調(diào),數(shù)據(jù)分類的成本通常不是來自技術(shù)本身,而是來自確定如何對數(shù)據(jù)進(jìn)行分類所用的時間。
作為其戰(zhàn)略的一部分,Decker購買了EMC公司的Centera內(nèi)容尋址存儲器陣列,以便對電子郵件和文件進(jìn)行聯(lián)機(jī)歸檔,那樣最終用戶仍能夠訪問數(shù)據(jù)。 (CCW)
本站推薦
- 1數(shù)據(jù)通信工程師在客戶網(wǎng)絡(luò)搭建場景里是軟件嗎?能替代人工操作不?
- 2客戶數(shù)據(jù)中心系統(tǒng)運維項目的監(jiān)理工作,能節(jié)省多少成本?
- 3電商客戶用庫存管理系統(tǒng)數(shù)據(jù)編寫,能節(jié)省多少成本?
- 4生產(chǎn)車間用它管理數(shù)據(jù),和同類 Top3 比咋樣?
- 5土建工程師用這數(shù)據(jù)管理軟件做項目,能節(jié)省多少成本?
- 6土建工程師用數(shù)據(jù)管理系統(tǒng)做項目進(jìn)度管理,能替代人工嗎?
- 7土建工程師用數(shù)據(jù)匯總軟件做項目,功能能hold住復(fù)雜工程場景嗎?
- 8安徽某企業(yè)用應(yīng)急倉庫管理系統(tǒng),數(shù)據(jù)出錯咋挽救?
- 9庫存管理系統(tǒng)數(shù)據(jù)結(jié)構(gòu)在電商倉庫應(yīng)用中,能替代人工操作嗎?

