天津OA信息化
當前位置:工程項目OA系統(tǒng) > 泛普各地 > 天津OA系統(tǒng) > 天津OA信息化
非結構化數(shù)據(jù)管理與知識提煉
隨著互聯(lián)時代的到來,企業(yè)面對的信息呈現(xiàn)爆炸式增長,據(jù)Forrest Research的統(tǒng)計資料表明,其中20%左右的信息有效地存儲在了各種類型的結構化數(shù)據(jù)庫中,但是還有80%非結構化信息分散在組織的整個業(yè)務過程及外部環(huán)境中。如何有效管理大量的非結構化數(shù)據(jù),同時在此基礎上抽取、提煉出對組織決策有輔助作用的知識,是現(xiàn)在所有學習型組織的基本要求。
非結構化數(shù)據(jù)管理目的是在組織現(xiàn)有的分散應用環(huán)境下,把原來分散的部門和組織,通過系統(tǒng)的集成使其相互關聯(lián),形成廣泛的、相互關聯(lián)的組織應用環(huán)境。它在組織系統(tǒng)的構架層次上,為組織的信息流建立了一個跨越多種分散的、內(nèi)部和外部的信息處理過程的系統(tǒng)鏈,完全淡化了傳統(tǒng)的內(nèi)外部分界。
如何實現(xiàn)有效非結構化數(shù)據(jù)管理
針對當前組織的需求,非結構化數(shù)據(jù)管理首先是要支持廣泛的數(shù)據(jù)源(結構化和非結構化數(shù)據(jù)),包括erp系統(tǒng)、Lotus Notes、數(shù)據(jù)庫、文字處理和表格文件等。通過從后臺系統(tǒng)(如數(shù)據(jù)庫、ERP等)抽取業(yè)務信息、建立索引并映射到基于Internet和Intranet的內(nèi)容。
其次,非結構化數(shù)據(jù)管理必須有一個強大的、可擴展的系統(tǒng)用于存儲和組織數(shù)據(jù)。由于后端結構數(shù)據(jù)庫或者文件系統(tǒng)是動態(tài)的、異構的,這意味著自動抽取數(shù)據(jù)源并遞交給桌面是一種非常復雜的連接,需要一種靈活的、可擴展的信息抽取機制和個性化的界面定制工具。
知識管理系統(tǒng)的架構
數(shù)據(jù)集成、應用集成和知識集成是非結構化數(shù)據(jù)管理從低到高的三個不同層面。知識集成實現(xiàn)將組織已建立的非結構化數(shù)據(jù)庫,按照業(yè)界先進的信息采集、信息分類算法,通過系統(tǒng)自身對信息的理解,將信息依照用戶的需求,充分有效地集成為整體。而后通過系統(tǒng)提供的前端工具,為用戶提供所需主題、類別的相關信息,建立每個系統(tǒng)用戶的個人檔案,實現(xiàn)信息個人化、信息提示、信息檢索等對信息利用的所有功能。
實現(xiàn)上圖所示功能,系統(tǒng)也必須具有知識檢索引擎、知識聚類模塊和用戶管理模塊。
知識檢索引擎實現(xiàn)概念分析、內(nèi)容提取、概念模式識別、相關度計算、全文檢索等關鍵工作。知識聚類模塊負責提供諸如自動分類、自動信息群識別等功能。用戶管理模塊提供用戶自動建檔、檔案搜尋、檔案分析、檔案實時自動更新等功能,實現(xiàn)用戶信息個人定制。
知識提煉技術特點
作為知識管理系統(tǒng)的關鍵是分類算法,以及基于算法之上的知識提供途徑和手段。隨著技術不斷的發(fā)展,分類算法現(xiàn)已比較成熟,實際應用比較廣泛的有兩種分類算法:基于內(nèi)容分類和關鍵詞分類。關鍵詞的分類基本都是以空間向量模型為算法基礎,國內(nèi)外都有很成熟的產(chǎn)品,如Verity、Excalibur和TRS等。而近年來,基于內(nèi)容的分類方法也得到了長足的進步,出現(xiàn)了Autonomy為代表的商業(yè)化產(chǎn)品。內(nèi)容分類以貝葉斯概率理論和神經(jīng)元網(wǎng)絡為核心,可以識別與文字頻率相匹配的自然文本模式及與特定概念相關的術語。然后,識別出在一組非結構化信息中出現(xiàn)頻率高的模式,相應地確定某特定主題的概率百分比。然后對文檔中的主要概念進行編碼,因此就可以自動根據(jù)文本進行搜索、分發(fā)等活動。
結論
總之,組織所面臨的是怎樣將上述技術結合起來,從而有效地管理知識、提煉知識的問題,而這更主要地依賴于組織所要吸取的知識的類型。構建一個知識管理系統(tǒng)的難度差別極大。通過組合運用電子郵件、BBS和文檔管理技術,你可以創(chuàng)建一個相當基本的知識管理系統(tǒng)。更為復雜的設計方案將起始于一個網(wǎng)絡瀏覽器類型的用戶界面,該界面是基于網(wǎng)絡系統(tǒng)體系的;再下一層便是所謂的概念分類層,就是用于區(qū)分和確認各種知識的條目分類的系統(tǒng)。
同時,知識提煉將重新塑造關于競爭和價值評估的基本信念。將現(xiàn)有的和新出現(xiàn)的技術進行創(chuàng)造性組合,并能為企業(yè)創(chuàng)造效益的知識提煉應具有以下特征:
智能模式匹配:應該能夠理解知識內(nèi)容的上下文情境。例如,它應該能區(qū)分出醫(yī)療系統(tǒng)和金融證券的差別。
培訓官:今天,你們應該掌握火腿的烤制。我的計算機里面有非常詳細的錄像培訓資料,內(nèi)容涵蓋從小豬繁育到人體對蛋白質(zhì)的吸收。如果需要加班,公司提供晚餐——你們自己做的火腿。
完全個性化:應當能夠根據(jù)用戶的知識背景和經(jīng)驗對知識進行整理組織,按照用戶的習慣與思想目標推送信息。
靈活性:應能處理任何形式的知識,包括不同主題、結構和媒介,能將知識主題、內(nèi)容按照用戶的需求以自定義格式輸出到相應媒介。
后控系統(tǒng)智能:了解它的所有用戶和系統(tǒng)內(nèi)所貯存的知識,隨著時間的流逝,它為使用者提供知識的能力應因此而不斷提高。
主動性:應能推斷出用戶的知識需求,并能超出用戶所表達的需求對關聯(lián)的知識作出提議。
將來的知識管理技術應當建立在此基礎上,即有更便于瀏覽與體現(xiàn)知識的視覺工具;更強大方便的自動化“無聲”知識監(jiān)控手段,能完全實現(xiàn)信息源的隨時添加;添加信息庫群體評價的機制以及更高級的能從無法圖形化的音像等信息源挖掘知識的工具。盡管知識管理技術還有一段很長的路要走,但它所帶來的效益值得人們普遍關注。
非結構化數(shù)據(jù)管理目的是在組織現(xiàn)有的分散應用環(huán)境下,把原來分散的部門和組織,通過系統(tǒng)的集成使其相互關聯(lián),形成廣泛的、相互關聯(lián)的組織應用環(huán)境。它在組織系統(tǒng)的構架層次上,為組織的信息流建立了一個跨越多種分散的、內(nèi)部和外部的信息處理過程的系統(tǒng)鏈,完全淡化了傳統(tǒng)的內(nèi)外部分界。
如何實現(xiàn)有效非結構化數(shù)據(jù)管理
針對當前組織的需求,非結構化數(shù)據(jù)管理首先是要支持廣泛的數(shù)據(jù)源(結構化和非結構化數(shù)據(jù)),包括erp系統(tǒng)、Lotus Notes、數(shù)據(jù)庫、文字處理和表格文件等。通過從后臺系統(tǒng)(如數(shù)據(jù)庫、ERP等)抽取業(yè)務信息、建立索引并映射到基于Internet和Intranet的內(nèi)容。
其次,非結構化數(shù)據(jù)管理必須有一個強大的、可擴展的系統(tǒng)用于存儲和組織數(shù)據(jù)。由于后端結構數(shù)據(jù)庫或者文件系統(tǒng)是動態(tài)的、異構的,這意味著自動抽取數(shù)據(jù)源并遞交給桌面是一種非常復雜的連接,需要一種靈活的、可擴展的信息抽取機制和個性化的界面定制工具。
知識管理系統(tǒng)的架構
數(shù)據(jù)集成、應用集成和知識集成是非結構化數(shù)據(jù)管理從低到高的三個不同層面。知識集成實現(xiàn)將組織已建立的非結構化數(shù)據(jù)庫,按照業(yè)界先進的信息采集、信息分類算法,通過系統(tǒng)自身對信息的理解,將信息依照用戶的需求,充分有效地集成為整體。而后通過系統(tǒng)提供的前端工具,為用戶提供所需主題、類別的相關信息,建立每個系統(tǒng)用戶的個人檔案,實現(xiàn)信息個人化、信息提示、信息檢索等對信息利用的所有功能。
實現(xiàn)上圖所示功能,系統(tǒng)也必須具有知識檢索引擎、知識聚類模塊和用戶管理模塊。
知識檢索引擎實現(xiàn)概念分析、內(nèi)容提取、概念模式識別、相關度計算、全文檢索等關鍵工作。知識聚類模塊負責提供諸如自動分類、自動信息群識別等功能。用戶管理模塊提供用戶自動建檔、檔案搜尋、檔案分析、檔案實時自動更新等功能,實現(xiàn)用戶信息個人定制。
知識提煉技術特點
作為知識管理系統(tǒng)的關鍵是分類算法,以及基于算法之上的知識提供途徑和手段。隨著技術不斷的發(fā)展,分類算法現(xiàn)已比較成熟,實際應用比較廣泛的有兩種分類算法:基于內(nèi)容分類和關鍵詞分類。關鍵詞的分類基本都是以空間向量模型為算法基礎,國內(nèi)外都有很成熟的產(chǎn)品,如Verity、Excalibur和TRS等。而近年來,基于內(nèi)容的分類方法也得到了長足的進步,出現(xiàn)了Autonomy為代表的商業(yè)化產(chǎn)品。內(nèi)容分類以貝葉斯概率理論和神經(jīng)元網(wǎng)絡為核心,可以識別與文字頻率相匹配的自然文本模式及與特定概念相關的術語。然后,識別出在一組非結構化信息中出現(xiàn)頻率高的模式,相應地確定某特定主題的概率百分比。然后對文檔中的主要概念進行編碼,因此就可以自動根據(jù)文本進行搜索、分發(fā)等活動。
結論
總之,組織所面臨的是怎樣將上述技術結合起來,從而有效地管理知識、提煉知識的問題,而這更主要地依賴于組織所要吸取的知識的類型。構建一個知識管理系統(tǒng)的難度差別極大。通過組合運用電子郵件、BBS和文檔管理技術,你可以創(chuàng)建一個相當基本的知識管理系統(tǒng)。更為復雜的設計方案將起始于一個網(wǎng)絡瀏覽器類型的用戶界面,該界面是基于網(wǎng)絡系統(tǒng)體系的;再下一層便是所謂的概念分類層,就是用于區(qū)分和確認各種知識的條目分類的系統(tǒng)。
同時,知識提煉將重新塑造關于競爭和價值評估的基本信念。將現(xiàn)有的和新出現(xiàn)的技術進行創(chuàng)造性組合,并能為企業(yè)創(chuàng)造效益的知識提煉應具有以下特征:
智能模式匹配:應該能夠理解知識內(nèi)容的上下文情境。例如,它應該能區(qū)分出醫(yī)療系統(tǒng)和金融證券的差別。
培訓官:今天,你們應該掌握火腿的烤制。我的計算機里面有非常詳細的錄像培訓資料,內(nèi)容涵蓋從小豬繁育到人體對蛋白質(zhì)的吸收。如果需要加班,公司提供晚餐——你們自己做的火腿。
完全個性化:應當能夠根據(jù)用戶的知識背景和經(jīng)驗對知識進行整理組織,按照用戶的習慣與思想目標推送信息。
靈活性:應能處理任何形式的知識,包括不同主題、結構和媒介,能將知識主題、內(nèi)容按照用戶的需求以自定義格式輸出到相應媒介。
后控系統(tǒng)智能:了解它的所有用戶和系統(tǒng)內(nèi)所貯存的知識,隨著時間的流逝,它為使用者提供知識的能力應因此而不斷提高。
主動性:應能推斷出用戶的知識需求,并能超出用戶所表達的需求對關聯(lián)的知識作出提議。
將來的知識管理技術應當建立在此基礎上,即有更便于瀏覽與體現(xiàn)知識的視覺工具;更強大方便的自動化“無聲”知識監(jiān)控手段,能完全實現(xiàn)信息源的隨時添加;添加信息庫群體評價的機制以及更高級的能從無法圖形化的音像等信息源挖掘知識的工具。盡管知識管理技術還有一段很長的路要走,但它所帶來的效益值得人們普遍關注。
相關欄目:
相關文章:
- 1[原創(chuàng)] 六度分離電子社區(qū)(AMT研究院 趙靜)
- 2獲獎論文(二等獎)個人智能提升途徑初探
- 3世界天津OA信息化之父:卡爾愛立克-斯威比博士
- 4讓企業(yè)有一顆永遠年輕的心--談知識時代的天津OA信息化
- 5知識、天津OA信息化與博客的作用初探(托尼)
- 6為什么要通過天津OA信息化保護企業(yè)知識產(chǎn)權?
- 7天津OA信息化與企業(yè)內(nèi)外部知識
- 8互聯(lián)網(wǎng)協(xié)會發(fā)布Web 2.0報告 揭示十大發(fā)現(xiàn)
- 9實施天津OA信息化的意義和作用
- 10基于能力素質(zhì)模型的天津OA信息化
- 11知識經(jīng)濟時代企業(yè)如何出招
- 12隱性知識如何顯性化
- 13成功人生需要“十商”
- 14利用實踐社區(qū)共享組織知識
- 15泛普OA軟件信息門戶ThinkOne-EIP(Enterprise Information Portal)解決方案
- 16天津OA信息化:營建學習型團隊
- 17你的企業(yè)離天津OA信息化還有多遠?
- 18BI、KM,哪一片云彩會下雨?
- 19如何創(chuàng)造知識分享的組織文化
- 20網(wǎng)絡日記(blog)與天津OA信息化
- 21更輕易地找到并使用企業(yè)知識的三種方法——來自Google、eBay和 Amazon的成功經(jīng)驗 (下)(AMT研究院 王海
- 22天津OA信息化之認知一致性框架(AMT研究院 趙靜 編譯)
- 23情報信息 生死悠關的核心競爭力
- 24天津OA信息化揚帆起航
- 25設備維修的天津OA信息化
- 26天津OA信息化系統(tǒng)在企業(yè)信息資源管理中的應用
- 27天津OA信息化的出發(fā)點及目的
- 28企業(yè)實施天津OA信息化的目的是什么?
- 29政府機關建置天津OA信息化系統(tǒng)須突破之困境
- 30天津OA信息化面臨的挑戰(zhàn)
天津OA系統(tǒng)
聯(lián)系方式
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓
友情鏈接