成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓
當前位置:工程項目OA系統(tǒng) > 建筑OA系統(tǒng) > 裝修預算軟件
裝修預算軟件seo優(yōu)化教程_中文分詞_中文分詞的方法(上)
中文分詞_中文分詞的方法(上)
分詞是中文搜索引擎特有的步驟。搜索引擎存儲和處理頁面及用戶搜索都是以詞為基礎的。英文等語言單詞與單詞之間有空格分隔,搜索引擎索引程序可以直接把句子劃分為單詞的集合。而中文詞與詞之間沒有任何分隔符,一個句子中的所有字和詞都是連在一起的。搜索引擎必須首先分辨哪幾個字組成一個詞,哪些字本身就是一個詞。比如“減肥方法”將被分詞為“減肥”和“方法”兩個詞。
中文分詞方法基本上有兩種,一種是基于詞典匹配,另一種是基于統(tǒng)計。
基于詞典匹配的方法是指,將待分析的一段漢字與一個事先造好的詞典中的詞條進行匹配,在待分析漢字串中掃描到詞典中已有的詞條則匹配成功,或者說切分出一個單詞。
按照掃描方向,基于詞典的匹配法可以分為正向匹配和逆向匹配。按照匹配長度優(yōu)先級的不同,又可以分為最大匹配和最小匹配。將掃描方向和長度優(yōu)先混合,又可以產生正向最大匹配、逆向最大匹配等不同方法。
詞典匹配方法計算簡單,其準確度在很大程度上取決于詞典的完整性和更新情況。
基于統(tǒng)計的分詞方法指的是分析大量文字樣本,計算出字與字相鄰出現(xiàn)的統(tǒng)計概率,幾個字相鄰出現(xiàn)越多,就越可能形成一個單詞?;诮y(tǒng)計的方法的優(yōu)勢是對新出現(xiàn)的詞反應更快速,也有利于消除歧義。
基于詞典匹配和基于統(tǒng)計的分詞方法各有優(yōu)劣,實際使用中的分詞系統(tǒng)都是混合使用兩種方法的,快速高效,又能識別生詞、新詞,消除歧義。
延伸閱讀:
裝修公司商業(yè)系統(tǒng)建設_營銷技技巧_把握與客戶的關系
裝修公司商業(yè)系統(tǒng)建設_營銷技技巧_贏得競爭
裝修公司商業(yè)系統(tǒng)建設_洽談技巧
聯(lián)系QQ:2558628650 442699841

裝修預算軟件是一家專業(yè)從事裝修行業(yè)培訓管理咨詢及軟件服務機構。2010年裝修預算軟件正式上線。是國內第一家專業(yè)為裝修企業(yè)提供以營銷管理咨詢,家裝軟件銷售及高素質的室內裝修設計師培訓為核心,綜合裝修營銷策劃、家裝營銷管理,裝修企業(yè)品牌文化建設為一體的服務公司。→點擊進入室內裝修預算軟件

