亚洲va欧美va人人爽午夜,高清国产一区,欧美日韩国产成人在线91,精品久久久久久久大神国产

資訊

精準傳達 ? 有效溝通

從品牌網站建設到網絡營銷策劃,從策略到執行的一站式服務

搜索引擎中文分詞的基礎原理

來源:東莞seo優化 | 2018-9-13        瀏覽:2405

搜索引擎中文分詞的基礎原理



當搜索引擎蜘蛛將網站內容索引后就會通過中文分詞技術進行入庫,這是一個龐大的工程,百度搜索引擎對中文分詞技術掌握非常熟練,這也就是為什么在中文搜索領域百度搜索引擎一直都是獨大的原因。

1.字符串匹配的分詞方法
首先來看正向最大匹配法,就是把一個詞從左至右來分詞。舉個例子:“不知道你在說什么”,這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說什么”與正向最大匹配法相對應的是反向最大匹配發。這是第二種分詞方法。
其次是反向最大匹配法,來分上面我舉的例子是如何分的呢 “不知道你在說什么”。反向最大匹配法來分上面這段是如何分的。“不,知道,你在,說,什么”,這個就分的比較多了,反向最大匹配法就是從右至左。
最后是最短路徑分詞法。這個什么理解呢 ,就是說我一段話里面要求切出的詞數是最少的。還是上面哪句話“不知道你在說什么”最短路徑分詞法就是指,我把上面哪句話分成的詞要是最少的。不知道,你在,說什么,這就是最短路徑分詞法,分出來就只有2個詞了 。好了,當然還有上面三種可以相互結合組成一些分詞方法。比如正向最大匹配法和反向最大匹配法組合起來就可以叫做雙向最大匹配法。
2.詞義分詞法
這種其實就是一種機器語音判斷的分詞方法。很簡單,進行句法、語義分析,利用句法信息和語義信息來處理歧義現象來分詞,這種分詞方法,現在還不成熟。處在測試階段。
3.統計的分詞方法
這個很簡單,就是根據詞組的統計,就會發現兩個相鄰的字出現的頻率最多,那么這個詞就很重要。就可以作為用戶提供字符串中的分隔符。這樣來分詞。比如,“我的,你的,許多的,這里,這一,那里”。等等,這些詞出現的比較多,就從這些詞里面分開來。



搜索引擎中文分詞的基礎原理

—— 添加千度科技微信號 ——

15年 網絡推廣經驗

多一份參考,總有益處

聯系我們,免費獲得專屬《網站策劃方案》及報價

咨詢相關問題或預約面談,可以通過以下方式與我們聯系

全國統一服務熱線:135-8099-7710 / 24小時接聽服務


主站蜘蛛池模板: 龙岩市| 绿春县| 保靖县| 凤山市| 哈尔滨市| 茶陵县| 台湾省| 盐山县| 商河县| 南昌市| 宝清县| 武陟县| 仪征市| 满城县| 阿拉善左旗| 建宁县| 大理市| 泰和县| 莱州市| 绥阳县| 随州市| 庄浪县| 邵阳市| 彝良县| 安远县| 滨州市| 土默特左旗| 廉江市| 洛浦县| 辽阳县| 绵阳市| 玛曲县| 贵德县| 宝坻区| 东明县| 探索| 金阳县| 牟定县| 宝兴县| 林口县| 顺平县|