Python jieba庫(kù)分詞模式實(shí)例用法
在中文分詞中,jiebe庫(kù)是最為常見(jiàn)的,主要的原因還是它獨(dú)特的支持分詞模式如:精確模式、全模式、搜索引擎模式。也對(duì)應(yīng)著三種方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就為大家實(shí)例操作這些分詞模式,以及方法的使用,一起來(lái)了解下吧。
全模式:import jiebaseg_list = jieba.cut('南京市長(zhǎng)江大橋歡迎你。', cut_all=True)print(type(seg_list),seg_list)精確模式:
seg_list1 = jieba.lcut('南京市長(zhǎng)江大橋歡迎你。', cut_all=False)print(type(seg_list1),seg_list1)搜索模式:
seg_list2 = jieba.cut_for_search('南京市長(zhǎng)江大橋歡迎你。')print(type(seg_list2),seg_list2)print('全模式:' + '/ '.join(seg_list))print('精確模式:' + '/ '.join(seg_list1))print('搜索引擎模式:' + '/ '.join(seg_list2))
輸出結(jié)果:
全模式:南京/ 南京市/ 京市/ 市長(zhǎng)/ 長(zhǎng)江/ 長(zhǎng)江大橋/ 大橋/ 歡迎/ 你/ 。
精確模式:南京市/ 長(zhǎng)江大橋/ 歡迎/ 你/ 。
搜索引擎模式:南京/ 京市/ 南京市/ 長(zhǎng)江/ 大橋/ 長(zhǎng)江大橋/ 歡迎/ 你/ 。
內(nèi)容擴(kuò)展:
獲取詞性
我們還可以通過(guò)jiaba這個(gè)庫(kù)把詞性進(jìn)行區(qū)分,比如動(dòng)詞,名詞等
import jieba.posseg as psgseg_list = psg.cut('我要進(jìn)行關(guān)鍵詞提取')print([(s.word, s.flag) for s in seg_list])# [(’我’, ’r’), (’要’, ’v’), (’進(jìn)行’, ’v’), (’關(guān)鍵詞’, ’n’), (’提取’, ’v’)]
我們還可以提取動(dòng)詞或者名詞,我們來(lái)提取下里面的動(dòng)詞
import jieba.posseg as psgseg_list = psg.cut('我要進(jìn)行關(guān)鍵詞提取')print([(s.word, s.flag) for s in seg_list if s.flag.startswith(’v’)])
到此這篇關(guān)于Python jieba庫(kù)分詞模式實(shí)例用法的文章就介紹到這了,更多相關(guān)Python jieba庫(kù)分詞模式怎么用內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. docker容器調(diào)用yum報(bào)錯(cuò)的解決辦法2. Java使用Tesseract-Ocr識(shí)別數(shù)字3. vue實(shí)現(xiàn)web在線聊天功能4. JAMon(Java Application Monitor)備忘記5. Springboot 全局日期格式化處理的實(shí)現(xiàn)6. 完美解決vue 中多個(gè)echarts圖表自適應(yīng)的問(wèn)題7. SpringBoot+TestNG單元測(cè)試的實(shí)現(xiàn)8. Django使用HTTP協(xié)議向服務(wù)器傳參方式小結(jié)9. HTML基本語(yǔ)法和語(yǔ)義寫(xiě)法規(guī)則與實(shí)例10. 使用Node.js實(shí)現(xiàn)Clean Architecture方法示例詳解
