庖丁中文分詞入門(一) 效果體驗


下載地址:

zip download:http://code.google.com/p/paoding/downloads/list

svn: http://paoding.googlecode.com/svn/trunk/paoding-analysis/

效果體驗

使用者第一步最有可能的是想要體驗了解庖丁的分詞效果。考慮到這樣的需求,庖丁提供了一個shell文件,使用者不必寫任何代碼就可以獲得這樣的信息。進入Paoding-Analysis分發包,在命令行模式下執行analyzer.bat(windows)analyzer.sh(linux)即可。下以windows為例:

u       顯示幫助

E:/Paoding-Analysis>analyzer.bat ?

 

u       分詞對話

當沒有在命令行參數種輸入分詞內容或待分詞的文章時,analyzer.bat進入分詞對話模式,使用者可以多次輸入或粘貼不同的文字內容,查看分詞效果,如:

 

E:/Paoding-Analysis>analyzer.bat

paoding> |

此時使用者可以在光標所在所在位置(|)輸入或粘貼待分詞的內容(以分號結束),按下Enter鍵換行,analyzer.bat便可以輸出分詞結果。比如:

paoding> 中文分詞;

1:      中文/分詞/

        分詞器net.paoding.analysis.analyzer.PaodingAnalyzer

        內容長度 4字符, 分 2個詞

        分詞耗時 0ms

--------------------------------------------------

分詞完畢后,又會進入以上對話模式。

鍵入:e:q退出會話 (包括:符號

鍵入:?顯示幫助(包括:符號

 

u       對文件進行分

analyzer.bat允許對指定的文件進行分詞體驗。文件以路徑名給出可以使絕對地址、相對當前目錄的地址,或以classpath:為前綴的類路徑地址。示例如下:

paoding> :-f E:/content.txt

paoding> :-f E:/content.txt -c gbk

paoding> :-f E:/content.txt -c gbk -m max

 

效果截圖:

 

关注微信公众号

注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2020 ITdaan.com