python 使用sklearn计算TF-IDF权重


1.通过os.listdir()函数获取指定目录下的文件名list

2.对文件使用jieba进行分词并提取topK作为关键词

3.使用sklearn计算每一个文本中所有关键词的权重(文本中没有的词权重为0)

4.参考链接:

http://blog.csdn.net/zhzhl202/article/details/819710

http://www.it165.net/pro/html/201407/17648.html


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2020 ITdaan.com