使用python抓取微信好友個性簽名並形成詞雲(itchat;wordcloud)


我主要參考這篇文章進行實踐:點擊打開鏈接

python版本:3.5

首先整體步驟分為兩步:第一步,抓取好友個性簽名,這一步主要依靠itchat實現;第二步,分詞並形成詞雲,主要依靠jieba和wordcloud實現。

1.抓取數據

抓取數據的過程非常簡單,這里主要應用了itchat這個庫,可以直接獲取好友數據。itchat的具體其他用途請參考:點擊打開鏈接

執行到第二行代碼時會生成二維碼,用手機掃描登陸即可。執行第三行代碼后生成一個放置好友信息的列表fl,里面放置昵稱,省份,城市,個性簽名等數據,一般而言,第一個位置的信息是自己。

由於我們這里要抓取的是個性簽名,於是要調用“signature"這個鍵值:

由於有很多本來是表情的,變成了 emoji、span、class 等等這些無關緊要的詞,需要先替換掉,另外,還有類似<>/= 之類的符號,也需要寫個簡單的正則替換掉,再把所有拼起來,得到 text 字串。

到這一步為止,我們已經抓取出需要的數據並處理好,接下來進入分詞和形成詞雲。

2.分詞和詞雲

使用jieba分詞,並形成放置詞語與對應詞頻的字典。

最后通過wordcloud形成詞雲。

以下是我分析我的好友得到的結果:

看起來我的好友們更傾向於抒發對人生的感悟~


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com