我主要參考這篇文章進行實踐:點擊打開鏈接
python版本:3.5
首先整體步驟分為兩步:第一步,抓取好友個性簽名,這一步主要依靠itchat實現;第二步,分詞並形成詞雲,主要依靠jieba和wordcloud實現。
1.抓取數據
抓取數據的過程非常簡單,這里主要應用了itchat這個庫,可以直接獲取好友數據。itchat的具體其他用途請參考:點擊打開鏈接
執行到第二行代碼時會生成二維碼,用手機掃描登陸即可。執行第三行代碼后生成一個放置好友信息的列表fl,里面放置昵稱,省份,城市,個性簽名等數據,一般而言,第一個位置的信息是自己。
由於我們這里要抓取的是個性簽名,於是要調用“signature"這個鍵值:
由於有很多本來是表情的,變成了 emoji、span、class 等等這些無關緊要的詞,需要先替換掉,另外,還有類似<>/= 之類的符號,也需要寫個簡單的正則替換掉,再把所有拼起來,得到 text 字串。
到這一步為止,我們已經抓取出需要的數據並處理好,接下來進入分詞和形成詞雲。
2.分詞和詞雲
使用jieba分詞,並形成放置詞語與對應詞頻的字典。
最后通過wordcloud形成詞雲。
以下是我分析我的好友得到的結果:
看起來我的好友們更傾向於抒發對人生的感悟~
本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。