Python爬知乎妹子都愛取啥名


閑來無事上知乎,看到好多妹子,於是抓取一波。

有沒有興趣??

目標網址https://www.zhihu.com/collection/78172986

抓取分析

爬取分析

使用pandas操作文件

import pandas as pd
fp = pd.read_excel('D:\Backup\桌面\lunzige.xlsx')

fp

name = fp['name'].tolist()
li1 = list(set(name))
li1

['阿蕾',
 '楊面',
 '陳10',
 '楊順順',
 '霧橤',
 '真順順真',
 '謝椿明',
 '刀刀',
 '水槍大帝',
 '傾淺',
 'Listening',
 '小火龍',
 '包子琛',
 '楊筍筍',
 '蜉蝣',
 '十元',
 '靡靡之音',
 'Real機智張',
 '陳梓小童鞋',
 '花甲',
 '窗里窗外',
 '劉梓喬',
 '璇璇97',
 'Olivia菊香小姐姐',
 '牛奶小夏目',
 '周依寧',
 '萬阿咸',
 '一蓑煙雨任平生',
 '來都來了',
 '就像周一',
 'Mc蛋蛋',
 '秉劍侯',
 '李大夢Lee',
 'Diss銳雯',
 '雨音眞白',
 '半仙幺幺',
 'Natsuki是只蠢兔紙',
 '夏冰瑩',
 'guuweihai',
 '阿舞',
 '肖柚妮',
 '墨脫要開',
 '芷珞',
 '舒西婷',
 'Childe0Q',
 '被壓扁的海螺',
 'snow arc',
 '灰灰灰灰灰plus',
 '小兔子菲呀',
 '士多啤梨羊咩咩',
 '李小可可',
 '誰來拽我的尾巴',
 '飛鴿之舞',
 '小美',
 '櫻雪綾sama',
 'zshiyao',
 '王漠里',
 'Slivan',
 '喵小蝦',
 'SUSAN蘇',
 '上官蘭顏',
 '這個殺手不太冷',
 '看朱成碧紛思君',
 '情緒',
 '我系小忌廉',
 '一只兔',
 'June',
 '我就想改名而已',
 '溫柔的大貓Leo',
 '貓芙琳',
 '以太',
 '博麗魔理沙',
 '洛麗塔',
 '羽小團',
 '婁良',
 'Rosi',
 '葉以北',
 '吃不胖的小貓',
 'Lina',
 'ingrid',
 'itttttx',
 '胡楊',
 '孫阿童',
 '林美珍',
 '赫蘿Taiga',
 '宮曼曼',
 'Yoonyicc',
 'ZW711',
 '笙簫',
 'KIKI.Liu',
 '另一只襪子',
 '荒野大嫖客',
 '少女詩',
 '芸豆豆豆豆',
 '璐璐嚕',
 '棹歌',
 '夢里有只獨角獸',
 'Oo澄子oO',
 '雷梅苔絲',
 'CherryZhao',
 '李萬一',
 '琴脂',
 '鹿斑比',
 'Chris姬-雲煙',
 'hyoram',
 '蔗蔗蔗',
 '柚子Ruby',
 'Sheena',
 '孟德爾',
 'kaka小師妹',
 '楨視明',
 '大豆苗',
 '少女開膛手',
 '陳詩茗']

那么,下一步就是對名字進行分詞了,jieba分詞,你值得擁有。fxsjy/jieba

li2 = ''.join(li1)
li2

'阿蕾楊面陳10楊順順霧橤真順順真謝椿明刀刀水槍大帝傾淺Listening小火龍包子琛楊筍筍蜉蝣十元靡靡之音Real機智張陳梓小童鞋花甲窗里窗外劉梓喬璇璇97Olivia菊香小姐姐牛奶小夏目周依寧萬阿咸一蓑煙雨任平生來都來了就像周一Mc蛋蛋秉劍侯李大夢LeeDiss銳雯雨音眞白半仙幺幺Natsuki是只蠢兔紙夏冰瑩guuweihai阿舞肖柚妮墨脫要開芷珞舒西婷Childe0Q被壓扁的海螺snow arc灰灰灰灰灰plus小兔子菲呀士多啤梨羊咩咩李小可可誰來拽我的尾巴飛鴿之舞小美櫻雪綾samazshiyao王漠里Slivan喵小蝦SUSAN蘇上官蘭顏這個殺手不太冷看朱成碧紛思君情緒我系小忌廉一只兔June我就想改名而已溫柔的大貓Leo貓芙琳以太博麗魔理沙洛麗塔羽小團婁良Rosi葉以北吃不胖的小貓Linaingriditttttx胡楊孫阿童林美珍赫蘿Taiga宮曼曼YoonyiccZW711笙簫KIKI.Liu另一只襪子荒野大嫖客少女詩芸豆豆豆豆璐璐嚕棹歌夢里有只獨角獸Oo澄子oO雷梅苔絲CherryZhao李萬一琴脂鹿斑比Chris姬-雲煙hyoram蔗蔗蔗柚子RubySheena孟德爾kaka小師妹楨視明大豆苗少女開膛手陳詩茗'


下一步就是分詞制作圖雲了

import jieba
seg_list = jieba.cut(li2)
word = "/".join(seg_list)
print("Full Mode: " + "/ ".join(seg_list)) 

Building prefix dict from the default dictionary ...
Dumping model to file cache C:\Users\ADMINI~1\AppData\Local\Temp\jieba.cache
Loading model cost 1.148 seconds.
Prefix dict has been built succesfully.
Full Mode: 阿蕾/ 楊/ 面陳/ 10/ 楊/ 順順/ 霧/ 橤/ 真/ 順順/ 真/ 謝椿明/ 刀刀/ 水槍/ 大帝/ 傾淺/ Listening/ 小/ 火龍/ 包子/ 琛/ 楊筍/ 筍/ 蜉蝣/ 十元/ 靡靡之音/ Real/ 機智/ 張/ 陳梓/ 小/ 童鞋/ 花甲/ 窗里/ 窗外/ 劉梓喬/ 璇/ 璇/ 97Olivia/ 菊香/ 小姐姐/ 牛奶/ 小夏目/ 周依寧/ 萬/ 阿/ 咸一/ 蓑/ 煙雨任/ 平生/ 來/ 都/ 來/ 了/ 就/ 像/ 周一/ Mc/ 蛋蛋/ 秉劍侯/ 李大夢/ LeeDiss/ 銳雯雨/ 音眞白/ 半仙/ 幺/ 幺/ Natsuki/ 是/ 只/ 蠢/ 兔紙/ 夏/ 冰瑩/ guuweihai/ 阿舞/ 肖柚妮/ 墨脫/ 要/ 開芷/ 珞/ 舒西婷/ Childe0Q/ 被/ 壓扁/ 的/ 海螺/ snow/  / arc/ 灰灰/ 灰灰/ 灰/ plus/ 小兔子/ 菲/ 呀/ 士多啤梨/ 羊/ 咩/ 咩/ 李小/ 可可/ 誰/ 來/ 拽/ 我/ 的/ 尾巴/ 飛鴿/ 之舞/ 小美/ 櫻雪/ 綾/ samazshiyao/ 王漠/ 里/ Slivan/ 喵/ 小蝦/ SUSAN/ 蘇/ 上官/ 蘭顏/ 這個/ 殺手/ 不/ 太冷/ 看朱成碧/ 紛思君/ 情緒/ 我系/ 小忌廉/ 一只/ 兔/ June/ 我/ 就/ 想/ 改名/ 而已/ 溫柔/ 的/ 大貓/ Leo/ 貓/ 芙琳/ 以太/ 博麗/ 魔理沙/ 洛麗塔/ 羽小團/ 婁良/ Rosi/ 葉/ 以北/ 吃不胖/ 的/ 小貓/ Linaingriditttttx/ 胡楊/ 孫阿童/ 林美珍/ 赫蘿/ Taiga/ 宮曼曼/ YoonyiccZW711/ 笙簫/ KIKI/ ./ Liu/ 另一只/ 襪子/ 荒野/ 大/ 嫖客/ 少女/ 詩/ 芸豆/ 豆豆/ 豆璐璐嚕/ 棹/ 歌夢里/ 有/ 只/ 獨角獸/ Oo/ 澄子/ oO/ 雷梅/ 苔絲/ CherryZhao/ 李萬/ 一琴脂/ 鹿斑/ 比/ Chris/ 姬/ -/ 雲煙/ hyoram/ 蔗蔗蔗/ 柚子/ RubySheena/ 孟德爾/ kaka/ 小/ 師妹/ 楨視/ 明大/ 豆苗/ 少女/ 開膛手/ 陳詩/ 茗

下一步繪制圖雲,用jupyter遇到了很多坑。。

# -*- coding: utf-8 -*-
import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator

# 直接從文件讀取數據

text = '''阿蕾/楊/面陳/10/楊/順順/霧/橤/真/順順/真/謝椿明/刀刀/水槍/大帝/傾淺/Listening/小/火龍/包子/琛/楊筍/筍/蜉蝣/十元/靡靡之音/Real/機智/張/陳梓/小/童鞋/花甲/窗里/窗外/劉梓喬/璇/璇/97Olivia/菊香/小姐姐/牛奶/小夏目/周依寧/萬/阿/咸一/蓑/煙雨任/平生/來/都/來/了/就/像/周一/Mc/蛋蛋/秉劍侯/李大夢/LeeDiss/銳雯雨/音眞白/半仙/幺/幺/Natsuki/是/只/蠢/兔紙/夏/冰瑩/guuweihai/阿舞/肖柚妮/墨脫/要/開芷/珞/舒西婷/Childe0Q/被/壓扁/的/海螺/snow/ /arc/灰灰/灰灰/灰/plus/小兔子/菲/呀/士多啤梨/羊/咩/咩/李小/可可/誰/來/拽/我/的/尾巴/飛鴿/之舞/小美/櫻雪/綾/samazshiyao/王漠/里/Slivan/喵/小蝦/SUSAN/蘇/上官/蘭顏/這個/殺手/不/太冷/看朱成碧/紛思君/情緒/我系/小忌廉/一只/兔/June/我/就/想/改名/而已/溫柔/的/大貓/Leo/貓/芙琳/以太/博麗/魔理沙/洛麗塔/羽小團/婁良/Rosi/葉/以北/吃不胖/的/小貓/Linaingriditttttx/胡楊/孫阿童/林美珍/赫蘿/Taiga/宮曼曼/YoonyiccZW711/笙簫/KIKI/./Liu/另一只/襪子/荒野/大/嫖客/少女/詩/芸豆/豆豆/豆璐璐嚕/棹/歌夢里/有/只/獨角獸/Oo/澄子/oO/雷梅/苔絲/CherryZhao/李萬/一琴脂/鹿斑/比/Chris/姬/-/雲煙/hyoram/蔗蔗蔗/柚子/RubySheena/孟德爾/kaka/小/師妹/楨視/明大/豆苗/少女/開膛手/陳詩/茗'''

backgroud_Image = plt.imread('girl.jpg')
wc = WordCloud( background_color = 'white',    # 設置背景顏色
                mask = backgroud_Image,        # 設置背景圖片
                max_words = 2000,            # 設置最大現實的字數
                stopwords = STOPWORDS,        # 設置停用詞
                font_path = 'C:/Users/Windows/fonts/msyh.ttf',# 設置字體格式,如不設置顯示不了中文
                max_font_size = 300,            # 設置字體最大值
                random_state = 50,            # 設置有多少種隨機生成狀態,即有多少種配色方案
                )
wc.generate(text)
image_colors = ImageColorGenerator(backgroud_Image)
#wc.recolor(color_func = image_colors)
plt.imshow(wc)
plt.axis('off')
plt.show()

 

 

0    陳詩茗    https://www.zhihu.com/people/chen-shi-ming-69
1    李大夢Lee    https://www.zhihu.com/people/li-da-meng-58-44
2    snow arc    https://www.zhihu.com/people/xiaoxueli
3    夏冰瑩    https://www.zhihu.com/people/xia-bingying
4    Sheena    https://www.zhihu.com/people/zhang-chu-yun-84
5    喵小蝦    https://www.zhihu.com/people/maoxiaoxia233
6    李大夢Lee    https://www.zhihu.com/people/li-da-meng-58-44
7    李大夢Lee    https://www.zhihu.com/people/li-da-meng-58-44
8    以太    https://www.zhihu.com/people/elapse08
9    zshiyao    https://www.zhihu.com/people/duo-rou-wan-zi-89
10    SUSAN蘇    https://www.zhihu.com/people/susansu-66

 

學習過程中遇到什么問題或者想獲取學習資源的話,歡迎加入學習交流群
626062078,我們一起學Python!


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com