首页 热点资讯 义务教育 高等教育 出国留学 考研考公
您的当前位置:首页正文

爬取直播弹幕并分析,做成词云,超级简单的代码

2024-12-20 来源:化拓教育网

前言

相信大部分在看直播的时候,都是开着弹幕的,特别是高潮的时候,都想知道弹幕会有怎样的评论,让自己乐呵乐呵,哈哈,但是有时候弹幕会刷屏,而你根本不知道,他们说了些什么。

没关系,Python帮你这些弹幕内容并做成词云,让你更能捉住重,下面来看代码

首先导入库

import jieba
from wordcloud import WordCloud, ImageColorGenerator
import matplotlib.pyplot as plt
import os
import PIL.Image as Image
import numpy as np

主体代码

with open('大司马上课后.txt', 'r', encoding='utf-8') as f:
    text = f.read()
    f.close()
cut_text = " ".join(jieba.cut(text))

d = os.path.dirname(__file__)
color_mask = np.array(Image.open(os.path.join(d, 'img.jpg')))
my_wordcloud = WordCloud(
    background_color='#F0F8FF',  # 背景颜色
    font_path="FZLTKHK--GBK1-0.ttf",  # 使用特殊字体可以显示中文
    max_words=8000,
    font_step=20,  # 步调太大,显示的词语就少了
    mask=color_mask,
    random_state=15,  # 设置有多少种随机生成状态,即有多少种配色方案
    min_font_size=15,
    max_font_size=202,
)
my_wordcloud.generate(cut_text)
image_colors = ImageColorGenerator(color_mask)
plt.show(my_wordcloud.recolor(color_func=image_colors))
plt.imshow(my_wordcloud)  # 以图片的形式显示词云
plt.axis('off')  # 关闭坐标轴
plt.show()  # 展示图片

my_wordcloud.to_file(os.path.join(d, 'pic.jpg'))

看懂的吗?答案是大家肯定可以看得懂的,这些有时候看出单词的意思,就可以知道它某一段是干嘛的,希望对大家有帮助。

显示全文