Skip to content

一个自动记录Meumy直播弹幕数据并展示的服务器/网页

Notifications You must be signed in to change notification settings

kmzs123/meumy-live-showcase

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 

Repository files navigation

Meumy直播弹幕数据展示页

本项目分为静态网页部分和数据处理服务器两部分,纯业余。

静态网页

使用了bootstrap5框架、vue.jsechart.js

数据处理服务器

live_listener.py

将直播弹幕数据记录到sqlite数据库中,可以同时监听多个直播间的数据。

2022-05-25:不再使用bilibili-api包记录直播弹幕数据

Msg_db.py

一个记录弹幕、礼物、直播时间信息的sqlite数据库的简易类。使用peewee作为ORM引擎。会把每天的数据分别存到不同的文件中。

danmu_analyse.py

每十分钟扫描今日的弹幕数据库,如果发现已开播就对弹幕进行分析,生成用于网页显示的json数据文件。

  • 使用scipy包对弹幕量进行平滑以及峰值识别
  • 使用jieba包进行中文分词和关键词提取
    • 用正则表达式过滤掉一些垃圾弹幕,比如ohhhhhhhh
    • 其中使用自定义词典user_dict.txt对分词进行了一点点优化
    • 分词部分还需要调整,有些词无法识别,需要经常维护自定义词典
    • 关键词识别不太适用于网络用语较多的环境,关键词全是“哈哈哈”,我也没啥办法
  • 用正则表达式识别打call弹幕,从而识别出up唱歌的时段
  • 用以往弹幕数据计算了一个新的idf词典idf/idf_live.txt,试图按直播弹幕词频来分析最新直播弹幕关键词,但似乎并不是很有效。有效的例子是呜米2021年9月10日关键词是“确实”,这个确实提取出来了

About

一个自动记录Meumy直播弹幕数据并展示的服务器/网页

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 48.8%
  • HTML 26.5%
  • JavaScript 24.7%