该项目是对 LyricDanmu 1.5.3的简单魔改。通过向LyricDanmu添加一个HTTP API,从而允许外部的语音识别来代替键盘输入。 视频效果:Bilibili
项目的目的仅仅是提供一个proof of concept实现,从而展示和探讨通过语音进行同传的可能。项目添加的API并没有经过设计,项目本身的定位也只是一个demo,并没有进一步开发的打算。
常见的云厂商的语音识别API均支持连续的音频识别,并会以句子为单位生成事件。如果不考虑人工订正识别内容,理论上只需要一个商业的语音API,同传译员就可以只说话不动手,传译内容也能以句子为单位自动发送。同理,也可以设想从观众端进行自动的语音识别和机翻,当然因为有背景音乐等的干扰,识别效果必然会比主播端直接识别差很多。