Speaking AI Chatbot

中文普通话语音聊天机器人

项目描述

本项目旨在实现一个可以实时生成语音进行对话的闲聊机器人。生成的语音为普通话女声，生成音色自然并有韵律停顿。对话机器人则可以一定程度上根据历史对话内容实现下一句。
本项目对话机器人部分代码来自GPT2-chitchat项目。使用GPT2模型对中文闲聊语料进行训练，使用 HuggingFace的transformers实现GPT2模型的编写与训练。详细实现请参考该项目。本项目暂时只对其中的生成代码稍作改动来进行语音生成部分的融合。
语音合成（TTS）部分则使用了中文tacotron2的代码,并仿造syang1993/gst-tactron对tacotron自带的注意力进行了优化，实现了gmm attention大幅减少了训练收敛时间，并提升了对较长文本的合成效果。另对语音合成代码进行了部分修改来读取聊天模型生成的文字并实时合成为语音。
使用标贝开源中文普通话女声语音数据集进行训练，训练了十几万歩，vocoder部分则使用的是griffin-lim。接下来准备训练Wavernn来作为vocoder。 -生成的wav格式语音会被存到本地并自动播放

运行环境

python3.6、 transformers==1.12、pytorch==1.3.1，其他环境要求请见requirements.txt

项目结构

models:存放tacotron主要模型框架代码
modules:存放编码器，解码器及注意力机制等模块的代码
synthesizer: 存放合成器，拼音文字转换代码
text：存放拼音编码转换代码
dialogue_model:存放对话生成的模型
mmi_model:存放MMI模型(maximum mutual information scoring function)，用于预测P(Source|response)
sample:存放人机闲聊生成的历史聊天记录
vocabulary:存放GPT2模型的字典
egs: -example: -preprocess.sh: 用于处理语音数据 -synthesis.sh：用于单独合成语音（须单独分割一部分label不建议使用） -train.sh: 用于训练tacotron声学模型
train_gpt.py:训练对话机器人代码
interact.py:人机交互代码（无语音合成功能)
chatbot_entry.py: 直接使用这个代码来运行对话机器人语音生成一体化程序

模型参数

下载models.7z文件，并将解压后的三个文件夹全部放入项目根目录里面

log_dir: 用于存放tacotron模型训练好的权重
dialogue_model: 对话模型训练好的权重
mmi_model：对话模型训练好的权重

使用说明

clone该项目到本地后将训练好的模型权重（models.7z）下载到本地并放入对应目录下，运行python -W ignore chatbot_entry.py即可使用对话机器人语音生成一体化程序。只要输入中文文字即可听到语音合成的回答。

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
__pycache__		__pycache__
config		config
data		data
egs/example		egs/example
image		image
model_outputs/waifu		model_outputs/waifu
models		models
modules		modules
pinyin		pinyin
sample		sample
synthesizer		synthesizer
tacotron2_demo		tacotron2_demo
testdata/biaobei		testdata/biaobei
text		text
utils		utils
vocabulary		vocabulary
.gitattributes		.gitattributes
Pipfile		Pipfile
README.md		README.md
__init__.py		__init__.py
chatbot_entry.py		chatbot_entry.py
converter.py		converter.py
dataset.py		dataset.py
generate_dialogue_subset.py		generate_dialogue_subset.py
hparams.yaml		hparams.yaml
infer.py		infer.py
infer2.py		infer2.py
interact.py		interact.py
interact_mmi.py		interact_mmi.py
models.7z		models.7z
parse_text_add_pause.py		parse_text_add_pause.py
parse_text_to_pyin.py		parse_text_to_pyin.py
preprocess.py		preprocess.py
requirements.txt		requirements.txt
train.py		train.py
train_gpt.py		train_gpt.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Speaking AI Chatbot

中文普通话语音聊天机器人

项目描述

运行环境

项目结构

模型参数

使用说明

TODO

Future Work

Reference

About

Releases

Packages

Languages

Thedatababbler/TTS_Chatbot_Chinese

Folders and files

Latest commit

History

Repository files navigation

Speaking AI Chatbot

中文普通话语音聊天机器人

项目描述

运行环境

项目结构

模型参数

使用说明

TODO

Future Work

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages