BERT+ TF Keras For NLP Tasks

说明：本项目处于开发阶段，暂时不可用

简介：以Tensorflow的Keras的Bert预训练模型开发NLP的各种任务。

项目特点

下载稳定，较为典型的测试数据，附带详细介绍
数据接口封装，减少数据的处理工作
模型采用tf.keras完成，方便快捷不失灵活
方便的保存模型和部署

环境

Tensorflow:1.13.1
Tensorflow-hub

TODO List

句子向量化

性能测试
Batch输入

文本分类

二分类任务

已完成。数据量不大的情况下可以不使用微调，否则参数量增大可能会过拟合。

多分类任务 BERT的多分类任务和二分类类似，只需要修改标签，然后sigmod换softmax,损失函数也换成多分类交叉熵即可。目前没有稳定的外链数据，所以没写example。
多标签任务

序列标注

NER

开发中

阅读理解

斯坦福SQUAD类似的中文检索式阅读理解

未完成

模型保存和部署

h5转saved_model。
最好的方式是可以使用tf.keras.experimental.export_saved_model导出模型，然后直接使用TF serving部署。

TF Data输入

多输入的TF Data写法
GPU利用率的比较

其他计划

Windows测试

其他说明

为什么用tf.keras而不是keras tf.keras成为TF2.0的主要模式，由TF团队开发，支持更多TF的特性包括tf.data以及tf serving，TF2.0出了之后项目会迁移到TF2.0，而keras已经较长时间没有重大更新了，所以tf.keras是更好的选择。

参考项目

keras-bert

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
bert_text.egg-info		bert_text.egg-info
data		data
dist		dist
docs		docs
src		src
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BERT+ TF Keras For NLP Tasks

环境

TODO List

句子向量化

文本分类

序列标注

阅读理解

模型保存和部署

TF Data输入

其他计划

其他说明

参考项目

About

Releases

Packages

Languages

SunYanCN/bert-text

Folders and files

Latest commit

History

Repository files navigation

BERT+ TF Keras For NLP Tasks

环境

TODO List

句子向量化

文本分类

序列标注

阅读理解

模型保存和部署

TF Data输入

其他计划

其他说明

参考项目

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages