INTERSPEECH2021

Knowledge Distillation from BERT Transformer to Speech Transformer for Intent Classification

Code framework for FluentAI database.

An overview of the proposed STD model: (a) overall architecture and different loss computation, (b) knowledge distillation losses (i.e., computation of $Loss_{att}$ and $Loss_{hid}$) between two transformer layers of student and teacher model expanded from dotted box in (a).

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
experiments		experiments
transformer		transformer
Main.py		Main.py
README.md		README.md
attention.py		attention.py
catdog.png		catdog.png
data.py		data.py
encoder.py		encoder.py
model_framework.pdf		model_framework.pdf
model_framework.png		model_framework.png
model_transformer.py		model_transformer.py
models.py		models.py
module.py		module.py
optimizer.py		optimizer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

INTERSPEECH2021

Knowledge Distillation from BERT Transformer to Speech Transformer for Intent Classification

About

Releases

Packages

Languages

Jiang-Yidi/TransformerDistillation-SLU

Folders and files

Latest commit

History

Repository files navigation

INTERSPEECH2021

Knowledge Distillation from BERT Transformer to Speech Transformer for Intent Classification

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages