自然言語文から論理式を生成するタスクを、seq2seqモデルで実装しました。Attention有りのモデルと無しのモデルがあります。データセットには、geoquery datasetを使用しました。参考にした論文は、Language to Logical Form with Neural Attention (Li Dong et al., ACL2016)です。
2022/07/08時点での環境構築方法です。
conda create -n semparse
conda activate semparse
conda install pytorch
conda install -n semparse ipykernel --update-deps --force-reinstall
conda install -c pytorch torchtext
conda install -c conda-forge ipywidgets
conda install -c conda-forge matplotlib
conda install -c anaconda pandas
python, module | version |
---|---|
python | 3.10.4 |
numpy | 1.22.3 |
pandas | 1.4.2 |
pytorch | 1.10.2 |
torchtext | 0.6.0 |
いちから訓練する場合は、train_from_scratch.ipynbを参照してください。既に訓練済みのモデルを使う場合は、load_model.ipynbに従ってください。訓練済みのmodelはmodelsフォルダに入っています。