本仓库分成两种不同的使用方式,一种是使用python中谷歌学术中批量获取Bibtex,另一种是使用浏览器插件直接在dblp中获取Bibtex。
根据关键词列表谷歌学术或者dblp中搜索,批量获取对应的第一个Bibtex。
注:谷歌学术或者dblp均搜索支持模糊搜索,所以可以直接把pdf或word的文献引用一整条复制直接作为关键词,这样搜索已经足够精确了,完全没必要开高级搜索。
注:dblp不需要Cookie,但是谷歌学术需要Cookie,所以如果你没有Cookie,可以只使用dblp。
- 在
words.txt
中添加关键词,以换行分隔。 - (可选)根据下图,访问https://scholar.google.com/scholar?hl=zh-CN&as_sdt=0%2C5&q=1&btnG=获取Cookie,将Cookie填入
global_settings.py
的headers['Cookie']=""
中。 - 运行
words_to_bibtex.py
。 - 查看
result_bibtex.txt
和result_cite.txt
中的结果。 - 如果你是使用代理的,可以在
words_to_bibtex.py
中启用set_proxy函数。
谷歌学术搜索有人机验证,如果跑着跑着突然报错了,只需要在浏览器再次访问https://scholar.google.com/scholar?hl=zh-CN&as_sdt=0%2C5&q=1&btnG=,手动过掉这个页面上的人机验证、复制一个新Cookie就OK。
- 如果你找到了更多网站的支持方式,可以在
global_settings.py
中添加更多的searchUrlBases
,并提交PR; - 如果你只期望在单个网站中检索,可以在
global_settings.py
中修改searchWay
; - 如果你发现自己无论如何都无法访问谷歌,可以在
global_settings.py
中修改proxy_related
为True
,并在set_proxy
函数中填入你的代理。
输入(查找关键词前会去掉words.txt
中所有已经在done.txt
中的关键词):
# done.txt
空
# words.txt:
[6] Cheng Kai, Li Qiang, Wang Lei, et al. DTaint: Detecting the Taint-Style Vulnerability in Embedded Device Firmware[C] //Proc of the 48th Annual IEEE/IFIP Int Conf on Dependable Systems and Networks (DSN). 2018: 430-441
输出(查找到结果后done.txt
会新增一行,不过words.txt
中的内容不会立即被删除):
# done.txt
[6] Cheng Kai, Li Qiang, Wang Lei, et al. DTaint: Detecting the Taint-Style Vulnerability in Embedded Device Firmware[C] //Proc of the 48th Annual IEEE/IFIP Int Conf on Dependable Systems and Networks (DSN). 2018: 430-441
# result_bibtex.txt:
@inproceedings{cheng2018dtaint,
title={DTaint: detecting the taint-style vulnerability in embedded device firmware},
author={Cheng, Kai and Li, Qiang and Wang, Lei and Chen, Qian and Zheng, Yaowen and Sun, Limin and Liang, Zhenkai},
booktitle={2018 48th Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN)},
pages={430--441},
year={2018},
organization={IEEE}
}
# result_cite.txt:
[6] \cite{cheng2018dtaint}
这个脚本安装之后页面左下角会出现一个按钮,可以通过选项去配置按钮是否出现。
用处:当选中文本之后,会自动在dblp中搜索并返回第一个搜索结果对应的Bibtex到剪切板上。
- 首先,你需要安装油猴插件,如果不知道怎么装请看我的视频:【浏览器脚本入门】①下载油猴_哔哩哔哩_bilibili
- 其次,你可以通过 Greasy Fork 安装我的脚本:选择文本并自动获取BibTex到剪切板
- 改写成浏览器插件,支持选中关键词直接右键获取Bibtex;
- words_from_pdf: 从文献pdf中提取参考文献列表,将其直接作为关键词;
- words_from_doc: 从文献doc中提取参考文献列表,将其直接作为关键词;
- cite_to_bibtex: 将文本中的索引号直接变成bibtex的latex引用,比如
[6]
变成\cite{cheng2018dtaint}
。