本项目基于python3,实现通过书籍的isbn码查询书籍信息的功能。
项目链接:https://github.com/vistar-terry/isbn_search
相关博客链接:Python爬虫实现isbn查询豆瓣书籍详细信息
如有疑问,欢迎提 issues ,或在博客评论区留言。
- book.py:脚本文件
- requirements.txt:依赖环境版本
- webdriver:浏览器驱动
在项目根目录执行以下命令,安装项目所需环境:
pip install -r requirements.txt
book.py
代码中的
需要根据使用的系统平台选择相应的浏览器驱动,其中 executable_path
是驱动路径。
其中,由于linux浏览器驱动大小超过了github单个文件50MB的限制,使用时需要先解压。
在 book.py
同级目录执行以下命令:
python book.py 9787121369421
输出如下:
需要注意以下两点:
也就是说需要在 book.py
同级目录执行 python book.py 9787121369421
命令,如需在其他路径执行,可以将驱动路径加到系统环境变量中。
# 创建浏览器对象
browser = webdriver.PhantomJS() # windows
# browser = webdriver.PhantomJS() # linux
项目使用 phantomjs
,目前只测试了 windows(win10/win11)
和 linux(Ubuntu20.04)
系统,其他系统的 phantomjs
可以去主页下载 https://phantomjs.org/download.html ,但不保证可以使用。
- 优化查询效率
- 使用Chrome或Firefox浏览器