使用前請先閱讀該文件!!!!!
可使用圖片轉文字來偵測假新聞的伺服器實作。
- IDE: Visual Studio 2019 or VScode
- Python: Python 3.7.6 :: Anaconda, Inc on Win32
- 如果你是Linux環境: 執行該檔案完成環境建置 aptrequired.sh
# 在終端機中執行該行指令
bash aptrequired.sh
- Flask Server
- Tesseract
- Texts Compare
-
Flairs Model - SpaCy 相似度比對
- 假新聞比對
- 真新聞比對
- 比對加速
- 與資料庫中資料做對比
- 詞性情感比對
- (備案) 假新聞辨識模型 (無中文版)
-
- Crawl
- 爬取新聞資料
- 自動爬取新增資料
- 將爬取資料匯入資料庫
- Deploy
- UWSGI 部屬
- Nginx 反向代理
- AWS EC2 上線
- HTTPS 安全性
- 穩定度測試
- 需先下載 tesseract軟體 Windows載點
tesseract.py
根據你的tesseract應用程式下載位置更改 Line 7 值
# 先執行該行程式將所有依賴套件下載好
pip install -r requirement.txt
Requirement.txt NOTE:UWSGI可視情況不下載
spacy
download chinese(zh_core_web_sm)
# 語言包需額外下載
python -m spacy download zh_core_web_sm
將爬取的CSV檔放入data資料夾便可執行
# 執行該段後即可透過 localhost:port來瀏覽
python app.py
主要運用這些套件