Skip to content

Latest commit

 

History

History
24 lines (14 loc) · 1.39 KB

README.md

File metadata and controls

24 lines (14 loc) · 1.39 KB

AIML Проект

Задача:

Веб-страничка, в которую пользователь загружает научные статьи и/или тексты новостей, которые ему понравились. Затем система выдаёт ему другие тексты, похожие по тематике и/или по наличию отдельных фактов (можно сделать через эмбеддинги предложений).

Датасет:

Датасет статей с сайта хабр:

https://www.kaggle.com/leadness/habr-posts

Общая идея:

Используя предобученную модель из sentence-transformers вытаскивать векторы-представления из статей и хранить их в базе данных вместе со статьями. По запросу пользователя добавлять новые статьи в базу или по выбранной (загруженной) статье выдавать похожие.

Запуск

python app.py - запуск сервера.

По первому обращению будет выполняться подключение и препроцессинг базы данных, поэтому первичная загрузка страницы может быть долгой.