Веб-страничка, в которую пользователь загружает научные статьи и/или тексты новостей, которые ему понравились. Затем система выдаёт ему другие тексты, похожие по тематике и/или по наличию отдельных фактов (можно сделать через эмбеддинги предложений).
Датасет статей с сайта хабр:
https://www.kaggle.com/leadness/habr-posts
Используя предобученную модель из sentence-transformers вытаскивать векторы-представления из статей и хранить их в базе данных вместе со статьями. По запросу пользователя добавлять новые статьи в базу или по выбранной (загруженной) статье выдавать похожие.
python app.py - запуск сервера.
По первому обращению будет выполняться подключение и препроцессинг базы данных, поэтому первичная загрузка страницы может быть долгой.