- Типы текстов: протоколы заседаний ООН (https://www.euromatrixplus.net/multi-un/) на русском языке Объем обучаещего корпуса: 8717 документов
(в процессе разработки билингвальная модель русский-французский)
- Модели: Scikit-Learn LDA, Gensim LDA, t-Bert, Scikit-Learn LSA, NMF