Skip to content

Latest commit

 

History

History
18 lines (5 loc) · 1.02 KB

experiment.md

File metadata and controls

18 lines (5 loc) · 1.02 KB

实验说明

本篇将详细介绍如何构建简明的实验,实验案例可以参考example。Reclearn的实验主要分为两大模块:Top-K推荐CTR 预估,因此我们从这两部分内容进行展开。

Top-K推荐

Top-K推荐指的是对于单一用户,推荐模型给其推荐物料库中最有可能的K个物品,然后再通过一些离线排序指标例如HR@K、NDCG@K、MRR@K、MAP@K等评估该模型的能力,在工业上这类模型也称为召回模型,应用在召回阶段。对于召回模型,最显著的特点就是user侧的user embedding向量与item embedding向量几乎不会发生特征交叉,除了最后阶段的点积。

Reclearn项目包含了学术上的模型(SASRec、AttRec等)和工业上的模型(DSSM、YoutubeDNN),但最终的实验流程需要统一,所以本篇实验说明定义了一种常用的数据集切割、负采样、离线指标评估等。如果使用者有自己的实验方式,也可以自己形式化定义。