- 有没有做数据预处理。 有没有学过大模型lora微调。
- 学过哪些推荐算法的模型。
- 决策树用到的损失函数
- 二元分类有哪些指标? 查准率,召回率。AUC是什么
- python 的 append跟extend的区别 总结: 机器学习基础比较薄弱,同时需要去实习。
- 有没有用过大模型微调,lora
- 多目标推荐用哪些模型,怎么做分数融合
- transformer的QKV怎么计算,有没有用激活函数
- 推荐系统中,什么是连续数据,什么是离散数据,怎么处理。连续数据除了设阈值,还能怎么处理。
- 召回中,除了设计规则,能不能用语义上的网络。
- 序列特征是怎么输入到排序模型的。
- 正负样本是怎么被一起输入到模型的。
- 如何保证输出的id不超出范围。
- 对落地页特征做处理,提取有效信息。用分类模型(bert)或者大模型。
- 设计语义id, 先用bert模型,找相似广告,再用层次聚类,最后做一个映射表,映射到训练集的广告id。
- dpr比赛,不要用大模型续写,而是用大模型提取有效特征。