Skip to content

Latest commit

 

History

History
33 lines (28 loc) · 1.86 KB

README.md

File metadata and controls

33 lines (28 loc) · 1.86 KB

-吉比特:

  1. 有没有做数据预处理。 有没有学过大模型lora微调。
  2. 学过哪些推荐算法的模型。
  3. 决策树用到的损失函数
  4. 二元分类有哪些指标? 查准率,召回率。AUC是什么
  5. python 的 append跟extend的区别 总结: 机器学习基础比较薄弱,同时需要去实习。

-字节跳动:

  1. 有没有用过大模型微调,lora
  2. 多目标推荐用哪些模型,怎么做分数融合
  3. transformer的QKV怎么计算,有没有用激活函数
  4. 推荐系统中,什么是连续数据,什么是离散数据,怎么处理。连续数据除了设阈值,还能怎么处理。
  5. 召回中,除了设计规则,能不能用语义上的网络。
  6. 序列特征是怎么输入到排序模型的。
  7. 正负样本是怎么被一起输入到模型的。
  8. 如何保证输出的id不超出范围。

-shein

  1. 对落地页特征做处理,提取有效信息。用分类模型(bert)或者大模型。
  2. 设计语义id, 先用bert模型,找相似广告,再用层次聚类,最后做一个映射表,映射到训练集的广告id。
  3. dpr比赛,不要用大模型续写,而是用大模型提取有效特征。

-快手nlp

  1. 除了bert跟word2vec,还有哪些做文本embedding的方法

  2. 怎么处理样本不平衡,采样,数据增强(有什么方法),损失函数 imageimageimage 对损失大的,用更大的权重,损失小的用小的权重。

  3. rnn, lstm。lstm怎么通过门控制解决梯度消失跟梯度爆炸。

  4. 模型融合有什么方法,树GBDT

  5. 用bert有什么缺点

  6. 为什么用AUC,模型鲁班性层面