Skip to content

gushengbo/-

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 

Repository files navigation

-吉比特:

  1. 有没有做数据预处理。 有没有学过大模型lora微调。
  2. 学过哪些推荐算法的模型。
  3. 决策树用到的损失函数
  4. 二元分类有哪些指标? 查准率,召回率。AUC是什么
  5. python 的 append跟extend的区别 总结: 机器学习基础比较薄弱,同时需要去实习。

-字节跳动:

  1. 有没有用过大模型微调,lora
  2. 多目标推荐用哪些模型,怎么做分数融合
  3. transformer的QKV怎么计算,有没有用激活函数
  4. 推荐系统中,什么是连续数据,什么是离散数据,怎么处理。连续数据除了设阈值,还能怎么处理。
  5. 召回中,除了设计规则,能不能用语义上的网络。
  6. 序列特征是怎么输入到排序模型的。
  7. 正负样本是怎么被一起输入到模型的。
  8. 如何保证输出的id不超出范围。

-shein

  1. 对落地页特征做处理,提取有效信息。用分类模型(bert)或者大模型。
  2. 设计语义id, 先用bert模型,找相似广告,再用层次聚类,最后做一个映射表,映射到训练集的广告id。
  3. dpr比赛,不要用大模型续写,而是用大模型提取有效特征。

-快手nlp

  1. 除了bert跟word2vec,还有哪些做文本embedding的方法

  2. 怎么处理样本不平衡,采样,数据增强(有什么方法),损失函数 imageimageimage 对损失大的,用更大的权重,损失小的用小的权重。

  3. rnn, lstm。lstm怎么通过门控制解决梯度消失跟梯度爆炸。

  4. 模型融合有什么方法,树GBDT

  5. 用bert有什么缺点

  6. 为什么用AUC,模型鲁班性层面

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published