2021 GAIIC phase3 idea 源码
2021-GAIIC-phase3-idea 非常荣幸能够拿到周星星,目前的分数是使用了stacking的效果,看到群里大佬们无私分享学到了很多,自己也想做一个稍微详细的一些分享,将总体思路抛砖引玉给大家,一起学习!!有啥问题随时提问题... 个人拙见 数据白皮书 q1-q2 = 1, q2-q3 = 1 ---> q1-q3 = 1 q1-q2 = 1, q2-q3 = 0 ---> q1-q3 = 0 构造强连通分量后大概增广了9000条数据,提升大概是2k左右 随机负采样效果不佳(猜测是目前给的pair已经是区分难度较大的,导致随机负采样的样本过于简单,反而让较难样本的分类出现bias) 使用数据对偶(q1q2 + q2q1),取决于模型的效果,我的经验是Bert + 对偶没啥变化,Match / GBDT + 对偶是有显著提升的
下载地址
用户评论