- [CIBMTR - Equity in post-HCT Survival Predictions](#CIBMTR%20-%20Equity%20in%20post-HCT%20Survival%20Predictions) - [leaderboard](#leaderboard) - [Al Mathematical Olympiad](#Al%20Mathematical%20Olympiad) ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2025%2F02%2F03%2F00-26-31-d0edb57070afa6c36d885e41068db74f-202502030026766-97f7f0.png) ## CIBMTR - Equity in post-HCT Survival Predictions 这是一个经典的 rank 比赛,很多电商算法都在用 大佬 code https://www.kaggle.com/code/cdeotte/gpu-lightgbm-baseline-cv-681-lb-685 ### leaderboard 在 Kaggle(以及许多其他竞赛平台)的比赛中,通常会把测试数据集分成两部分:**Public(公共)** 和 **Private(私有)**。这样做的主要原因是为了防止参赛选手过度针对公开测试数据进行"调参"或"过拟合",并能更真实地评估模型的泛化能力。 - **Public Leaderboard(公共排行榜)** - 使用一部分测试数据(大约 25% 或 30%)来即时显示你的成绩,方便你在比赛期间迭代改进模型。 - 你提交以后,系统会把你的预测结果和这部分测试数据的真实标签进行比较,得到一个分数并显示在公共排行榜上。 - **Private Leaderboard(私有排行榜)** - 使用其余的测试数据(约 75%)来进行最终评估。 - 在比赛结束后,官方会基于这部分私有数据重新计算所有参赛选手的最终分数,并公布最终排名。 - 这样可以避免有人针对公共测试集反复调参导致的过拟合,让最终排名更客观公正。 因此,Leaderboard 中会同时显示 Public 和 Private 两个标签: - **Public** 标签:表示当前在公共测试数据上的排行榜 - **Private** 标签:表示在比赛结束后,才会解锁并最终决定你的真实名次的排行榜 ![CleanShot 2025-02-16 at [email protected]|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fmedia%2Fmedia_iCWF0DXl1k%2F2025%2F02%2F16%2F19-06-02-c8790f2e16ace58b88658469ebfcfc01-CleanShot%202025-02-16%20at%2019.05.57-2x-c410e9.png) LB:XA BIU&AE 結糕 通常只public Leaderboard]CV:LB要可靠。Cross Validation 得到的分数一般称为CV或是Local CV。一般来说CV 的结果比 关于成绩:反馈的分数是基于测试集的一部分计算的,剩下的另一部分会被用于计算最终的结果。所以最后排名会变动 ## [[Al Mathematical Olympiad]]