训练赛 - 𓀚 转了码的刘公子

- [CIBMTR - Equity in post-HCT Survival Predictions](#CIBMTR%20-%20Equity%20in%20post-HCT%20Survival%20Predictions) - [leaderboard](#leaderboard) - [Al Mathematical Olympiad](#Al%20Mathematical%20Olympiad) ![image.png|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fpicgo%2Fpicgo-clipboard-images%2F2025%2F02%2F03%2F00-26-31-d0edb57070afa6c36d885e41068db74f-202502030026766-97f7f0.png) ## CIBMTR - Equity in post-HCT Survival Predictions 这是一个经典的 rank 比赛，很多电商算法都在用大佬 code https://www.kaggle.com/code/cdeotte/gpu-lightgbm-baseline-cv-681-lb-685 ### leaderboard 在 Kaggle（以及许多其他竞赛平台）的比赛中，通常会把测试数据集分成两部分：**Public（公共）** 和 **Private（私有）**。这样做的主要原因是为了防止参赛选手过度针对公开测试数据进行"调参"或"过拟合"，并能更真实地评估模型的泛化能力。 - **Public Leaderboard（公共排行榜）** - 使用一部分测试数据（大约 25% 或 30%）来即时显示你的成绩，方便你在比赛期间迭代改进模型。 - 你提交以后，系统会把你的预测结果和这部分测试数据的真实标签进行比较，得到一个分数并显示在公共排行榜上。 - **Private Leaderboard（私有排行榜）** - 使用其余的测试数据（约 75%）来进行最终评估。 - 在比赛结束后，官方会基于这部分私有数据重新计算所有参赛选手的最终分数，并公布最终排名。 - 这样可以避免有人针对公共测试集反复调参导致的过拟合，让最终排名更客观公正。因此，Leaderboard 中会同时显示 Public 和 Private 两个标签： - **Public** 标签：表示当前在公共测试数据上的排行榜 - **Private** 标签：表示在比赛结束后，才会解锁并最终决定你的真实名次的排行榜 ![CleanShot 2025-02-16 at [email protected]|1000](https://imagehosting4picgo.oss-cn-beijing.aliyuncs.com/imagehosting/fix-dir%2Fmedia%2Fmedia_iCWF0DXl1k%2F2025%2F02%2F16%2F19-06-02-c8790f2e16ace58b88658469ebfcfc01-CleanShot%202025-02-16%20at%2019.05.57-2x-c410e9.png) LB：XA BIU&AE 結糕通常只public Leaderboard]CV：LB要可靠。Cross Validation 得到的分数一般称为CV或是Local CV。一般来说CV 的结果比关于成绩：反馈的分数是基于测试集的一部分计算的，剩下的另一部分会被用于计算最终的结果。所以最后排名会变动 ## [[Al Mathematical Olympiad]]