MMLU - 🎯转了码的刘公子

# Summary Massive Multitask Language Understanding"，是一个用于评估大语言模型多学科能力的基准数据集 ##. MMLU数据集特点 - 多选一：每个问题有A、B、C、D四个选项 - 标准化格式：需要从模型输出中提取选项字母 - 评估准确性：比较模型选择和标准答案 # Cues # Notes