# Summary Massive Multitask Language Understanding",是一个用于评估大语言模型多学科能力的基准数据集 ##. MMLU数据集特点 - 多选一:每个问题有A、B、C、D四个选项 - 标准化格式:需要从模型输出中提取选项字母 - 评估准确性:比较模型选择和标准答案 # Cues # Notes