快照更新时间: 2026-03-01
Yunseung Lee, Subin Kim +2
2026-02-28
现有大语言模型在核心银行计算中准确率低,且现有基准未充分捕捉此类错误,本文提出 BankMathBench 数据集,训练后开源大语言模型在公式生成和数值推理准确性上有显著提升,证明该数据集有效。