Skip to content

v0.10.0 release

Compare
Choose a tag to compare
@Yunnglin Yunnglin released this 20 Jan 11:05
· 7 commits to release/0.10 since this release

What's Changed

Feat: Add EvalScope dashboard by @Yunnglin in #277

Others

功能更新

主要更新

其他

  • 在参数中添加 model-id,由 @Yunnglin#274 中实现
  • 添加 ifeval 评测基准;并统一报告格式,由 @Yunnglin#275 中实现
  • 添加 iquiz评测基准;支持多指标的评测集在展示结果时默认使用第一个指标的结果,由 @Yunnglin#288 中实现
  • 支持指定system prompt,由 @Yunnglin#283 中实现
  • 修复多指标数据集的错误,由 @Yunnglin#282 中实现
  • 修复 mmlu 读取本地数据的问题,由 @Yunnglin#273 中实现

Full Changelog: v0.9.0...v0.10.0