大模型场景评测

场景模型排行榜

基于 OpenJudge 评估框架的真实评测数据,展示国产及海外大模型在文献推荐、学术翻译、论文润色等场景下的客观评测排名。评测持续更新中。

加载评测数据中...