OPENJUDGE
排行榜
文档
GitHub
在线试用
排行榜
文档
GitHub
在线试用
大模型场景评测
场景模型排行榜
基于 OpenJudge 评估框架的真实评测数据,展示国产及海外大模型在文献推荐、学术翻译、论文润色等场景下的客观评测排名。评测持续更新中。
加载评测数据中...