Loading...
AI导航
电商导航
设计导航
货源导航
跨境导航
问答中心
首页
AI导航
电商导航
设计导航
货源导航
跨境导航
问答中心
文章中心
站务
网站公告
文章投稿
网址提交
发布问答
未登录
登录后即可体验更多功能
登录
注册
找回密码
未登录
登录后即可体验更多功能
登录
注册
找回密码
AI模型评测
共 14 篇网址
电商导航
跨境导航
AI导航
设计导航
货源导航
AI视频模型
AI内容检测
AI写作工具
AI办公工具
AI图像工具
AI学习网站
AI对话聊天
AI开发平台
AI提示指令
AI搜索引擎
AI模型评测
AI法律助手
AI编程工具
AI视频工具
AI训练模型
AI设计工具
AI语言翻译
AI音频工具
排序
发布
更新
浏览
点赞
FlagEval
智源研究院推出的FlagEval(天秤)大模型评测平台
0
5
0
AI模型评测
PubMedQA
生物医学研究问答数据集和模型得分排行榜
0
4
0
AI模型评测
H2O EvalGPT
H2O.ai推出的基于Elo评级方法的大模型评估系统
0
4
0
AI模型评测
LLMEval3
由复旦大学NLP实验室推出的大模型评测基准
0
4
0
AI模型评测
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台
0
4
0
AI模型评测
HELM
斯坦福大学推出的大模型评测体系
0
4
0
AI模型评测
MMBench
全方位的多模态大模型能力评测体系
0
4
0
AI模型评测
CMMLU
一个综合性的大模型中文评估基准
0
4
0
AI模型评测
OpenCompass
上海人工智能实验室推出的大模型开放评测体系
0
4
0
AI模型评测
AGI-Eval
AI大模型评测社区
0
4
0
AI模型评测
SuperCLUE
中文通用大模型综合性测评基准
0
4
0
AI模型评测
C-Eval
一个全面的中文基础模型评估套件
0
4
0
AI模型评测
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
0
4
0
AI模型评测
MMLU
大规模多任务语言理解基准
0
4
0
AI模型评测
没有了
反馈
让我们一起共建文明社区!您的反馈至关重要!
已失效
重定向&变更
已屏蔽
敏感内容
其他
提交反馈
网址
网址
文章
软件