爱途导航
  • 今日热榜
  • AI资讯
  • AI工具集
  • AI应用集
  • AI文章博客
  • 排行榜
  • 收录投稿
  • 关于本站
      • 未登录
        登录后即可体验更多功能
    • 今日热榜
    • AI资讯
    • AI工具集
    • AI应用集
    • AI文章博客
    • 排行榜
    • 收录投稿
    • 关于本站
    未登录
    登录后即可体验更多功能

    AI模型评测

    共 14 篇网址
    UED团队常用工具AI热门工具集灵感采集社区资讯素材资源网盘云储AI文本写作工具AI内容检测工具AI图像绘画工具AI学习网站平台AI对话聊天工具AI提示词工具AI搜索引擎工具AI编程开发工具AI视频音频工具AI训练模型工具AI设计生成工具AI语言翻译工具AI高效办公工具AI素材资源网站AI内容检测AI写作工具AI学习网站AI对话聊天AI开发平台AI提示指令AI搜索引擎AI模型评测AI编程工具AI视频工具AI训练模型AI设计工具AI语言翻译AI音频工具AI 大模型平台
    排序
    发布更新浏览点赞
    CMMLU

    CMMLU

    一个综合性的大模型中文评估基准
    0150
    AI模型评测AI训练模型工具
    MMBench

    MMBench

    全方位的多模态大模型能力评测体系
    0120
    AI模型评测AI训练模型工具
    HELM

    HELM

    斯坦福大学推出的大模型评测体系
    0330
    AI模型评测AI训练模型工具
    Chatbot Arena

    Chatbot Arena

    以众包方式进行匿名随机对战的LLM基准平台
    0110
    AI模型评测AI训练模型工具
    MMLU

    MMLU

    大规模多任务语言理解基准
    0320
    AI模型评测AI训练模型工具
    LLMEval3

    LLMEval3

    由复旦大学NLP实验室推出的大模型评测基准
    0460
    AI模型评测AI训练模型工具
    Open LLM Leaderboard

    Open LLM Leaderboard

    Hugging Face推出的开源大模型排行榜单
    0130
    AI模型评测AI训练模型工具
    H2O EvalGPT

    H2O EvalGPT

    H2O.ai推出的基于Elo评级方法的大模型评估系统
    0310
    AI模型评测AI训练模型工具
    C-Eval

    C-Eval

    一个全面的中文基础模型评估套件
    0100
    AI模型评测AI训练模型工具
    PubMedQA

    PubMedQA

    生物医学研究问答数据集和模型得分排行榜
    0250
    AI模型评测AI训练模型工具
    FlagEval

    FlagEval

    智源研究院推出的FlagEval(天秤)大模型评测平台
    0140
    AI模型评测AI训练模型工具
    SuperCLUE

    SuperCLUE

    中文通用大模型综合性测评基准
    0210
    AI模型评测AI训练模型工具
    AGI-Eval

    AGI-Eval

    AI大模型评测社区
    0110
    AI模型评测AI训练模型工具
    OpenCompass

    OpenCompass

    上海人工智能实验室推出的大模型开放评测体系
    0130
    AI模型评测AI训练模型工具
    没有了

    标签云

    爱途导航
    这是一个汇集前沿AI产品的一站式导航平台,整合了国内外超百款主流AI工具和网站,致力于为用户提供详尽的AI产品信息,帮助您迅速掌握并轻松运用各类AI工具,让智能科技触手可及。

    友链申请 免责声明 广告合作 关于我们

    扫码加QQ群爱途导航
    扫码加QQ群
    扫码加微信公众号爱途导航
    扫码加微信公众号
    Copyright © 2025 爱途导航 浙ICP备19032777号-11 由 OneNav 强力驱动 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍