MaxAIBox
  • AI工具列表
    • AI写作工具
    • AI图像工具
    • AI办公工具
    • AI设计工具
    • AI视频工具
    • AI音频工具
    • AI对话聊天
    • AI搜索引擎
    • AI语言翻译
    • AI编程工具
    • AI开发平台
    • 其他AI工具
  • AI工具教程
  • 资料下载
  • 商务合作
    • AI写作工具
    • AI图像工具
      • 常用AI图像工具
      • AI图片插画生成
      • AI图片背景移除
      • AI图片物体抹除
      • AI商品图片生成
      • AI图片无损放大
      • AI图片优化修复
    • AI办公工具
      • 常用AI办公工具
      • AI幻灯片和演示
      • AI文档工具
      • AI思维导图
      • AI会议工具
      • AI表格数据处理
      • AI效率提升
    • AI设计工具
    • AI视频工具
    • AI音频工具
    • AI对话聊天
    • AI搜索引擎
    • AI语言翻译
    • AI编程工具
    • AI开发平台
    • 其他AI工具
      • AI学习网站
      • AI内容检测
      • AI训练模型
      • AI模型评测
      • AI提示指令
      • AI法律助手

    AI模型评测

    共 14 篇AI工具
    MMBench

    MMBench

    专注于多模态基准测试的平台,提供了一个全面的评估框架
    0
    AI模型评测
    AGI-Eval

    AGI-Eval

    专注于通用人工智能(AGI)能力评估的平台
    0
    AI模型评测
    SuperCLUE

    SuperCLUE

    专注于中文语言理解的基准测试平台
    0
    AI模型评测
    C-Eval

    C-Eval

    专注于评估中文语言模型性能的基准测试平台
    0
    AI模型评测
    FlagEval

    FlagEval

    北京人工智能研究院(BAAI)开发的开源评估平台
    0
    AI模型评测
    LLMEval3

    LLMEval3

    专注于评估大型语言模型(LLM)性能的开放平台
    0
    AI模型评测
    Chatbot Arena

    Chatbot Arena

    通过用户投票和对比测试,评估不同聊天机器人模型的开放平台
    0
    AI模型评测
    CMMLU

    CMMLU

    专注于中文语境的多任务评估框架
    0
    AI模型评测
    OpenCompass

    OpenCompass

    上海人工智能实验室推出的专注于对大型语言模型(LLM)的开源评测体系
    0
    AI模型评测
    H2O EvalGPT

    H2O EvalGPT

    H2O.ai 开发的 GPT 模型评估工具
    0
    AI模型评测
    PubMedQA

    PubMedQA

    评估 AI 模型在生物医学领域的阅读理解能力
    0
    AI模型评测
    HELM

    HELM

    斯坦福大学开源的语言模型评测框架
    0
    AI模型评测
    Open LLM Leaderboard

    Open LLM Leaderboard

    Hugging Face 推出的大语言模型的评估平台
    0
    AI模型评测
    MMLU

    MMLU

    多任务语言理解基准测试,涵盖了 57 个不同的任务领域
    0
    AI模型评测
    没有了

    最新资讯

    MaxAIBox
    MaxAIBox 汇集优秀AI工具,探索AI无限可能。

    首页 AI工具列表 业界资讯 AI资料下载 商务合作

    微信公众号MaxAIBox
    微信公众号
    抖音MaxAIBox
    抖音
    哔哩哔哩MaxAIBox
    哔哩哔哩
    Copyright © 2025 MaxAIBox  | 浙ICP备18005910号-3  
    AI工具
    AI工具动态简明教程