工具导航官方信息聚合网站
🔥热搜词:Ai工具 ChatGPT Midjourney
最新公告
网站信息
简介描述

MMBench是一个多模态基准测试,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学和浙江大学的研究人员推出。该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。

MMBench的特点和优势
基于感知与推理,将评估维度逐级细分。约 3000 道单项选择题,覆盖目标检测、文字识别、动作识别、图像
理解、关系推理等 20 个细粒度评估维度
更具鲁棒性的评估方式。相同单选问题循环选项提问,模型输出全部指向同一答案认定为通过,相比传统1次性通过评估 top-1 准确率平均下降 10% ~ 20%。最大程度减少各种噪声因素对评测结果的影响,保证了结果的可复现性。
更可靠的模型输出提取方法。基于 ChatGPT 匹配模型输出与选项,即使模型未按照指令输出也可准确匹配至最合理选项

网站数据

网站标签

Ai模型

网站评估

MMBench被关注loading次,如你需要查询该站的相关权重信息,可以点击下方数据查询进入;如果想查询该网站目前数据,建议以爱站数据为准,更多网站价值评估因素如:MMBench的访问速度、搜索引擎收录以及索引量、用户体验等;要评估一个站的价值,最主要还是需要根据您自身的需求,一些确切的数据则需要找MMBench的站长进行洽谈提供。如网站IP、PV、跳出率等!

网站查询

收录百度收录 - 搜狗收录 - 360 - 必应收录 - 谷歌收录

搜索百度搜索 - 搜狗搜索 - 360搜索 - 必应搜索 - 谷歌搜索

常用查询Whois查询 站长权重 爱站权重 Alexa排名 友链检测 网站安全检测 网站备案查询

特别提示

本网页页面内容是由在2023年12月21日[最后更新于2023年12月21日]收集并发布于Ai模型分类下并只作展示之用,酷米站长网不保证该外部链接的准确性和完整性,同时该外部链接的指向不由酷米站长网控制;如果有与MMBench相关业务事宜,请访问其网站获取联系方式;酷米站长网MMBench无任何关系,对于MMBench网站中信息,请用户谨慎辨识真伪。

相关推荐
工具集
工具集🐔
暂无描述
腾讯混元
腾讯混元大模型是由腾讯研发的大语言模型,具备跨领域知识和自然语言理解能力,实现基于人机自然语言对话的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力
天工AI助手
昆仑万维与奇点智源联合研发的对标ChatGPT的大语言模型
Open LLM Leaderboard
Hugging Face推出的开源大模型排行榜单
LLaMA
Meta(Facebook)推出的AI大语言模型
BLOOM
HuggingFace推出的大型语言模型(LLM)
Stable Diffusion
StabilityAI推出的文本到图像生成AI
Chatbot Arena
以众包方式进行匿名随机对战的LLM基准平台
魔搭社区
阿里达摩院推出的AI模型社区,超过300+开源AI模型
DALL·E2
OpenAI旗下DALL·E 2图像生成模型
Cohere
构建AI产品的大语言模型平台
AgentGPT
在浏览器中组装、配置和部署自主人工智能的开源项目
商量语言大模型
商汤科技推出的类ChatGPT的人工智能大语言模型
Replicate
在线运行开源机器学习模型
Scale AI
AI机器学习标注训练平台
PaLM 2
Google的下一代大语言模型,超过3400亿参数
Codex
OpenAI旗下AI代码生成训练模型
C-Eval
一个全面的中文基础模型评估套件
MMLU
大规模多任务语言理解基准
Watsonx.ai
IBM推出的企业级生成式人工智能和机器学习平台
DeepSpeed
微软开源的低成本实现类似ChatGPT的模型训练
Lamini
低门槛快速定制大语言模型的引擎
文心大模型
百度推出的产业级知识增强大模型
LLMEval3
复旦大学NLP实验室推出的大模型评测基准
无法访问
热门评论

问:给大家推荐一个非常好的工具查找网站!!!

答:点击下面的链接就可以访问了 ☞点我试试

问:MMBench官网域名是哪个?

答:MMBench官方域名是mmbench.opencompass.org.cn,如果访问不了,建议使用加速器访问

问:MMBench最新官网地址是哪个?

答:MMBench最新可以访问的地址是https://mmbench.opencompass.org.cn/leaderboard,我这边都可以访问的,如果你访问不了那就是和谐了

问:谁能发一个MMBench的永久地址或者发布页啊?

答:MMBench的永久地址可以访问这个https://mmbench.opencompass.org.cn/leaderboard,MMBench发布页我推荐大家用这个MMBench发布页最新更新页面!!!

留言评论
暂无人评论

添加新评论

注册 登录

最新文章
最新评论
  • 酷米网主编: 这确实是一个比较不错的网站,所以分享给到大家,希望他们站长能继续...
  • 江湖读客: 书格算是一个比较好的古典文档文章,希望站长继续更新更多的内容
  • 酷米网主编: 这个目前没有推荐,网上挺多的,你自己找一下
  • 剪辑: 站长有加速器推荐吗?
  • 剪辑: 好的,谢谢站长的回复
  • 酷米网主编: 是的,做这个站的是大佬,虽然界面看上去简陋,但是功能挺不错的
  • 酷米网主编: 已在邮件回复报价及联系等相关信息
  • 酷米网主编: 我这边可以访问,可以尝试更换浏览器或者设备试试,如果依然访问不了...
  • 百度: 不错的网站👍
  • 商务合作: 给贵站发了邮件了,看到可以回复一下,想在贵站推广一款我们自己的开...
随机文章
友情链接:工具集 Ai工具 sitemap