发布时间:2025-05-02 18:53:37 来源:AI视频贴吧
腾讯科技最新发布了8月份的SuperCLUE-V基准榜单,这次测评涵盖了多模态理解领域的12个顶尖模型。
IT之家 8 月 5 日消息,据腾讯科技今日报道,中文多模态大模型 SuperCLUE-V 基准 8 月榜单发布,腾讯混元大模型位居国内大模型首位(71.95 分)。
腾讯科技方面宣称,该模型准确识别图像元素并生成自然语言描述,全方位理解并洞察细节。此次测评覆盖了 12 个国内外高代表性的多模态理解大模型,腾讯混元模型在多模态基础能力和应用能力中获得 71.95 的分数。
IT之家查询得知,8 月榜单中涵盖国内外最具代表性的 12 个多模态理解大模型。腾讯混元大模型在总榜上位居第二,仅次于 GPT-4o。GPT-4o 取得 74.36 分,领跑多模态基准,基础多模态认知能力和应用能力均有 70 + 分的表现,在技术和应用方面均有一定领先优势。
▲ 图源“ CLUE 中文语言理解测评基准”公众号,下同
SuperCLUE 评价称,在基础能力方面,国内大模型较海外模型仍有一定差距,尤其在细粒度视觉认知任务上,国内外最好模型有 5 分的差距,需要进一步对多模态深度认知能力做优化提升。
本次测评选取了 4 个海外模型和 8 个国内代表性多模态模型。其中为进一步评估开源和闭源的不同进展,本次参评模型包括 4 个开源模型、8 个闭源模型。
总体来看,本次评测展示了腾讯混元在多模态基准上的卓越表现,但也凸显了国内模型在特定视觉认知任务上与国外模型的差距。
热门推荐
中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首
腾讯科技报道,中文多模态大模型SuperCLUE-V基准8月榜单揭晓,腾讯混元模型以71 95分稳居首位。测评覆盖12个国内外多模态理解大模型,揭示了国内模型在细粒度视觉认知任务上与海外模型的差距。
2025-05-02
智源大模型:人工智能新质生产力引擎
智源是全球领先的大模型研究机构,致力于推动人工智能技术的创新和应用。文章探讨了智源在大模型领域的开发历程、技术创新及其对新质生产力的贡献。
2025-05-02
大模型发展与市场前景分析
探讨2024年大模型发展趋势及其市场前景,分析王仲远院长对大模型与人工智能的独特见解,以及智源在推动人工智能创新中的角色。
2025-05-02
Notta:日本市场会议语音转录创业的成功策略和成长路径
探索Notta在日本市场的成功之路,从创业策略到市场本地化,以及其在会议语音转录领域的创新和成就。
2025-05-02
00后哈佛辍学生创业AI吊坠:不要生产力,我们只要AI朋友
Avi Schiffmann是一位00后创业者,曾是哈佛辍学生,他开发了一款名为Friend的AI穿戴设备,专注于提供情感陪伴而非提高生产力。Friend能像真实伴侣一样陪伴用户,无论是旅行、打游戏还是追剧。
2025-05-02