发布时间:2025-05-02 19:13:41 来源:AI视频贴吧
我国自研的视频大模型Vidu正式登上全球舞台,这是一个重大的里程碑。Vidu由北京生数科技联合清华大学研发,具备长时长、高一致性、高动态性等优秀特性。
记者8月3日获悉,亮相2024中关村论坛年会的人工智能视频大模型Vidu日前宣布在全球正式上线。Vidu开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分辨率最高达1080P。Vidu是北京生数科技有限公司(以下简称“生数科技”)联合清华大学发布的自研长时长、高一致性、高动态性视频大模型。据介绍,此次面向全球上线,Vidu在基础功能外新增动漫风格、角色一致性等功能。生数科技有关负责人表示,Vidu实现了业界最快实测推理速度,仅需30秒就能生成一段4秒片段。目前Vidu无需申请,用户直接使用邮箱注册即可上手体验。今年初,文生视频大模型Sora在全球引发广泛关注。目前业界对视频模型的评价主要围绕三大核心维度:语义理解准确性、画面美观性、主体动态一致性。Vidu较好平衡了这三方面的表现。它能准确理解并生成提示词中的文字,包括字母、数字等,并能生成文字特效。对第一人称、延时摄影等镜头语言,Vidu也能精准表达,用户只需细化提示词,即可大幅提升视频可控性。同时,Vidu支持大幅度、精准的动作生成,保持高流畅、高动态的画面效果。此外,Vidu在构图、叙事和光影等方面,能达到接近电影级效果。Vidu还能生成影视级特效画面,如烟雾、炫光效果、CG(计算机图形学)特效等。
Vidu的全球上线标志着我国在视频模型领域的技术进步和创新。未来,Vidu将进一步提升视频生成的精确度和创意性,为用户带来更加丰富和高质量的视听体验。
热门推荐
我国自研视频大模型全球上线,Vidu技术解析及功能介绍
北京生数科技发布的自研视频大模型Vidu全球正式上线。Vidu提供文生视频、图生视频功能,支持4秒和8秒时长,分辨率达1080P,新增动漫风格、角色一致性等功能。
2025-05-02
中文多模态大模型SuperCLUE-V基准8月榜单发布,腾讯混元居首
腾讯科技报道,中文多模态大模型SuperCLUE-V基准8月榜单揭晓,腾讯混元模型以71 95分稳居首位。测评覆盖12个国内外多模态理解大模型,揭示了国内模型在细粒度视觉认知任务上与海外模型的差距。
2025-05-02
智源大模型:人工智能新质生产力引擎
智源是全球领先的大模型研究机构,致力于推动人工智能技术的创新和应用。文章探讨了智源在大模型领域的开发历程、技术创新及其对新质生产力的贡献。
2025-05-02
大模型发展与市场前景分析
探讨2024年大模型发展趋势及其市场前景,分析王仲远院长对大模型与人工智能的独特见解,以及智源在推动人工智能创新中的角色。
2025-05-02
Notta:日本市场会议语音转录创业的成功策略和成长路径
探索Notta在日本市场的成功之路,从创业策略到市场本地化,以及其在会议语音转录领域的创新和成就。
2025-05-02