发布时间:2025-06-14 10:13:16 来源:AI视频贴吧
《科创板日报》12月14日讯(编辑 宋子乔) 多模态AI年末有多卷?谷歌用实际行动回答你。
12月6日,谷歌上线原生多模态大模型Gemini单挑GPT-4,随即其媲美Gen-2、比肩Pika的文生视频模型W.A.L.T面世。就在12月14日,谷歌又上线了文生图模型Imagen 2,该模型被称为DALL•E 3和和Midjourney的最强竞品。
在多模态这条路上,谷歌已全面出击。
据谷歌介绍,基于谷歌最先进的文本到图像扩散技术,Imagen 2不需要复杂、专业的提示词,可根据自然语言提示生成高质量、逼真、高分辨率、美观的图像;具备强大的图像理解能力,可进行视觉问答,即为图像创建详细的长文标注,并对图像内元素提出的问题给出详细答案;可理解复杂抽象的概念(如诗歌、文学作品),并将这些描写可视化。
效果如何?
一直以来,AI绘画的一个缺陷在于不会画“手”,而Imagen 2的数据集和模型进步,让其能够生成逼真的手部和脸部图像,且对光线的处理堪称完美。
在理解抽象的文学作品上,Imagen 2同样出色,精确表述出了藏于文字中的意境之美。
Imagen 2还有哪些亮点?
功能上,Imagen 2还支持图像编辑功能,如修复(inpainting)和扩图(outpainting)。
除了英语之外,Imagen 2还支持另外六种语言(中文、印地语、日语、韩语、葡萄牙语、西班牙语),另有许多其他语言计划于2024年初接入该模型。
应用上,谷歌有意强调了Imagen 2的营销用途——该模型可用于logo生成、制作商品广告页。
安全性上,Imagen 2集成了SynthID——用于加水印和识别 AI 生成内容的工具包,其生成的图片可添加不可见的数字水印;Imagen 2接受了数据安全训练,内嵌安全过滤器可防止生成潜在有害内容,如暴力、冒犯或**内容。
值得注意的是,Imagen 2目前并没有向所有人开放,仅供许可名单上的Vertex AI客户使用。Vertex AI是谷歌云上集成多种工具的托管式AI平台,可以理解为谷歌为客户提供的AI应用训练场。
这正体现了谷歌在AI业务上的战略——依托谷歌云打造AI生态,更多地面向开发者。在8月份的谷歌云Next大会上,谷歌云的CEO透露,自从今年年初Vertex AI支持生成式AI技术,Vertex AI用户数量同比增长了15倍以上。
多模态AI层出不穷谷歌放连招最新文生图模型“拍死前浪”
《科创板日报》12月14日讯(编辑 宋子乔) 多模态AI年末有多卷?谷歌用实际行动回答你。12月6日,谷歌上线原生多模态大模型Gemini单挑GPT-4,随即其媲美Gen-2、比肩Pika的文生视频模型W A L T面世。就在12月14日
2025-06-14
AI智能体创业必读,详解AIAgent市场格局、技术路径与未来市场
图片来源@视觉中国文|王吉伟七张图,深度了解全球AI Agent行业五个板块七张图片,带你深度认知全球AI Agent行业AI智能体市场规模有多大?目前市场格局是怎样的?一篇文章看明白AI Agent市场格局如何?未来市场前
2025-06-14
3年完成数亿元营收,这家公司的大模型Agent产品已经开始赚钱了|产品观察
近日有消息称,微软将在日本组建数据中心,两年内将投入29亿美金,旨在全球生成式AI发展进程中,为其提供完备的数据及设备支撑。这也是历史以来微软向日本投资的最大一笔金额。数据的重要性之于技术发展长期存在
2025-06-14
谷歌发布Gemini,负责人:原生多模态大模型是AI「新品种」
又是一个不眠之夜,神仙扎堆献技。当地时间 12 月 6 日,谷歌 CEO Sundar PichAI 官宣 Gemini 1 0 版正式上线。在此之前,这款被谷歌寄予厚望对抗 OpenAI 的武器,发布时间一直被拖延。未曾料到,来得如此猝不及
2025-06-14
大模型价格普降,互联网式“地盘争夺战”再现大厂真的会亏钱吗?
今年年初,长文本领域的竞速,让不少国内大模型企业在“内卷”赛道上露了脸。进入5月,这场没有硝烟的战争“烧”到了最粗暴的阶段——降价。从两家海外AI(人工智能)巨头OpenAI和谷歌,到国内字节跳动、阿里、百度、智
2025-06-14