区小号报道:

谷歌周二推出了 双子座 2.5 Flash Image,提供了一种新的 AI 模型,可以比以前的工具更精确、字符更一致地生成和编辑图像,试图缩小与 OpenAI 的 ChatGPT 的差距。

这家科技巨头正在努力将先进的图像编辑技术融入Gemini这反映出人工智能平台正在更广泛地推动将图像生成作为必备功能。这款新工具现已在 Gemini 应用和平台上线,用户可以使用自然语言编辑视觉效果,处理诸如姿势变化或多图像融合等复杂任务,且不会扭曲面部或场景。

在博客中邮政谷歌表示,该模型允许用户“将同一个角色放入不同的环境中,从多个角度展示单个产品……同时保留主题。”

该模型最初以“nano-banana”的化名出现在众包测试网站LMArena上,因其无缝编辑功能而备受关注。谷歌周二证实,该工具是其开发者。

谷歌表示,该系统可以融合多幅图像,保持故事叙述或品牌推广的角色一致性,并整合“世界知识”来解释图表或组合参考资料——所有这些都在一个提示中完成。

该模型在谷歌云上的售价为每百万个输出令牌 30 美元,约合每张图片 4 美分。它也通过 OpenRouter 和 fal.ai 进行分发。

OpenAI 于 2024 年 5 月推出了 GPT-4o 模型,并在2025年3月这有助于 ChatGPT 的周活跃用户数突破 7 亿。谷歌报告称,2025 年 8 月,Gemini 的月活跃用户数将达到 4 亿,这意味着其周活跃用户数将远远落后于 OpenAI。

谷歌表示,所有输出都将包含一个不可见的 SynthID 水印和元数据标签,以将其标记为 AI 生成的,以解决对滥用和真实性的担忧。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部