谷歌在最新一轮针对 ChatGPT 的攻击中增强了 Gemini AI 的图像处理能力

路人丁 3 阅读发布日期 2025-08-27 01:26:22 0 评论 0 点赞

区小号报道：

谷歌周二推出了双子座 2.5 Flash Image，提供了一种新的 AI 模型，可以比以前的工具更精确、字符更一致地生成和编辑图像，试图缩小与 OpenAI 的 ChatGPT 的差距。

这家科技巨头正在努力将先进的图像编辑技术融入Gemini这反映出人工智能平台正在更广泛地推动将图像生成作为必备功能。这款新工具现已在 Gemini 应用和平台上线，用户可以使用自然语言编辑视觉效果，处理诸如姿势变化或多图像融合等复杂任务，且不会扭曲面部或场景。

在博客中邮政谷歌表示，该模型允许用户“将同一个角色放入不同的环境中，从多个角度展示单个产品……同时保留主题。”

该模型最初以“nano-banana”的化名出现在众包测试网站LMArena上，因其无缝编辑功能而备受关注。谷歌周二证实，该工具是其开发者。

谷歌表示，该系统可以融合多幅图像，保持故事叙述或品牌推广的角色一致性，并整合“世界知识”来解释图表或组合参考资料——所有这些都在一个提示中完成。

该模型在谷歌云上的售价为每百万个输出令牌 30 美元，约合每张图片 4 美分。它也通过 OpenRouter 和 fal.ai 进行分发。

OpenAI 于 2024 年 5 月推出了 GPT-4o 模型，并在2025年3月这有助于 ChatGPT 的周活跃用户数突破 7 亿。谷歌报告称，2025 年 8 月，Gemini 的月活跃用户数将达到 4 亿，这意味着其周活跃用户数将远远落后于 OpenAI。

谷歌表示，所有输出都将包含一个不可见的 SynthID 水印和元数据标签，以将其标记为 AI 生成的，以解决对滥用和真实性的担忧。

点赞(0) 打赏