Google 发布 Nano Banana 2:结合 Pro 能力与闪电速度的新一代图像模型
Google DeepMind 今日发布 Nano Banana 2(Gemini 3.1 Flash Image),这是继去年 Nano Banana 病毒式传播后的最新一代图像生成模型。该模型将 Nano Banana Pro 的高级功能与 Gemini Flash 的闪电速度相结合,让用户在保持专业级质量的同时实现快速编辑和迭代。
速度与智能的融合
Nano Banana 2 将 Gemini Flash 的高速智能带入视觉生成领域,使快速编辑和迭代成为可能。它将原本专属于 Pro 版本的功能带给更广泛的用户:
高级世界知识
模型利用 Gemini 的真实世界知识库,并通过实时网络搜索获取最新信息和图像,更准确地渲染特定主题。这种深度理解还能帮助用户创建信息图表、将笔记转换为图表以及生成数据可视化。
精确文本渲染与翻译
Nano Banana 2 允许生成准确、清晰可读的文本,适用于营销模型或贺卡。用户甚至可以在图像内翻译和本地化文本,与全球分享创意。
增强的创意控制
Nano Banana 2 大幅缩小了速度与视觉保真度之间的差距,提供高质量、逼真的图像:
- 主体一致性:在单个工作流中保持多达五个角色的外观一致,以及多达 14 个对象的保真度,让用户可以在不改变输入外观的情况下进行故事板创作和构建叙事。
- 精确指令遵循:通过增强的指令遵循能力,模型更严格地遵循复杂请求,捕捉创意的特定细微差别。
- 生产就绪规格:支持从 512px 到 4K 的各种宽高比和分辨率,确保视觉效果无论是用于垂直社交帖子还是宽屏背景都能保持清晰。
- 视觉保真度升级:提供生动的光照、更丰富的纹理和更锐利的细节,在 Flash 预期的速度下保持高质量美学。
多平台部署
Nano Banana 2 今日起在多个 Google 产品中推出:
- Gemini 应用:将替代 Fast、Thinking 和 Pro 模型中的 Nano Banana Pro。Pro 和 Ultra 订阅用户仍可通过三点菜单重新生成图像来使用 Pro 版本。
- Google 搜索:在 AI 模式和 Lens 中可用,支持 141 个新国家/地区和八种额外语言。
- AI Studio + API:在 AI Studio 和 Gemini API 中提供预览版。
- Google Cloud:在 Vertex AI 的 Gemini API 中提供预览版。
- Flow:作为 Flow 的新默认图像生成模型,所有 Flow 用户可免费使用。
- Google Ads:在创建广告系列时提供智能建议。
内容溯源与验证
Google 继续深化内容溯源方法,结合 SynthID 技术和 C2PA 内容凭证,帮助识别和验证 AI 生成内容。
阅读完整文章:https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/