奥特曼,迎来至暗时刻。
Google 的 AI 攻势没有半点减弱的迹象。如果说前几天 Gemini 3 Pro 的镰刀伸向了「前端」领域,那么今天则轮到了设计行业。
刚刚发布的 Nano Banana Pro(Gemini 3 Pro Image)再次在图像生成能力上重拳出击。初级设计师的饭碗,怕是要端不稳了。
核心功能如下:
分辨率支持:最高可输出 4K 分辨率图像
多轮编辑:支持对话式、多轮次的图像编辑工作流
多图像合成:最多可将 14 张输入图像组合为 1 张输出图像
搜索增强:集成 Google 搜索能力,提供更精确、最新的知识支持
Nano Banana 的招牌能力是角色一致性强、对话编辑方式,而 Nano Banana Pro 的核心进化在于它把 Gemini 3 的深度思考能力完整接进了图像生成流程。
它生成一张图之前,会先做一轮物理模拟和逻辑推演,而不只是凭视觉模式「胡猜」。
提示词:请绘制一张四宫格图片,四张图依次表现同一位戴着斗笠的年轻男子分别发音「我」「上」「早」「八」,人物外貌保持一致,口型准确对应每个字的发音,整体风格统一,16:9,4K
跨模态理解也在 Nano Banana Pro 身上展现得更为彻底。
凭借 Gemini 3 增强的多语言推理能力,你可以直接生成多种语言的文字,或者一键本地化、翻译你的内容。
朋友丢来一页漫画,让模型给漫画上色并把气泡里的英文翻成中文。Nano Banana Pro 上色干净,光影自然,文字识别准确,英文排版也和气泡形状严丝合缝,整个过程从识别到翻译再到重排一气呵成,表现得就像在真正「理解」这张图。
提示词:将图片上的文字翻译为中文,并上色,其他不变
又或者,设计师过去需要反复调整的多语言漫画、国际化海报以及宣传物料,现在可以直接让 AI 一步到位。比如让模型将英文海报中的英文翻译成中文。这种从识别、翻译到设计的连贯处理方式,正是原生多模态架构最具威力的一面。
而在文字生成能力上,经实测,Nano Banana Pro 尽管偶尔需要抽卡,但整体表现出色。
提示词: 生成两张竖版的微信群聊天界面截图,群成员正在讨论 Nano Banana Pro 的发布。
不知道封面有没有骗到你? 发布时间:2025-11-21 08:21