通过 inference.sh CLI 调用 Google Gemini 3.1 Flash Image Preview 生成图像,支持文生图、图像编辑、多图输入及 Google Search 实时信息增强
基本信息
- 技能名称?Nano Banana 2
- 中文名称?Gemini 3.1 图像生成轻量入口
- 作者?okaris
- 分类?专业技能
- 版本?0.1.1
- 标签?gemini, google-ai, image-generation, text-to-image, image-editing, cli-tool, inference-sh, flash-model
使用方法
使用说明
核心功能
Nano Banana 2 是一个封装了 Google Gemini 3.1 Flash Image Preview 模型的图像生成技能,通过 inference.sh CLI 提供轻量级访问入口。该技能支持多种图像生成模式:
- 文本生成图像 :基础文生图能力,支持多种艺术风格(写实、插画、水彩、3D 渲染等)
- 图像编辑 :支持最多 14 张输入图像的局部编辑与重绘
- 多图生成 :单次请求可并行生成多张图像
- Google Search 增强 :开启后可将实时信息(天气、新闻等)融入图像生成
显著优点
官方模型直连 :底层为 Google 官方 Gemini 3.1 Flash Image Preview,非第三方封装
灵活参数控制 :支持自定义比例(1:1、16:9 等)、分辨率(最高 4K)、输出数量
多语言 SDK :提供 Python SDK 支持,支持流式输出进度
安全安装 :CLI 安装脚本仅下载二进制文件并校验 SHA-256,无提权操作
潜在局限
依赖外部服务 :需 inference.sh 平台账号,存在服务可用性依赖
CLI 学习成本 :非图形界面,需熟悉命令行操作
模型版本锁定 :需指定完整 app ID(如 @0c7ma1ex ),版本管理较复杂
生成质量波动 :Flash 系列侧重速度,复杂场景下细节表现可能弱于 Pro 版本
适合人群
开发者、设计师、内容创作者等需要程序化调用图像生成 API 的技术用户,尤其适合已在使用 inference.sh 生态的现有用户。
常规风险
API 密钥管理 :需在 CLI 中登录,存在凭证泄露风险
内容合规 :生成内容受 Google 使用政策约束
成本不可控 :按调用次数计费,批量生成时需注意用量
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!