CAIO Team

Gemini 3.1 图像生成轻量入口

Nano Banana 2

收藏 10.1k

下载 2.4k

版本 0.1.1

通过 inference.sh CLI 调用 Google Gemini 3.1 Flash Image Preview 生成图像，支持文生图、图像编辑、多图输入及 Google Search 实时信息增强

基本信息

技能名称?Nano Banana 2
中文名称?Gemini 3.1 图像生成轻量入口
作者?okaris
分类?专业技能
版本?0.1.1
标签?gemini, google-ai, image-generation, text-to-image, image-editing, cli-tool, inference-sh, flash-model

使用方法

使用说明
核心功能
Nano Banana 2 是一个封装了 Google Gemini 3.1 Flash Image Preview 模型的图像生成技能，通过 inference.sh CLI 提供轻量级访问入口。该技能支持多种图像生成模式：

文本生成图像：基础文生图能力，支持多种艺术风格（写实、插画、水彩、3D 渲染等）
图像编辑：支持最多 14 张输入图像的局部编辑与重绘
多图生成：单次请求可并行生成多张图像
Google Search 增强：开启后可将实时信息（天气、新闻等）融入图像生成
显著优点
官方模型直连：底层为 Google 官方 Gemini 3.1 Flash Image Preview，非第三方封装
灵活参数控制：支持自定义比例（1:1、16:9 等）、分辨率（最高 4K）、输出数量
多语言 SDK ：提供 Python SDK 支持，支持流式输出进度
安全安装：CLI 安装脚本仅下载二进制文件并校验 SHA-256，无提权操作
潜在局限
依赖外部服务：需 inference.sh 平台账号，存在服务可用性依赖
CLI 学习成本：非图形界面，需熟悉命令行操作
模型版本锁定：需指定完整 app ID（如 @0c7ma1ex ），版本管理较复杂
生成质量波动：Flash 系列侧重速度，复杂场景下细节表现可能弱于 Pro 版本
适合人群
开发者、设计师、内容创作者等需要程序化调用图像生成 API 的技术用户，尤其适合已在使用 inference.sh 生态的现有用户。
常规风险
API 密钥管理：需在 CLI 中登录，存在凭证泄露风险
内容合规：生成内容受 Google 使用政策约束
成本不可控：按调用次数计费，批量生成时需注意用量

标签

专业技能

💬 评论 (0)

发表评论

📭 还没有评论，快来抢沙发吧！