极简部署的 Gemini 图像生成器

gemini-image-proxy

专业技能

收藏 19k

下载 4.1k

版本 v1.0.0

基于 OpenAI SDK 调用 Gemini 3 Pro Image API 的轻量级图片生成与编辑工具，代码简洁无隐藏逻辑，适合受限环境部署。

基本信息

技能名称?gemini-image-proxy
中文名称?极简部署的 Gemini 图像生成器
作者?YspCoder
分类?专业技能
版本?v1.0.0
标签?image-gen, api, development-engineering, content-media, automation

使用方法

使用说明
核心用法
gemini-image-proxy 是一个通过 OpenAI Python SDK 调用 Gemini 3 Pro Image API 的图片生成与编辑技能。用户只需安装 openai 包并配置两个环境变量（ GOOGLE_PROXY_API_KEY 和 GOOGLE_PROXY_BASE_URL ），即可通过命令行完成图片生成或编辑任务。
生成新图片： python3 generate.py "prompt" output.png
编辑现有图片： python3 generate.py "edit instructions" output.png --input source.png
支持 PNG、JPG、JPEG、GIF、WEBP 格式输入，输出自动创建目录结构。
显著优点

极简依赖：仅需 openai 一个 pip 包，无需 google-genai 、、 pillow` 等额外依赖，大幅降低环境冲突风险
部署友好：专为 Fly.io 等受限容器环境优化，解决同类工具常见的容器兼容性问题
SDK 兼容：复用成熟的 OpenAI Python SDK 接口，降低学习成本，便于现有 OpenAI 项目迁移
模型灵活：内置 Gemini 3 Pro Image、Imagen 4.0 系列、Gemini 2.5 Flash 等多模型支持，可手动切换
代码透明：核心脚本仅约 100 行，无封装黑盒，易于审计和二次开发
潜在缺点与局限性
代理依赖：必须自行搭建或寻找可信的 Gemini API 代理端点，增加了基础设施成本
无内置重试：脚本未实现网络错误重试机制，API 不稳定时需手动处理
Prompt 无过滤：用户输入直接透传至 API，依赖后端服务进行内容安全审核
功能单一：仅支持生成和基础编辑，无批量处理、风格预设、历史管理等高级功能
环境变量硬编码：模型选择需修改脚本源码，无法通过参数动态指定
适合的目标群体
容器化部署用户：Fly.io、Heroku 等受限 PaaS 平台的开发者
OpenAI 生态迁移者：希望将现有 OpenAI 图片生成代码无缝切换至 Gemini 的团队
极简主义开发者：追求最小依赖、快速验证原型的个人或小型团队
运维敏感场景：对 pip 依赖树有严格管控要求的企业环境
使用风险
API 端点可信性：图片数据将发送至用户配置的第三方代理端点，存在数据泄露和中间人攻击风险，务必使用 HTTPS 并验证证书
密钥管理：环境变量方式在部分容器平台可能通过日志或调试接口泄露，建议配合密钥管理服务
网络稳定性：无本地缓存或离线能力，完全依赖外部 API 可用性
内容合规：Gemini API 的内容政策可能与用户所在地区法规存在差异，需自行评估合规性

极简部署的 Gemini 图像生成器

基本信息

使用方法

标签

💬 评论 (0)

发表评论