cover

想调用图片生成 API,但不想花钱?

如果你关注过 Nano Banana Pro——也就是 Google 的 Gemini 3 Pro Image 模型——可能会发现它的免费额度非常有限。通过 Google AI Studio 免费层,每分钟只能请求 2-5 次,每天上限大概 50-100 次。更惨的是 2025 年 12 月 Google 还大砍了一波免费额度,部分模型直接砍掉 50-80%。如果只是用 Gemini App 的免费版,每天就只能生成 3 张低分辨率图片。

这时候可以看看 ModelScope 的 API-Inference。

额度对比

先说数字:

平台 免费额度 限制
Nano Banana Pro(Google AI Studio 免费层) 50-100 次/天 2-5 RPM,2025年12月大幅削减
Nano Banana Pro(Gemini App 免费版) 3 张低分辨率/天 有水印,速度慢
Nano Banana Pro(付费 Tier 1) 250 次/天 需绑定信用卡
ModelScope 单模型 500 次/天,总共 2000 次/天 需实名认证

差距一目了然。即使拿 Nano Banana Pro 付费用户的 250 次/天来比,ModelScope 的免费额度都是它的 8 倍。如果你只是想免费测试生图效果,ModelScope 基本等于敞开用。

能替代 Nano Banana Pro 吗?

先说结论:看场景

Nano Banana Pro 的优势在于 4K 分辨率、文字渲染准确、编辑能力强(可以局部修改图片)。如果你的需求是高精度商用图,它确实更专业。问题是——免费额度太抠,而且 Google 官方价格是 $0.134-0.24/张,不便宜。

ModelScope 上的模型虽然整体能力比不上 Nano Banana Pro,但对于大多数个人开发者的需求(原型测试、批量生成素材图、玩法探索)来说,完全够用。

有哪些模型可以用

图片生成方面,ModelScope 上有不少开源模型:

  • Z-Image-Turbo:阿里通义的 6B 参数生图模型,8 步推理,速度快。实测大概 20-150 秒出图,看服务器负载
  • FLUX 系列:社区部署版本,效果不错
  • Stable Diffusion 相关模型:选择多

Z-Image-Turbo 有个亮点是中文理解能力比较好。如果你经常需要生成带中文的图片,或者 prompt 本身是中文,它比很多国外模型友好。

怎么用

  1. 注册 modelscope.cn 账号
  2. 绑定阿里云账号(必须,而且要实名认证)
  3. 获取 API Token
  4. 按文档调 API

调用方式是标准的 HTTPS 接口,和其他 API 差不多。你可以直接将代码发给Claude Code,让它给你封装成一个图片生成的Skill,后续使用就方便啦!

image-20260124133354953

image-20260124133217687

注意事项

  • 需要实名:阿里云账号要完成实名认证才能用,这一点对海外用户不太友好
  • 热门模型有额外限制:部分大规格模型可能有单独的调用限制,比如 DeepSeek-V3.2-Exp 每天只能调用 100 次
  • 适合图片生成场景:对话类 API 一轮可能就是好几次调用,2000 次不够聊几个小时。但图片生成一张一次,500 次足够折腾
  • 速度波动:毕竟是免费资源,20 秒到 150 秒都有可能,高峰期慢一点能接受

总结

如果你没有Banana 这些付费 API 账户,或者只是想找个免费渠道测试生图效果,ModelScope 的免费额度值得一试。