Gemini API Rate Limits and Usage Tiers | 深入了解谷歌AI配额与升级机制

本文详细介绍了 Gemini API 的速率限制政策,包括每分钟请求数 (RPM)、每分钟令牌数 (TPM) 和每日请求数 (RPD) [2]。查看 Free Tier 到 Tier 3 的升级资格要求,以及各层级对 Gemini 2.5 Pro/Flash、Imagen 和 Embedding 等模型的具体限制 [3-8]。

阅读时长: 5 分钟
共 2226字
作者: eimoon.com

速率限制用于规范您在给定时间范围内可以向 Gemini API 发出的请求数量。这些限制旨在维护公平使用、防止滥用,并帮助所有用户维持系统性能。

速率限制的工作方式

速率限制通常通过以下三个维度进行衡量:

  1. 每分钟请求数 (RPM)
  2. 每分钟令牌数(输入)(TPM)
  3. 每天请求数 (RPD)

系统会根据以上各项限制评估您的使用情况,超过其中任何一项都会触发速率限制错误。例如,如果您的 RPM 限制是 20,那么在一分钟内发出 21 个请求就会导致错误,即使您尚未超出 TPM 或其他限制。

限制说明和特殊模型限制:

  • 速率限制是针对每个项目应用,而不是针对每个 API 密钥应用。
  • 每天请求数 (RPD) 配额在太平洋时间 (Pacific time) 午夜重置。
  • 限制因所使用的具体模型而异,有些限制仅适用于特定模型。
  • 例如,每分钟图像数 (Images per minute, IPM) 仅针对能够生成图像的模型(如 Imagen 3)计算,但在概念上类似于 TPM。其他模型可能具有每日令牌数限制 (TPD)。
  • 实验性和预览模型的速率限制更为严格。

使用层级 (Usage Tiers)

速率限制与项目的使用层级 (usage tier) 相关联。随着您的 API 使用量和支出增加,您可以选择升级到具有更高速率限制的层级。

层级资格要求

Tier 2 和 Tier 3 的资格基于与您的项目关联的结算账户在 Google Cloud 服务(包括但不限于 Gemini API)上的总累计支出。

层级 (Tier) 资格要求 (Qualifications)
免费层级 (Free) 符合条件的国家/地区的用户
Tier 1 项目已关联结算账户
Tier 2 总支出:> $250 且成功付款至少 30 天
Tier 3 总支出:> $1,000 且成功付款至少 30 天

当您请求升级时,自动滥用保护系统会执行额外的检查。虽然满足所述的资格标准通常足以获得批准,但在极少数情况下,升级请求可能会因审查过程中确定的其他因素而被拒绝。此系统有助于维护 Gemini API 平台的安全性和完整性。

如何升级到更高层级

Gemini API 使用 Cloud Billing 进行所有结算服务。要从免费层级过渡到付费层级,您必须首先为您的 Google Cloud 项目启用 Cloud Billing。

一旦您的项目满足指定的标准,它就有资格升级到下一层级。请求升级的步骤如下:

  1. 导航到 AI Studio 中的 API 密钥页面
  2. 找到您想要升级的项目,然后单击 “升级 (Upgrade)"。
  3. “升级"选项仅会显示给符合下一层级资格的项目。

经过快速验证后,项目将被升级到下一层级。

标准 API 速率限制

下表列出了所有标准 Gemini API 调用的速率限制。请注意:表格中显示 * 的值表示没有已公布的速率限制。请注意,指定的速率限制不作保证,实际容量可能会有所不同。

免费层级 (Free Tier)

模型 (Model) RPM (每分钟请求数) TPM (每分钟令牌数) RPD (每天请求数)
文本输出模型 (Text-out models)
Gemini 2.5 Pro 5 125,000 100
Gemini 2.5 Flash 10 250,000 250
Gemini 2.5 Flash Preview 10 250,000 250
Gemini 2.5 Flash-Lite 15 250,000 1,000
Gemini 2.5 Flash-Lite Preview 15 250,000 1,000
Gemini 2.0 Flash 15 1,000,000 200
Gemini 2.0 Flash-Lite 30 1,000,000 200
Live API
Gemini 2.5 Flash Live 3 sessions 1,000,000 *
Gemini 2.5 Flash Preview Native Audio 1 session 25,000 5
Gemini 2.5 Flash Experimental Native Audio Thinking 1 session 10,000 5
Gemini 2.0 Flash Live 3 sessions 1,000,000 *
多模态生成模型 (Multi-modal generation models)
Gemini 2.5 Flash Preview TTS 3 10,000 15
Gemini 2.0 Flash Preview Image Generation 10 200,000 100
其他模型 (Other models)
Gemma 3 & 3n 30 15,000 14,400
Gemini Embedding 100 30,000 1,000
Gemini Robotics-ER 1.5 Preview 10 250,000 250
已弃用模型 (Deprecated models)
Gemini 1.5 Flash (Deprecated) 15 250,000 50
Gemini 1.5 Flash-8B (Deprecated) 15 250,000 50

Tier 1

模型 (Model) RPM TPM RPD 批量排队令牌数 (Batch Enqueued Tokens)
文本输出模型
Gemini 2.5 Pro 150 2,000,000 10,000 5,000,000
Gemini 2.5 Flash 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash Preview 1,000 1,000,000 10,000 3,000,000
Gemini 2.5 Flash-Lite 4,000 4,000,000 * 10,000,000
Gemini 2.5 Flash-Lite Preview 4,000 4,000,000 * 10,000,000
Gemini 2.0 Flash 2,000 4,000,000 * 10,000,000
Gemini 2.0 Flash-Lite 4,000 4,000,000 * 10,000,000
Live API
Gemini 2.5 Flash Live 50 sessions 4,000,000 * *
Gemini 2.5 Flash Preview Native Audio 3 sessions 50,000 50 *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 session 25,000 50 *
Gemini 2.0 Flash Live 50 sessions 4,000,000 * *
多模态生成模型
Gemini 2.5 Flash Preview TTS 10 10,000 100 *
Gemini 2.5 Pro Preview TTS 10 10,000 50 *
Gemini 2.5 Flash Image 500 500,000 2,000 *
Gemini 2.0 Flash Preview Image Generation 1,000 1,000,000 10,000 *
Imagen 4 Standard/Fast 10 * 70 *
Imagen 4 Ultra 5 * 30 *
Imagen 3 20 * * *
Veo 3 2 * 10 *
Veo 3 Fast 2 * 10 *
Veo 2 2 * 50 *
其他模型
Gemma 3 & 3n 30 15,000 14,400 *
Gemini Embedding 3,000 1,000,000 * *
Gemini Robotics-ER 1.5 Preview 300 1,000,000 10,000 *
Gemini 2.5 Computer Use Preview 150 2,000,000 10,000 *
已弃用模型
Gemini 1.5 Flash (Deprecated) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (Deprecated) 4,000 4,000,000 * *
Gemini 1.5 Pro (Deprecated) 1,000 4,000,000 * *

Tier 2

模型 (Model) RPM TPM RPD 批量排队令牌数 (Batch Enqueued Tokens)
文本输出模型
Gemini 2.5 Pro 1,000 5,000,000 50,000 500,000,000
Gemini 2.5 Flash 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash Preview 2,000 3,000,000 100,000 400,000,000
Gemini 2.5 Flash-Lite 10,000 10,000,000 * 500,000,000
Gemini 2.5 Flash-Lite Preview 10,000 10,000,000 * 500,000,000
Gemini 2.0 Flash 10,000 10,000,000 * 1,000,000,000
Gemini 2.0 Flash-Lite 20,000 10,000,000 * 1,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 sessions 10,000,000 * *
Gemini 2.5 Flash Preview Native Audio 100 sessions 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 session 25,000 50 *
Gemini 2.0 Flash Live 1,000 sessions 10,000,000 * *
多模态生成模型
Gemini 2.5 Flash Preview TTS 1,000 100,000 10,000 *
Gemini 2.5 Pro Preview TTS 100 25,000 1,000 *
Gemini 2.5 Flash Image 2,000 1,500,000 50,000 *
Gemini 2.0 Flash Preview Image Generation 2,000 3,000,000 100,000 *
Imagen 4 Standard/Fast 15 * 1000 *
Imagen 4 Ultra 10 * 400 *
Imagen 3 20 * * *
Veo 3 4 * 50 *
Veo 3 Fast 4 * 50 *
Veo 2 2 * 50 *
其他模型
Gemma 3 & 3n 30 15,000 14,400 *
Gemini Embedding 5,000 5,000,000 * *
Gemini Robotics-ER 1.5 Preview 400 3,000,000 100,000 *
Gemini 2.5 Computer Use Preview 1,000 5,000,000 50,000 *
已弃用模型
Gemini 1.5 Flash (Deprecated) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (Deprecated) 4,000 4,000,000 * *
Gemini 1.5 Pro (Deprecated) 1,000 4,000,000 * *

Tier 3

模型 (Model) RPM TPM RPD 批量排队令牌数 (Batch Enqueued Tokens)
文本输出模型
Gemini 2.5 Pro 2,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash Preview 10,000 8,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite 30,000 30,000,000 * 1,000,000,000
Gemini 2.5 Flash-Lite Preview 30,000 30,000,000 * 1,000,000,000
Gemini 2.0 Flash 30,000 30,000,000 * 5,000,000,000
Gemini 2.0 Flash-Lite 30,000 30,000,000 * 5,000,000,000
Live API
Gemini 2.5 Flash Live 1,000 sessions 10,000,000 * *
Gemini 2.5 Flash Preview Native Audio 100 sessions 1,000,000 * *
Gemini 2.5 Flash Experimental Native Audio Thinking 1 session 25,000 50 *
Gemini 2.0 Flash Live 1,000 sessions 10,000,000 * *
多模态生成模型
Gemini 2.5 Flash Preview TTS 1,000 1,000,000 * *
Gemini 2.5 Pro Preview TTS 100 1,000,000 * *
Gemini 2.5 Flash Image 5,000 5,000,000 * *
Gemini 2.0 Flash Preview Image Generation 5,000 5,000,000 * *
Imagen 4 Standard/Fast 20 * 15,000 *
Imagen 4 Ultra 15 * 5,000 *
Imagen 3 20 * * *
Veo 3 10 * 500 *
Veo 3 Fast 10 * 500 *
Veo 2 2 * 50 *
其他模型
Gemma 3 & 3n 30 15,000 14,400 *
Gemini Embedding 10,000 10,000,000 * *
Gemini Robotics-ER 1.5 Preview 600 8,000,000 * 1,000,000,000
Gemini 2.5 Computer Use Preview 2,000 8,000,000 * *
已弃用模型
Gemini 1.5 Flash (Deprecated) 2,000 4,000,000 * *
Gemini 1.5 Flash-8B (Deprecated) 4,000 4,000,000 * *
Gemini 1.5 Pro (Deprecated) 1,000 4,000,000 * *

批量 API 速率限制 (Batch API Rate limits)

批量 API 请求有其自己的速率限制,这些限制与非批量 API 调用是分开的。批量 API 的限制包括:

  • 并发批量请求 (Concurrent batch requests): 100
  • 输入文件大小限制 (Input file size limit): 2GB
  • 文件存储限制 (File storage limit): 20GB
  • 每模型排队令牌数 (Enqueued tokens per model): 速率限制表中的 “批量排队令牌数” (Batch Enqueued Tokens) 列列出了在给定模型的所有活跃批量作业中可以排队的最大令牌数。

增加速率限制的请求 (Request a rate limit increase)

每个模型变体都有一个关联的速率限制(每分钟请求数,RPM)。

付费层级速率限制增加请求:

Google 不保证一定会增加您的速率限制,但会尽力审核您的请求。


本文内容基于 Gemini API 文档,最后更新日期为 2025 年 10 月 7 日 UTC

📬 关注我获取更多资讯

公众号
📢 公众号
个人号
💬 个人号
使用 Hugo 构建
主题 StackJimmy 设计