Classic/VPC環境で利用できます。
CLOVA Studioはユーザーが特定時間内に使用できる APIリクエスト数とトークン数に制限を設けています。これを利用量制限ポリシーと呼び、サービスの可用性を保ち安定性と確保するために必要なポリシーです。ユーザーは決められたスコープ内で CLOVA Studioサービスを利用でき、リクエスト可能な最大値を超過する場合はエラーメッセージやエラーコードが返されます。
利用量制限ポリシーを適用することで悪意を持って APIを多量呼び出して攻撃する行為を防ぐことができ、過剰なトラフィックからサービスを保護できます。また、特定のユーザーがリソースを独占することを防ぎ、すべてのユーザーがリソースを安定的に使用できる環境を構成できます。モデル、ツール、目的に応じて使用できる最大値が変わるため、このガイドで案内する内容を必ず熟知してください。
- このガイドで案内する最大利用量は、ユーザーが CLOVA Studioサービスを利用する際にリクエストできる最大値を明示したもので、その値だけのリクエスト量を必ず保証するという意味ではありません。最大利用量以内でサービスを利用してもインフラ状況やトラフィックによって対応に遅延が発生したり、失敗することがあります。
- 最大利用量は後で変更されることがあります。最大利用量が変更される場合、利用顧客に別途ご案内する予定です。
- 一定レベルの利用量が必ず保証される必要がある場合は、別途のプランをご利用できます。利用量を保証するプランおよびポリシーについての詳細は、カスタマーサポートまでお問い合わせください。
適用基準
最大利用量の算定時に基準となる対象は、次の通りです。
| 区分 | 説明 |
|---|---|
| ユーザーのアカウント | メインアカウントを基準に最大利用量を算定
|
| モデルとツール | 利用するモデルやツールによって最大利用量が異なる
|
| 利用目的 | サービスアプリの有無によって最大利用量が異なる |
最大利用量
CLOVA Studioで利用量が制限される数値は、1分当たりのリクエスト回数である QPMと1分当たりの処理トークン数を意味する TPMです。QPMと TPMがすべて適用される場合、2つの値のうち1つでも最大値に達するとエラーコードが返されます。
QPMと TPMに関する説明は、次の通りです。
| 区分 | 説明 |
|---|---|
| QPM (Queries per Minute) | 1分間モデルやツールにタスクをリクエストした回数 |
| TPM (Tokens per Minute) | 1分間処理したトークン数
|
2025年7月17日時点でサポート可能な最大利用量であり、今後変動する可能性があります。
CLOVA Studioのウェブとテスト利用
CLOVA Studioのプレイグラウンドをはじめ、ウェブとテスト APIキーで利用可能な最大 QPM、TPMについて説明します。
モデル別最大利用量
モデル別に使用できる最大 QPM、TPMは、次の通りです。
| 区分 | QPM | TPM |
|---|---|---|
| HCX-007 | 60 | 60,000 |
| HCX-005 | 60 | 60,000 |
| HCX-DASH-002 | 90 | 80,000 |
| HCX-003 | 200 | 30,000 |
| HCX-DASH-001 | 200 | 30,000 |
| チューニングモデル | チューニング時に使われたモデルに対するリクエストとみなす | |
ツール別最大利用量
エクスプローラツールごとに利用できる最大 QPM、TPMは次の通りです。
| 区分 | QPM | TPM | 備考 |
|---|---|---|---|
| 要約 | 30 | 30,000 | TPM計算時の入力値のみ含む |
| 段落分け | 120 | - | |
| エンベディング | 60 | - | |
| エンベディング v2 | 60 | 40,000 | TPM計算時の入力値のみ含む |
| リランカー | 60 | 45,000 | |
| RAG Reasoning | 60 | 30,000 |
ルーター・スキルトレーナーの最大利用量
ルーターとスキルトレーナーで利用可能な最大 QPMは、次の通りです。
| 区分 | QPM | 備考 |
|---|---|---|
| ルーター | 60 | タスクとバージョンを区分しない |
| スキルセット回答作成 | 30 | タスクとバージョンを区分しない |
サービスアプリ
サービスアプリ(サービス APIキー利用)でモデル別、ツール別に利用可能な最大 QPMと TPMについて説明します。サービスアプリの最大利用量は、ウェブやテスト利用とは別に算定・測定されます。
モデル別最大利用量
モデル別に使用できる最大 QPM、TPMは、次の通りです。
| モデル | QPM | TPM | 備考 |
|---|---|---|---|
| HCX-007 | 180 | 300,000 | |
| HCX-005 | 300 | 180,000 | |
| HCX-DASH-002 | 450 | 240,000 | |
| HCX-003 | 700 | 150,000 | |
| HCX-DASH-001 | 600 | 120,000 | |
| チューニングモデル | チューニング時に使われたモデルに対するリクエストとみなす | ||
ツール別最大利用量
エクスプローラツールごとに利用できる最大 QPM、TPMは次の通りです。
| 区分 | QPM | TPM | 備考 |
|---|---|---|---|
| 要約 | 60 | 60,000 | TPM計算時の入力値のみ含む |
| 段落分け | 360 | - | |
| エンベディング | 300 | - | |
| エンベディング v2 | 540 | 960,000 | TPM計算時の入力値のみ含む |
| リランカー | 120 | 180,000 | |
| RAG Reasoning | 180 | 120,000 |
スキルトレーナーの最大利用量
スキルトレーナーで利用できる最大 QPMは、次の通りです。
| 区分 | QPM | 備考 |
|---|---|---|
| スキルセット回答作成 | 90 | タスクとバージョンを区分しない |
| ルーター | 180 | タスクとバージョンを区分しない |
最大利用量の確認
cURL、Pythonなどを介して APIを呼び出して CLOVA Studioサービスを利用する場合、APIレスポンスヘッダを通じて利用量制限に関する情報を確認できます。
確認できる情報は次の通りです。
| Key | Value(例) | 説明 | 備考 |
|---|---|---|---|
| x-ratelimit-limit-requests | 60 |
利用中の APIに設定された最大利用量(QPM) | |
| x-ratelimit-limit-tokens | 10000 |
利用中の APIに設定された最大利用量(TPM) | TPM利用量制限がある場合に含む |
| x-ratelimit-remaining-requests | 59 |
利用中の APIに設定された最大利用量に到達するまでの残り利用量(リクエスト数) | |
| x-ratelimit-remaining-tokens | 9462 |
利用中の APIに設定された最大利用量に到達するまでの残り利用量(トークン数) | TPM利用量制限がある場合に含む |
| x-ratelimit-reset-requests | 23s |
利用中の APIに設定された最大利用量(リクエスト数)の初期値リセットまでの残り時間 | |
| x-ratelimit-reset-tokens | 23s |
利用中の APIに設定された最大利用量(トークン数)の初期値リセットまでの残り時間 | TPM利用量制限がある場合に含む |
最大利用量の管理
CLOVA Studioサービス利用時にリクエストできる最大値を超過した場合、HTTP 429コードが返されたり、エラーメッセージが表示されます。最大利用量を超過しないために実行できるタスクを説明します。
CLOVA Studioは安定かつ円滑なサービスを提供するために最善を尽くしていますが、最大リクエスト数以内でサービスを利用する場合も、一部の処理遅延が発生したり、失敗することがあります。
QPM管理方法
- QPM数値を予め確認した後、最大値以内でリクエストします。
- 別途の API呼び出しコントロール機能(rate limit)を直接実現・追加します。
- リクエスト間に一定時間の遅延処理機能(time sleep)を別途追加します。
- HTTP 429コードが返されて、当該エラーメッセージに対してレスポンスする時に、例外処理を通じて一定時間が経った後に再度リクエストします。
TPM管理方法
- TPM数値を予め確認し、タスクのために入力するトークン数と結果値の作成時に使用する最大トークン数を実際に必要な分だけ設定します。
- API呼び出し時に入力した文字列のトークン数を確認するには、エクスプローラメニューのトークン計算機 APIを活用します。
- API呼び出しの際に結果値に使用する最大トークン数を調整したい場合は、
maxTokensまたはmaxCompletionTokensフィールドの値を変更してください。 - プレイグラウンドメニューで入力された文字列のトークン数を確認するには、プレイグラウンド画面上部の計算アイコンをクリックします。

- プレイグラウンドメニューで結果値を作成する時に使用する最大トークン数を調整するには、プレイグラウンド画面左側の Max tokensフィールドを変更します。
