CLOVA Studio の利用量制限ポリシー

Prev Next

Classic/VPC環境で利用できます。

CLOVA Studioはユーザーが特定時間内に使用できる APIリクエスト数とトークン数に制限を設けています。これを利用量制限ポリシーと呼び、サービスの可用性を保ち安定性と確保するために必要なポリシーです。ユーザーは決められたスコープ内で CLOVA Studioサービスを利用でき、リクエスト可能な最大値を超過する場合はエラーメッセージやエラーコードが返されます。
利用量制限ポリシーを適用することで悪意を持って APIを多量呼び出して攻撃する行為を防ぐことができ、過剰なトラフィックからサービスを保護できます。また、特定のユーザーがリソースを独占することを防ぎ、すべてのユーザーがリソースを安定的に使用できる環境を構成できます。モデル、ツール、目的に応じて使用できる最大値が変わるため、このガイドで案内する内容を必ず熟知してください。

参考
  • このガイドで案内する最大利用量は、ユーザーが CLOVA Studioサービスを利用する際にリクエストできる最大値を明示したもので、その値だけのリクエスト量を必ず保証するという意味ではありません。最大利用量以内でサービスを利用してもインフラ状況やトラフィックによって対応に遅延が発生したり、失敗することがあります。
  • 最大利用量は後で変更されることがあります。最大利用量が変更される場合、利用顧客に別途ご案内する予定です。
  • 一定レベルの利用量が必ず保証される必要がある場合は、別途のプランをご利用できます。利用量を保証するプランおよびポリシーについての詳細は、カスタマーサポートまでお問い合わせください。

適用基準

最大利用量の算定時に基準となる対象は、次の通りです。

区分 説明
ユーザーのアカウント メインアカウントを基準に最大利用量を算定
  • サブアカウントがある場合、サブアカウントの利用量もメインアカウントの利用量に含められる
モデルとツール 利用するモデルやツールによって最大利用量が異なる
  • チューニングモデルでタスクを実行する場合、チューニング時に使用されたモデルに対するリクエストとみなし、最大利用量を算定
  • ルーターやスキルトレーナーの場合、異なるタスクやバージョンであっても統合して最大利用量を算定
利用目的 サービスアプリの有無によって最大利用量が異なる

最大利用量

CLOVA Studioで利用量が制限される数値は、1分当たりのリクエスト回数である QPMと1分当たりの処理トークン数を意味する TPMです。QPMと TPMがすべて適用される場合、2つの値のうち1つでも最大値に達するとエラーコードが返されます。
QPMと TPMに関する説明は、次の通りです。

区分 説明
QPM (Queries per Minute) 1分間モデルやツールにタスクをリクエストした回数
TPM (Tokens per Minute) 1分間処理したトークン数
  • 処理するトークン数=入力されたトークン数+結果値作成時に使用する最大トークン数(maxTokens または maxCompletionTokens)
参考

2025年7月17日時点でサポート可能な最大利用量であり、今後変動する可能性があります。

CLOVA Studioのウェブとテスト利用

CLOVA Studioのプレイグラウンドをはじめ、ウェブとテスト APIキーで利用可能な最大 QPM、TPMについて説明します。

モデル別最大利用量

モデル別に使用できる最大 QPM、TPMは、次の通りです。

区分 QPM TPM
HCX-007 60 60,000
HCX-005 60 60,000
HCX-DASH-002 90 80,000
HCX-003 200 30,000
HCX-DASH-001 200 30,000
チューニングモデル チューニング時に使われたモデルに対するリクエストとみなす

ツール別最大利用量

エクスプローラツールごとに利用できる最大 QPM、TPMは次の通りです。

区分 QPM TPM 備考
要約 30 30,000 TPM計算時の入力値のみ含む
段落分け 120 -
エンベディング 60 -
エンベディング v2 60 40,000 TPM計算時の入力値のみ含む
リランカー 60 45,000
RAG Reasoning 60 30,000

ルーター・スキルトレーナーの最大利用量

ルーターとスキルトレーナーで利用可能な最大 QPMは、次の通りです。

区分 QPM 備考
ルーター 60 タスクとバージョンを区分しない
スキルセット回答作成 30 タスクとバージョンを区分しない

サービスアプリ

サービスアプリ(サービス APIキー利用)でモデル別、ツール別に利用可能な最大 QPMと TPMについて説明します。サービスアプリの最大利用量は、ウェブやテスト利用とは別に算定・測定されます。

モデル別最大利用量

モデル別に使用できる最大 QPM、TPMは、次の通りです。

モデル QPM TPM 備考
HCX-007 180 300,000
HCX-005 300 180,000
HCX-DASH-002 450 240,000
HCX-003 700 150,000
HCX-DASH-001 600 120,000
チューニングモデル チューニング時に使われたモデルに対するリクエストとみなす

ツール別最大利用量

エクスプローラツールごとに利用できる最大 QPM、TPMは次の通りです。

区分 QPM TPM 備考
要約 60 60,000 TPM計算時の入力値のみ含む
段落分け 360 -
エンベディング 300 -
エンベディング v2 540 960,000 TPM計算時の入力値のみ含む
リランカー 120 180,000
RAG Reasoning 180 120,000

スキルトレーナーの最大利用量

スキルトレーナーで利用できる最大 QPMは、次の通りです。

区分 QPM 備考
スキルセット回答作成 90 タスクとバージョンを区分しない
ルーター 180 タスクとバージョンを区分しない

最大利用量の確認

cURL、Pythonなどを介して APIを呼び出して CLOVA Studioサービスを利用する場合、APIレスポンスヘッダを通じて利用量制限に関する情報を確認できます。

確認できる情報は次の通りです。

Key Value(例) 説明 備考
x-ratelimit-limit-requests 60 利用中の APIに設定された最大利用量(QPM)
x-ratelimit-limit-tokens 10000 利用中の APIに設定された最大利用量(TPM) TPM利用量制限がある場合に含む
x-ratelimit-remaining-requests 59 利用中の APIに設定された最大利用量に到達するまでの残り利用量(リクエスト数)
x-ratelimit-remaining-tokens 9462 利用中の APIに設定された最大利用量に到達するまでの残り利用量(トークン数) TPM利用量制限がある場合に含む
x-ratelimit-reset-requests 23s 利用中の APIに設定された最大利用量(リクエスト数)の初期値リセットまでの残り時間
x-ratelimit-reset-tokens 23s 利用中の APIに設定された最大利用量(トークン数)の初期値リセットまでの残り時間 TPM利用量制限がある場合に含む

最大利用量の管理

CLOVA Studioサービス利用時にリクエストできる最大値を超過した場合、HTTP 429コードが返されたり、エラーメッセージが表示されます。最大利用量を超過しないために実行できるタスクを説明します。

参考

CLOVA Studioは安定かつ円滑なサービスを提供するために最善を尽くしていますが、最大リクエスト数以内でサービスを利用する場合も、一部の処理遅延が発生したり、失敗することがあります。

QPM管理方法

  • QPM数値を予め確認した後、最大値以内でリクエストします。
  • 別途の API呼び出しコントロール機能(rate limit)を直接実現・追加します。
  • リクエスト間に一定時間の遅延処理機能(time sleep)を別途追加します。
  • HTTP 429コードが返されて、当該エラーメッセージに対してレスポンスする時に、例外処理を通じて一定時間が経った後に再度リクエストします。

TPM管理方法

  • TPM数値を予め確認し、タスクのために入力するトークン数と結果値の作成時に使用する最大トークン数を実際に必要な分だけ設定します。
  • API呼び出し時に入力した文字列のトークン数を確認するには、エクスプローラメニューのトークン計算機 APIを活用します。
  • API呼び出しの際に結果値に使用する最大トークン数を調整したい場合は、 maxTokens または maxCompletionTokens フィールドの値を変更してください。
  • プレイグラウンドメニューで入力された文字列のトークン数を確認するには、プレイグラウンド画面上部の計算アイコンをクリックします。
    clovastudio-ratelimiting_tpm-mitigation01-1_ko
  • プレイグラウンドメニューで結果値を作成する時に使用する最大トークン数を調整するには、プレイグラウンド画面左側の Max tokensフィールドを変更します。
    clovastudio-ratelimiting_tpm-mitigation02_ko