- 印刷する
- PDF
CLOVA Studio 使用料制限ポリシー
- 印刷する
- PDF
最新のコンテンツが反映されていません。早急にアップデート内容をご提供できるよう努めております。最新のコンテンツ内容は韓国語ページをご参照ください。
Classic/VPC環境で利用できます。
CLOVA Studioはユーザーが特定時間内に使用できる APIリクエスト数とトークン数に制限を設けています。これを使用料制限ポリシーと呼び、サービスの可用性を保ち安定性と確保するために必要なポリシーです。ユーザーは決められたスコープ内で CLOVA Studioサービスを利用でき、リクエスト可能な最大値を超過する場合はエラーメッセージやエラーコードが返されます。
使用料制限ポリシーを適用するとこで悪意を持って APIを多量呼び出して攻撃する行為を防ぐことができ、過剰なトラフィックからサービスを保護できます。また特定ユーザーがリソースを独占することを防ぎ、すべてのユーザーがリソースを安定的に使用できる環境を構成できます。モデル、ツール、目的に応じて使用できる最大値が変わるため、このガイドで案内する内容を必ず熟知してください。
- このガイドで案内する最大使用量は、ユーザーが CLOVA Studioサービスを利用する際にリクエストできる最大値を明示したもので、その値だけのリクエスト量を必ず保証するという意味ではありません。最大使用量以内でサービスを利用するとしてもインフラ状況やトラフィックによって対応に遅延が発生したり、失敗したりすることがあります。
- 最大使用量は後で変更されることがあります。最大使用量が変更される場合、利用顧客に別途ご案内する予定です。
- 一定レベルの使用量が必ず保証される必要がある場合は、ベットのプランをご利用できます。最大使用量を保証するプランおよびポリシーについての詳細は、お問い合わせまでお問い合わせください。
適用基準
最大使用量を算定時に基準となる対象は、次の通りです。
区分 | 説明 |
---|---|
ユーザーアカウント | メインアカウントを基準に最大使用量を算定 |
モデルとツール | 利用するモデルやツールに応じて使用量が変わる |
利用目的 | テストアプリかサービスアプリかによって最大使用量が変わる |
最大使用量
CLOVA Studioで使用量が制限される数値は、1分当たりのリクエスト回数である QPMと1分当たりの処理トークン数を意味する TPMです。QPMと TPMがすべて適用される場合、2つの値のうち1つでも最大値に達するとエラーコードが返されます。
QPMと TPMに関する説明は、次の通りです。
区分 | 説明 |
---|---|
QPM (Queries per Minute) | 1分間モデルやツールにタスクをリクエストした回数 |
TPM (Tokens per Minute) | 1分間処理したトークン数maxTokens ) |
2024/03/21を基準にサポートできる最大使用量であり、後で変わる可能性があります。
CLOVA Studioウェブおよびテストアプリ
CLOVA Studioプレイグラウンドとテストアプリで利用できる最大の QPM、TPMを説明します。
モデル別最大使用量
モデル別に使用できる最大 QPM、TPMは、次の通りです。
区分 | QPM | TPM |
---|---|---|
HCX-003 | 60 | 10,000 |
LK-D2 | 60 | 10,000 |
LK-B | 60 | 10,000 |
その他のモデル | 60 | 10,000 |
チューニングモデル | チューニング時に使われたモデルに対するリクエストとみなす |
その他のモデルには LK-C、LK-D、LE-C、HCX-002などが含まれますが、後で変わる可能性があります。
サービスアプリ
サービスアプリでモデル別、ツール別に利用できる最大 QPMと TPMを説明します。
サービスアプリの使用可能な最大 QPM、TPMの計算時にウェブおよびテストアプリの最大使用量も含まれます。したがって明示された最大値で使用するには、サービスアプリとテストアプリを同時に運用する必要があり、サービスアプリを単独で運用する場合はテストアプリの最大使用量を差し引いた値が適用されます。
モデル別最大使用量
モデル別に使用できる最大 QPM、TPMは、次の通りです。
モデル | QPM | TPM |
---|---|---|
HCX-003 | 240 | 50,000 |
LK-D2 | 420 | 60,000 |
LK-B | 360 | 60,000 |
その他のモデル | 240 | 30,000 |
チューニングモデル | チューニング時に使われたモデルに対するリクエストとみなす |
その他のモデルには LK-C、LK-D、LE-C、HCX-002などが含まれますが、後で変わる可能性があります。
最大使用量の管理
CLOVA Studioサービス利用時にリクエストできる最大値を超過した場合、HTTP 429コードが返されたり、エラーメッセージが表示されたりします。最大使用量を超過しないために実行できるタスクを説明します。
CLOVA Studioは安定かつ円滑なサービスを提供するために最善を尽くしていますが、最大リクエスト数以内でサービスを利用する場合も、一部の処理遅延が発生したり、失敗したりすることがあります。
QPM管理方法
- QPM数値を予め確認した後、最大値以内でリクエストします。
- 別途の API呼び出しコントロール機能(rate limit)を直接実現および追加します。
- リクエスト間に一定時間の遅延処理機能(time sleep)を別途追加します。
- HTTP 429コードが返されて、当該エラーメッセージに対してレスポンスする時に、例外処理を通じて一定時間が経った後に再度リクエストします。
TPM管理方法
- TPM数費を予め確認し、タスクのために入力するトークン数と結果値の作成時に使用する最大トークン分割を実際に必要な分だけ設定します。
- API呼び出し時に入力した文字列のトークン数を確認するには、 エクスプローラー メニューのトークン計算機 APIを活用します。
- API呼び出し時に結果値に使用する最大トークン数を調整するには、
maxTokens
フィールドの値を編集します。 - プレイグラウンド メニューで入力された文字列のトークン数を確認するには、プレイグラウンド画面上部の計算 アイコンをクリックします。
- プレイグラウンド メニューで結果値を作成する時に使用する最大トークン数を調整するには、プレイグラウンド画面左側の Maximum tokens フィールドを編集します。