CLOVA Studio 이용량 제어 정책
    • PDF

    CLOVA Studio 이용량 제어 정책

    • PDF

    Article Summary

    Classic/VPC 환경에서 이용 가능합니다.

    CLOVA Studio는 사용자가 특정 시간 내에 이용할 수 있는 API 요청 횟수와 토큰 수에 상한선을 두고 있습니다. 이를 이용량 제어 정책이라 하며 서비스의 가용성을 유지하고 안정성을 확보하기 위해 필요한 정책입니다. 사용자는 정해진 범위 내에서 CLOVA Studio 서비스를 이용할 수 있고, 요청 가능한 최댓값을 초과할 경우에는 오류 메시지 및 오류 코드가 반환됩니다.
    이용량 제어 정책을 적용함으로써 악의적으로 API를 다량 호출하여 공격하는 행위를 막을 수 있고 과도한 트래픽으로부터 서비스를 보호할 수 있습니다. 또한 특정 사용자가 리소스를 독점하는 것을 방지하여 모든 사용자가 리소스를 안정적으로 사용할 수 있는 환경을 구성할 수 있습니다. 모델, 도구, 목적에 따라 이용할 수 있는 최댓값이 달라지므로 이 가이드에서 안내하는 내용을 반드시 숙지해 주십시오.

    참고
    • 이 가이드에서 안내하는 최대 이용량은 사용자가 CLOVA Studio 서비스 이용 시 요청할 수 있는 최댓값을 명시한 것으로, 해당 값만큼의 요청량을 반드시 보장한다는 의미는 아닙니다. 최대 이용량 이내로 서비스를 이용하더라도 인프라 상황 및 트래픽에 따라 처리 지연이 발생하거나 실패할 수 있습니다.
    • 최대 이용량은 추후 변경될 수 있습니다. 최대 이용량이 변경될 경우, 이용 고객에게 별도로 안내할 예정입니다.
    • 일정 수준의 이용량이 반드시 보장되어야 하는 경우에는 별도의 플랜을 이용할 수 있습니다. 최대 이용량을 보장하는 플랜 및 정책과 관련하여 더 자세한 정보가 필요할 경우, 고객 문의로 문의해 주십시오.

    적용 기준

    최대 이용량 산정 시 기준이 되는 대상은 다음과 같습니다.

    구분설명
    사용자의 계정메인 계정을 기준으로 최대 이용량 산정
  • 서브 계정이 있는 경우, 서브 계정의 이용량도 메인 계정의 이용량에 포함
  • 모델 및 도구이용하는 모델 및 도구에 따라 최대 이용량이 달라짐
  • 튜닝 모델로 작업할 경우, 튜닝 시 사용된 모델에 대한 요청으로 간주하여 최대 이용량 산정
  • 이용 목적테스트 앱이냐 서비스 앱이냐에 따라 최대 이용량이 달라짐

    최대 이용량

    CLOVA Studio에서 이용량이 제한되는 수치는 분당 요청 횟수인 QPM과 분당 처리 토큰 수를 의미하는 TPM입니다. QPM과 TPM이 모두 적용되는 경우, 두 개의 값 중 하나라도 최댓값에 먼저 도달하면 오류 코드가 반환됩니다.
    QPM과 TPM에 대한 설명은 다음과 같습니다.

    구분설명
    QPM (Queries per Minute)1분 동안 모델 및 도구에 작업을 요청한 횟수
    TPM (Tokens per Minute)1분 동안 처리할 토큰 수
  • 처리할 토큰 수=입력된 토큰 수+결괏값 생성 시 사용할 최대 토큰 수(maxTokens)
  • 참고

    2024년 4월 25일 기준으로 지원 가능한 최대 이용량으로, 추후 변동될 수 있습니다.

    CLOVA Studio 웹 및 테스트 앱

    CLOVA Studio 플레이그라운드와 테스트 앱에서 이용 가능한 최대 QPM, TPM을 설명합니다.

    모델별 최대 이용량

    모델별로 이용 가능한 최대 QPM, TPM은 다음과 같습니다.

    구분QPMTPM
    HCX-0036010,000
    HCX-DASH-00110020,000
    LK-D26010,000
    LK-B6010,000
    튜닝 모델튜닝 시 사용된 모델에 대한 요청으로 간주

    서비스 앱

    서비스 앱에서 모델별, 도구별로 이용 가능한 최대 QPM과 TPM을 설명합니다.
    서비스 앱의 이용 가능한 최대 QPM, TPM 계산 시 웹 및 테스트 앱의 최대 이용량도 포함됩니다. 따라서 명시된 최댓값으로 이용하려면 서비스 앱과 테스트 앱을 동시에 운영해야 하며, 서비스 앱 단독 운영 시에는 테스트 앱의 최대 이용량을 뺀 값이 적용됩니다.

    모델별 최대 이용량

    모델별로 이용 가능한 최대 QPM, TPM은 다음과 같습니다.

    모델QPMTPM
    HCX-00330060,000
    HCX-DASH-00140080,000
    LK-D242060,000
    LK-B36060,000
    튜닝 모델튜닝 시 사용한 모델에 대한 요청으로 간주

    최대 이용량 관리

    CLOVA Studio 서비스 이용 시 요청할 수 있는 최댓값이 초과될 경우, HTTP 429 코드가 반환되거나 오류 메시지가 나타납니다. 최대 이용량을 초과하지 않기 위해 수행할 수 있는 작업을 설명합니다.

    참고

    CLOVA Studio는 안정적이고 원활한 서비스를 제공하기 위해 최선을 다하고 있으나 최대 요청량 이내로 서비스를 이용할 경우에도 일부 처리 지연이 발생하거나 실패할 수 있습니다.

    QPM 관리 방법

    • QPM 수치를 미리 확인한 후 최댓값 이내로 요청해 주십시오.
    • 별도의 API 호출 제어 기능(rate limit)을 직접 구현 및 추가해 주십시오.
    • 요청 사이에 일정 시간 지연 기능(time sleep)을 별도로 추가해 주십시오.
    • HTTP 429 코드 반환 및 해당 오류 메시지 응답 시 예외 처리를 통해 일정 시간 지연 이후 재요청해 주십시오.

    TPM 관리 방법

    • TPM 수치를 미리 확인하여 작업을 위해 입력하는 토큰 수와 결괏값 생성 시 사용할 최대 토큰 수를 실제로 필요한 정도만 설정해 주십시오.
    • API 호출 시 입력한 문자열의 토큰 수를 확인하려면 익스플로러 메뉴의 토큰 계산기 API를 활용해 주십시오.
    • API 호출 시 결괏값에 사용할 최대 토큰 수를 조정하려면 maxTokens 필드의 값을 수정해 주십시오.
    • 플레이그라운드 메뉴에서 입력된 문자열의 토큰 수를 확인하려면 플레이그라운드 화면 상단의 계산 아이콘을 클릭해 주십시오.
      clovastudio-ratelimiting_tpm-mitigation01_ko
    • 플레이그라운드 메뉴에서 결괏값 생성 시 사용할 최대 토큰 수를 조정하려면 플레이그라운드 화면 왼쪽에 있는 Maximum tokens 필드를 수정해 주십시오.
      clovastudio-ratelimiting_tpm-mitigation02_ko

    이 문서가 도움이 되었습니까?

    Changing your password will log you out immediately. Use the new password to log back in.
    First name must have atleast 2 characters. Numbers and special characters are not allowed.
    Last name must have atleast 1 characters. Numbers and special characters are not allowed.
    Enter a valid email
    Enter a valid password
    Your profile has been successfully updated.