CLOVA Studio 개념

Classic/VPC 환경에서 이용 가능합니다.

CLOVA Studio를 이용하는 전체 시나리오를 학습하기에 앞서 CLOVA Studio에 대한 몇 가지 개념을 설명합니다.

프롬프트와 결괏값

프롬프트는 CLOVA Studio에서 작업을 수행하기 위해 입력해야 할 내용을 의미합니다. CLOVA Studio에서 입력한 프롬프트를 기반으로 HyperCLOVA X 언어 모델이 결괏값을 생성합니다. HyperCLOVA X 언어 모델은 확률을 기반으로 작동하기 때문에 같은 프롬프트를 입력하더라도 다른 결괏값이 생성될 수 있습니다.
<예시> 프롬프트에 '원숭이 엉덩이는 빨개'를 입력한 경우, 높은 확률로 '빨간 건 사과, 사과는 맛있어'라는 결괏값이 생성됩니다.

토큰

토큰은 자연어 처리를 위해 하나의 단어를 세분화한 단어 조각을 의미합니다. 대개 한국어 단어는 형태소 단위의 1~2 토큰으로 나뉩니다. HyperCLOVA X 언어 모델이 학습한 내용에 맞춰 토큰을 나누기 때문에 동일한 표현이 항상 같은 토큰으로 이루어져 있지는 않습니다.
<예시> '맛있어'라는 표현은 각각 '맛'과 있어'라는 두 개의 토큰으로 나뉠 수 있습니다.

확률 기반 언어 모델

확률 기반 언어 모델은 확률을 기반으로 다음에 나올 단어를 예측할 수 있는 언어 모델을 의미합니다. CLOVA Studio에서 사용하는 HyperCLOVA X 언어 모델은 확률 기반 언어 모델로, 확률을 기반으로 결괏값을 생성합니다.
<예시> 프롬프트에 자연을 묘사해달라고 입력한 경우, 결괏값의 첫 토큰이 '저'로 선택되었다면 뒤에 올 단어로 '나무', '꽃', '산'을 예측할 수 있습니다. 이때, 각 단어마다 확률이 존재하며 HyperCLOVA 언어 모델은 이 중에서 가장 확률이 높은 '나무'와 '에'를 선택하여 '저 나무에'라는 결과를 생성하는 원리로 작동합니다.

파라미터

파라미터는 문구를 생성하기 위해 플레이그라운드에서 설정하는 값으로, 플레이그라운드의 왼쪽 사이드바에서 설정할 수 있습니다. 파라미터 항목은 다음과 같습니다.

Model

Model(이하 모델)은 CLOVA Studio에서 문구를 생성할 때 사용하는 언어 모델입니다. CLOVA Studio는 복잡한 문제를 깊이 이해하고 추론에 특화된 HCX-007, 경량화된 HCX-DASH-002 모델, 이미지 해석 및 이해가 가능한 멀티모달 모델 HCX-005를 제공합니다. 플레이그라운드와 Chat Completions v3 API를 통해 사용할 수 있습니다.

Thinking

Thinking은 모델이 최종 응답을 생성하기 전, 질문에 대한 이해와 해결을 위한 추론 과정을 수행하는 방식입니다. 이 과정을 통해 모델이 응답에 도달하기까지의 판단 흐름이나 근거를 확인할 수 있습니다. Thinking의 길이는 ‘짧게’, ‘보통’, ‘길게’ 옵션으로 조절할 수 있으며, 작업의 복잡도나 목적에 따라 적절한 수준으로 설정할 수 있습니다. 복잡한 문제를 나누고, 관련 지식을 결합해 해결 방향을 찾아가는 과정이 추론을 통해 이루어집니다. HCX-007 모델 선택 시에만 활성화됩니다.

Top P

Top P는 선택 확률 값이 높은 토큰을 순서대로 나열한 후 설정한 누적 확률 값에 포함되지 않는 토큰을 제거할 때 사용하는 기준값입니다. Top P는 특수한 경우가 아니라면 0.8~1로 설정하는 것을 권장합니다.
<예시> Top P=0.8인 경우, 누적 확률 값이 상위 80%에 포함된 토큰만 후보로 선택합니다.

Top K

Top K는 자연어 처리 모델이 예측한 토큰의 선택 확률 분포에서 확률 값이 가장 높은 K개 중에서 하나를 선택할 때 사용하는 기준 값입니다. Top K는 특수한 경우가 아니라면 0으로 설정하는 것을 권장합니다.
<예시> Top K=5인 경우, 가장 확률 값이 높은 5개의 토큰 중에서 하나의 토큰이 선택됩니다. 이때, 가장 확률 값이 높은 토큰이 선택될 가능성이 크지만 경우에 따라 확률 값이 더 낮은 토큰이 선택될 수도 있습니다.

Max tokens

Max tokens는 결괏값을 생성할 때 사용할 최대 출력 토큰 수입니다. 토큰 수를 높게 설정할수록 긴 결괏값을 출력합니다.

모델	허용 범위
HCX-007	입력 토큰과 출력 토큰의 합계는 최대 128,000 토큰까지 가능 입력 토큰은 최대 128,000 토큰까지 가능 모델에게 요청할 출력 토큰(`maxCompletionTokens`, 추론을 위한 생성 토큰 포함)은 최대 32,768 토큰까지 설정
HCX-005	입력 토큰과 출력 토큰의 합계는 최대 128,000 토큰까지 가능 입력 토큰은 최대 128,000 토큰까지 가능 모델에게 요청할 출력 토큰(`maxTokens`)은 최대 4,096 토큰까지 설정
HCX-003	입력 토큰과 출력 토큰의 합계는 최대 8,192 토큰까지 가능 입력 토큰은 최대 7,600 토큰까지 가능 모델에게 요청할 출력 토큰(`maxTokens`)은 최대 4,096 토큰까지 설정
HCX-DASH-002	입력 토큰과 출력 토큰의 합계는 최대 32,000 토큰까지 가능 입력 토큰은 최대 32,000 토큰까지 가능 모델에게 요청할 출력 토큰(`maxTokens`)은 최대 4,096 토큰까지 설정
HCX-DASH-001	입력 토큰과 출력 토큰의 합계는 최대 4,096 토큰까지 가능 입력 토큰은 최대 3,500 토큰까지 가능 모델에게 요청할 출력 토큰(`maxTokens`)은 최대 4,096 토큰까지 설정

Max tokens 설정값은 작업에 따라 달라질 수 있습니다. 실제 필요한 결괏값 토큰 수 대비 과도하게 설정될 경우 불필요한 출력 길이로 인해 예상치 못한 과금이 발생하거나 처리 시간이 길어질 수 있으며, (CLOVA Studio 이용량 제어 정책)의 TPM 최대 이용량 초과로 인한 요청 미처리가 보다 빈번하게 발생할 수 있습니다.

Temperature

Temperature는 확률 분포에 가중치 변화를 주어 문장의 다양성을 조절하는 값입니다. Temperature를 낮게 설정하면 후보에 포함된 토큰의 순위는 바뀌지 않지만 확률이 높았던 토큰은 더욱 확률 값이 높아지고 낮았던 토큰은 확률 값이 더욱 낮아집니다. 가장 높은 순위의 토큰이 선택될 가능성이 크기 때문에 정형적인 결괏값을 생성합니다. 반면에 Temperature를 높게 설정하면 각 토큰의 확률 값의 차이가 좁혀져 다양한 문장이 만들어질 수 있지만, 규칙에서 조금 벗어나는 문장을 생성하기도 하고 문장의 품질이 다소 떨어질 수도 있습니다. 따라서, Top P 값을 고정한 상태에서 Temperature를 필요에 따라 조절하는 것을 권장합니다.

Temperature 값이 낮은 경우
Temperature 값이 높은 경우

Repetition penalty

Repetition penalty는 언어 모델이 문구를 생성할 때 반복적인 결괏값을 생성하지 않도록 반복되는 토큰에는 감점 요소를 부여하는 값입니다. Repetition penalty가 높을수록 같은 결괏값을 반복적으로 생성할 확률이 감소합니다. 1.0~1.1 범위에서 0.05 단위로 미세 조정하는 것을 권장합니다.

Stop sequences

Stop sequences는 결과 생성을 중단할 때 쓸 문자열입니다. Stop sequences는 여러 개 등록할 수 있으며, 언어 모델이 결과를 생성할 때 Stop sequences 중 하나가 결과에 포함되면 그 이전까지의 내용만 출력됩니다.
<예시> 프롬프트를 '원숭이 엉덩이는 빨개'로 입력하고 Stop sequences에 '사과'라는 문자열을 추가하면 결괏값은 '빨간 건'까지만 출력되며, '사과'부터는 출력되지 않습니다.

Seed

Seed는 결과물의 일관성을 조정하는 값입니다. Seed의 값이 동일하면 확률 기반의 언어 모델을 여러 번 실행하더라도 동일한 결과를 얻을 수 있습니다.
단, 결과물의 완전성을 보장하지 않으며 다른 조건을 미세하게 조정하면 결과는 조금씩 달라질 수 있습니다.
Seed의 값을 '0'으로 지정할 경우, 결과는 무작위로 출력됩니다.

튜닝

튜닝은 사전 학습된 모델 파라미터 일부를 사용자 목적에 맞게 변형하고, 사용자 데이터에 대해 모델 일부를 재학습하는 방식입니다. 사용자는 일정량의 학습/검증 데이터셋을 투입하여 튜닝을 통해 원하는 작업 종류 및 데이터에 최적화된 모델을 학습하고 테스트할 수 있습니다. 이렇게 업데이트된 모델을 API화하여 새로운 데이터 및 다양한 목적에 맞게 활용할 수 있습니다.

작업

작업은 튜닝을 수행하는 기준 단위입니다. 사용자는 하나의 작업당 하나의 작업 종류, 언어, 모델을 각각 선택하게 됩니다. 이후 사용자 데이터셋을 통해 학습을 진행하여 작업 종류, 데이터셋에 가장 최적화된 모델을 생성할 수 있습니다.

Function calling

언어 모델이 스스로 해결할 수 없는 질문에 정확한 답변을 제공할 수 있도록 외부 시스템이나 API에서 필요한 정보를 가져오는 기능입니다. API, 스크립트, 오픈 소스 라이브러리, 데이터베이스, 로컬 PC 및 클라우드에 저장된 파일 등 다양한 리소스와 연동하여 고객의 다양한 요구 사항에 대한 유연한 처리 가능합니다. 외부에서 정보를 가져온다는 점에서 스킬과 유사해 보이지만 스킬은 스킬 트레이너 내에 API를 직접 등록하여 최종 답변까지 생성하는 반면, Function calling은 언어 모델이 판단한 결괏값을 기반으로 외부 API를 직접 호출하는 방식으로 사용자 질문에서 필요한 파라미터만 전달받아 활용합니다.

Structured Outputs

Structured Output은 언어 모델이 비구조화된 텍스트 대신, 사용자가 정의한 JSON Schema 규격에 맞춰 구조화된 데이터를 생성하는 기능입니다. 사용자가 응답 형식(필드명, 데이터 타입, 유효 범위 등)을 상세하게 명시하여 스키마를 정의하면, 모델은 이를 기반으로 정확한 JSON 객체를 생성합니다. 이를 통해 생성된 데이터는 간단한 검증만으로 API 요청 바디, 데이터베이스 입력값, 시스템 로그 등 다양한 용도에 즉시 활용할 수 있으며, 후처리에 필요한 리소스를 효과적으로 줄일 수 있습니다.

서비스 앱

서비스 앱은 외부에 배포하거나 상용 환경에서 활용할 수 있도록 구성된 앱을 의미합니다. 서비스 앱으로 등록하기 위해서는 별도의 신청 및 발급 절차를 거쳐야 합니다. 이용량 제어 정책에 의거하여 서비스 앱 여부에 따라 최대 이용 가능한 요청 횟수 및 토큰 사용량이 달라지며, 해당 정책은 서비스의 안정성과 공정한 자원 사용을 보장하기 위해 적용됩니다.