CLOVA Studio の用語

Classic/VPC環境で利用できます。

CLOVA Studioを使用するために、必ず知っておくべきいくつかの用語があります。用語とその説明は、次の通りです。

回答(結果値) · Completion

会話(Conversation)における質問に対する回答として、モデルが応答すべきと期待される発話内容(String)

データセット · Datasets

チューニングに使用する学習と検証データ

ドメイン · Domain

ルーターがユーザーのリクエストを分類する際の基準となるカテゴリ

ルーター · Router

ユーザーのリクエストを分類してフィルタリングする機能

ラングチェーン · LangChain

複数の言語モデルとツールを接続し、アプリケーションの簡単な開発に役立つオープンソースフレームワーク

モデル · Model

結果値の作成時に使用する言語モデルまたは視覚言語モデル

サービスアプリ · Service app

CLOVA Studio APIを実際のサービスに反映させるには、サービスアプリを申し込む必要があり、別途の最大利用量が存在

セーフティフィルタ · Safety filter

ルーターの特定ドメイン内の非倫理的または機密性の高い内容を検出するフィルタ

スキル · Skill

ユーザーの会話入力に対して回答する APIを選択し、必要なリクエストパラメータを作成して APIを呼び出すことで、監視結果基盤の自然言語回答を作成するツール

スキルセット · Skillset

スキルの集まりで、同じグループ内のスキルは同じスキルセットで構成

システムプロンプト · System prompt

モデルに全体的な指針やロールを付与する初期設定値

推論 · Thinking

最終回答を直接作成せずユーザーの質問を分析し、必要な論理的思考プロセスを経て推論内容(トークン)を作成した後、その内容を基に最終回答を作成する機能

画像理解モデル

自然言語だけでなく画像も理解するモデル

利用量制限ポリシー

サービスの可用性と安定性確保のため、APIリクエスト回数とトークン数に上限を設けて制限をかけるポリシー

エクスプローラ · Explorer

段落分け、スライドウィンドウ、エンベディング、要約などの AI基盤サービス実装に必要な様々な APIを活用できる空間

エンベディング · Embedding

テキストを数値で表現するベクトル化タスクを行い、RAGの実装や文書のインデックスタスクに活用できる API

コンテンツフィルタ · Content filter

ルーターの特定ドメイン内で例外的にブロックする必要がある対象を検出するフィルタ

クエリ · Query

ユーザーが AIに入力する質問やリクエスト

トークン · Token

自然言語処理のために1つの単語を細分化した単語のパーツ

チューニング · Tuning

ユーザーデータセットを学習させ、ユーザーに最適化されたモデルを作成する方法

パラメータ · Parameter

モデルが作成する結果値に影響を与える様々な設定値

プレイグラウンド · Playground

ユーザーがプロンプトを入力して AIを直接テストし、実験できる空間

学習 · Task(s)

チューニングを行う基準単位

確率的言語モデル

確率に基づいて次に出てくる単語を予測できる言語モデルであり、CLOVA Studioでは HyperCLOVA Xモデルを使用

APIキー

CLOVA Studio API使用時に利用権限を検証する認証キー

Chat Completions

HyperCLOVA Xモデルを使用して会話型出力を提供する API

Context length

モデルが1回のリクエストで処理できる入力と出力トークンの合計

Function calling

モデルが外部関数や APIを呼び出して動的に情報を取得したり、タスクを実行できるようにする機能

RAG (Retrieval Augmented Generation)

モデルがレスポンスを作成する前に信頼できる外部知識ベースを検索し、回答に幻覚を減らして正確な情報を反映させる方法

Instructionデータセット

HyperCLOVA Xモデルのチューニングに使用する会話型データセット構造

Max tokens

モデルにリクエストする出力トークンの設定パラメータ

QPM (Queries per Minute)

1分間 APIを通じてリクエストできるクエリ数を意味し、QPMを超える場合は呼び出しを制限

Structured Outputs

ユーザーが定義した JSON Schema規格に合わせて構造化されたデータを作成する機能

Temperature

確率分布に重み付けの変化を与え、文章の多様性を調整する値

Top K

自然言語処理モデルが予測したトークンの選択確率分布において、確率値が最も高い K個の中で1つを選択する際に使用する基準値

Top P

選択確率値が高いトークンを順に並べた後、設定した累積確率値に含まれないトークンを除去する際に使用する基準値

TPM (Tokens per Minute)

1分間 APIを通じてリクエストできるトークン数を意味し、TPMを超える場合は呼び出しを制限

参考

その他の用語を確認するには、NAVERクラウドプラットフォームポータルの用語辞典をご参照ください。