長文認識ビルダ

Prev Next

Classic/VPC環境で利用できます。

CLOVA Speechのビルダを使用すると、UI環境で音声認識タスクをリクエストして管理できます。ビルダはドメインごとに提供され、ビルダでは以下のようなメニューを使用できます。

  • タスクリストメニュー: 認識タスクの登録と管理、タスク結果の編集とエクスポート
  • キーワードブーストメニュー: 認識確率を高めたい単語をキーワードに登録し、そのキーワードを管理
  • 設定メニュー: ドメイン情報の確認
参考

ドメインタイプに応じて一部機能は表示されない場合があります。

ビルダ実行

ビルダを実行する方法は、次の通りです。

参考

ビルダを使用するには、まずドメインを作成します。ドメイン作成に関する詳細は、ドメイン作成をご参照ください。

  1. NAVERクラウドプラットフォームコンソールで、 Menu > Services > AI Services > CLOVA Speechメニューを順にクリックします。
  2. 長文認識タイプの Domainメニューをクリックします。
  3. ビルダを実行するドメインの [ビルダ実行] ボタンをクリックします。

認識タスクのリクエストと管理

ビルダのタスクリストメニューでは認識タスクをリクエストし、各タスクのステータスを確認できます。また、認識結果を変更するエディタを使用すると、認識結果を編集して任意の形式でエクスポートできます。

タスクリスト画面

ビルダを利用するためのタスクリストメニューの基本的な説明は、次の通りです。
clovaspeech-builder_list2_ko

領域 説明
① メニュー名 現在確認中のメニュー名
② タスク管理機能 認識タスクリクエスト、削除、エクスポート、再認識
③ 検索ボックス タスク対象ファイル名または結果ファイルの保存場所でタスク検索
④ タスクリスト 照会中の認識タスクリスト

認識タスクリストの確認

ビルダで登録した認識タスクの情報を確認する方法は、次の通りです。

  1. ドメインのビルダでタスクリストメニューをクリックします。
  2. タスクリストが表示されたら、認識タスクの情報を確認します。
    • タスク対象: 認識タスク対象のメディアファイル名
    • 言語: 認識タスクに使用する言語
    • タスク状況: タスクの現在の状態で、次のうち1つに表示
      タスク状況 説明
      タスク待機
      タスク中
      キャンセル完了
      キャンセル中
      タスク失敗
      タスク完了
    • リクエスト方法: タスクファイルのアップロード方式
      • Object Storageで選択の場合、i-clovaspeech-windowをクリックして Object Storageコンソール画面に移動可能
    • 結果ファイルの保存場所: 結果ファイルを保存する Object Storageのパス
      • i-clovaspeech-windowをクリックして Object Storageコンソール画面に移動可能
    • タスク開始日(UTC+09:00): タスクを開始した日時
    • タスク終了日(UTC+09:00): タスクを終了した日時
    • 認識結果の編集: [認識結果編集] ボタンをクリックして認識結果を変更するエディタを実行(認識結果を変更するエディタの使用を参照)

認識タスクのリクエスト

ビルダで認識タスクをリクエストする方法は、次の通りです。

  1. ドメインのビルダでタスクリストメニューをクリックします。
  2. [認識タスクのリクエスト] ボタンをクリックします。
  3. 認識対象ファイルをアップロードする方法に適したタブをクリックします。
    • [Object Storageで選択] タブ: ドメインの認識対象の保存パスとサブパスでファイルを選択
    • [ファイルアップロード] タブ: ローカル PCにあるファイルを選択
  4. タスク情報を入力します。
    • 結果ファイルの保存場所: 結果ファイルを保存する Object Storageのパスを選択
      • ドメインの結果ファイルの保存パスとサブパスを選択可能
    • 言語設定: 認識タスクに使用する言語を選択
    • 話者分離機能の使用: 話者分離機能の使用有無を選択
    • イベント検知: 音源で発生したイベント(拍手、笑、音楽)の認識有無を選択
    • キーワードブースト: キーワードブーストの使用有無を選択(キーワードブーストに関する詳細はキーワードブーストを参照)
  5. 認識対象のファイルをアップロードします。
    • [Object Storageで選択] タブを選択した場合: 対象ファイル選択領域でファイルを選択
      • フォルダをダブルクリックしてフォルダ内のファイルを確認できます。
    • [ファイルアップロード] タブを選択した場合: **マウスでファイルをドラッグするか、ここをクリックしてください。**領域にファイルをドラッグするか、マウスでファイルをドラッグするか、ここをクリックしてください。をクリックした後、ファイルを選択
  6. [リクエスト開始] ボタンをクリックします。
    • タスクが完了したら、結果ファイルの保存場所のパスで認識結果ファイル(JSON)を確認可能
参考

1つの音源で認識できる話者の最大数は10人です。
再認識機能を使用する場合、同じ音源に対する認識タスクを再度リクエストする必要はありません。

認識結果を変更するエディタの使用

認識タスクが完了すると、認識結果を変更するエディタを実行して認識対象のメデイアファイルと認識されたテキストを一緒に確認できます。また、認識結果を編集して任意の形式でエクスポートできます。

認識結果の編集画面

認識結果を変更するエディタを実行すると、認識結果の編集画面が表示されます。認識結果の編集画面における基本的な説明は、次の通りです。
clovaspeech-long-demo_ko

領域 説明
エクスポート 編集した結果をエクスポート
② 認識対象のファイル
  • 認識対象ファイルを再生/停止
  • 認識対象ファイルと認識されたテキスト情報を表示
③ フィルタ 話者と信頼性を基準に認識結果をフィルタリング
④ 音声認識結果
  • 認識されたテキストをタイムライン形式で表示
  • 認識された話者とテキストを変更可能
⑤ イベント検知結果
  • 認識されたイベント(拍手、笑、音楽)をタイムライン形式で表示
  • 認識されたイベントを変更可能
⑥ 再生機能 認識対象ファイルの再生と音量調整

認識結果の編集およびエクスポート

認識結果を変更するエディタで認識結果を編集して任意の形式にエクスポートする方法は、次の通りです。

参考

認識結果のエクスポートを通じて一度に複数のタスク結果ファイルをエクスポートできます。

  1. ドメインのビルダでタスクリストメニューをクリックします。
  2. タスクリストで完了したタスクの [認識結果編集] ボタンをクリックします。
  3. 認識結果の編集画面で認識結果を確認します。
    • メディアファイルを再生する時に、タイムラインで現在再生中の音声に該当するテキストを強調して表示
    • [話者名] ボタン: クリックして話者を基準に認識されたテキストをフィルタリング
    • [認識結果信頼性] ボタン: クリックして認識結果信頼性を基準に認識されたテキストをフィルタリング
  4. 必要に応じて、認識結果を編集します。
    • 話者編集: ドロップダウンメニューをクリックした後、当該テキストの話者を編集
      • i-clovaspeech-speakerdelete: クリックして話者を削除
      • i-clovaspeech-speakeredit: クリックして話者の名前を変更
      • [話者追加] ボタン: クリックして話者の追加
    • テキスト編集: i-clovaspeech-resulteditで表示された行をクリックして編集した後、i-clovaspeech-resultedit2をクリック
      • 編集をキャンセルするには i-clovaspeech-editcancelをクリックします。
      • 編集した内容は緑色で強調表示されます。
  5. 認識結果をエクスポートするには、 [エクスポート] ボタンをクリックし、設定情報を入力してから、 [確認] ボタンをクリックします。
    • ファイル名: エクスポートする結果ファイル名前の入力
    • ファイル形式: ドロップダウンメニューをクリックし、エクスポートするファイル形式を選択(jsonsmisrttxtcsvxlsの中から選択)
    • タイムラインを後ろにずらす: 設定した時間の分だけ認識結果のタイムラインを後ろにずらす
    • エクスポート方法: Object Storageまたはダウンロードの中から選択
      • Object Storageを選択した場合、ファイルの保存場所をクリックし、認識結果ファイルを保存する場所のパスを選択
      • ダウンロードを選択した場合、ローカル PCに認識結果ファイルをダウンロード

認識した結果をエクスポート

複数のタスクの認識結果ファイルをエクスポートする方法は、次の通りです。

参考

タスク状況タスク完了であるタスクの認識結果ファイルのみエクスポートできます。

  1. ドメインのビルダでタスクリストメニューをクリックします。
  2. エクスポートするタスクをクリックして選択します。
    • 複数のタスクを同時に選択できます。
  3. [エクスポート] ボタンをクリックします。
  4. エクスポートのポップアップが表示されたら、エクスポート設定を確認して [確認] ボタンをクリックします。
    • i-clovaspeech-edit: クリックして認識結果ファイルの名前を変更
    • i-clovaspeech-delete: クリックしてエクスポートリストで削除
    • ファイル形式: ドロップダウンメニューをクリックし、エクスポートするファイル形式を選択(jsonsmisrttxtcsvxlsの中から選択)
    • エクスポート方法: Object Storageまたはダウンロードの中から選択
      • Object Storageを選択した場合、結果ファイルの保存場所をクリックし、認識結果ファイルを保存する場所のパスを選択
      • ダウンロードを選択した場合、ローカル PCに認識結果ファイルをダウンロード

認識タスク削除

登録した認識タスクを削除する方法は、次の通りです。

  1. ドメインのビルダでタスクリストメニューをクリックします。
  2. 削除するタスクをクリックして選択します。
    • 複数のタスクを同時に選択できます。
  3. [削除] ボタンをクリックします。
  4. タスク削除のポップアップが表示されたら、 [削除] ボタンをクリックします。

キーワードブースト

キーワードブーストを通じて特定の単語に対する認識率を向上できます。キーワードブーストメニューではキーワードを登録して管理できます。

キーワードブースト画面

ビルダを利用するためのキーワードブーストメニューの基本的な説明は、次の通りです。
clovaspeech-builder_keyword_ko

領域 説明
① メニュー名 現在確認中のメニュー名
② キーワード管理機能 キーワードファイルのアップロード、登録したキーワードのダウンロードと削除
③ 検索ボックス キーワード検索
④ キーワードリスト 照会中のキーワードリスト

キーワード追加

認識率を高めるキーワードを追加する方法は、次の通りです。

参考
  • 最大1000単語まで登録でき、韓国語と英語をサポートします。
  • キーワードは、500単語以下で登録することをお勧めします。500単語を超過すると、性能の低下が発生する場合があります。
  • 重み付けが高いほど、類似の単語がより多く認識されるため、認識結果に影響を与える可能性があります。

以下のように希望する方法でキーワードを追加できます。

キーワードファイルのアップロード

キーワードを入力したエクセルファイルをアップロードして複数のキーワードを一括登録する方法は、次の通りです。

  1. キーワードと重み付けを入力したエクセルファイルを作成します。
    • 重み付けは1~5の整数で入力します。
    • 4番手続きの画面でアップロードテンプレートをクリックすると、キーワードファイルのテンプレートを確認できます。
  2. ドメインのビルダでキーワードブーストメニューをクリックします。
  3. [アップロード] ボタンをクリックします。
  4. アップロードポップアップが表示されたら、 **マウスでファイルをドラッグするか、ここをクリックしてください。**領域にローカル PCに保存しているキーワードファイルをドラッグするか、 **マウスでファイルをドラッグするか、ここをクリックしてください。**領域をクリックし、キーワードファイルを選択します。
  5. [確認] ボタンをクリックします。
    • 上書き: チェックボックスをクリックして選択すると、既存のすべてのキーワードを削除して新しいキーワードを登録
参考

キーワードファイルに既存のキーワードと重複するキーワードが含まれている場合、キーワード登録に失敗します。重複したキーワードを削除したり、ファイルのアップロード時に上書きのチェックボックスをクリックします。

キーワードの個別追加

ビルダでキーワードを直接追加する方法は、次の通りです。

  1. ドメインのビルダでキーワードブーストメニューをクリックします。
  2. **追加するキーワードを入力します。**領域をクリックしてキーワードを入力します。
  3. 重み付けドロップダウンメニューで重み付けの値を選択します。
  4. [追加] ボタンをクリックします。

キーワード変更

登録したキーワードを変更する方法は、次の通りです。

  1. ドメインのビルダでキーワードブーストメニューをクリックします。
  2. キーワードリストから変更キーワードの i-clovaspeech-editをクリックします。
  3. キーワードの入力欄をクリックしてキーワードを変更した後、i-clovaspeech-keywordeditcheckをクリックします。
    • キーワードの変更をキャンセルするには、i-clovaspeech-keywordeditcancelをクリックします。
    • 重み付けを変更するには、重み付けドロップダウンメニューで重み付けの値を選択します。

キーワードダウンロード

登録したキーワードを一括ダウンロードする方法は、次の通りです。

  1. ドメインのビルダでキーワードブーストメニューをクリックします。
  2. キーワードリストでダウンロードするキーワードのチェックボックスをクリックして選択します。
    • 複数のキーワードを同時に選択できます。
  3. [ダウンロード] ボタンをクリックします。
    • キーワードと重み付けの情報を含むエクセルファイルをダウンロードします。

キーワード削除

登録したキーワードを削除する方法は、次の通りです。

  1. ドメインのビルダでキーワードブーストメニューをクリックします。
  2. キーワードリストで削除するキーワードのチェックボックスをクリックして選択します。
    • 複数のキーワードを同時に選択できます。
    • キーワードの [削除] ボタンをクリックし、すぐにキーワードを削除できます。
  3. [キーワード削除] ボタンをクリックします。
  4. 通知ポップアップが表示されたら、 [確認] ボタンをクリックします。

API呼び出し情報とドメイン情報の確認

設定メニューでは、API呼び出しのための連携情報とビルダに接続されたドメイン情報を確認できます。

API呼び出し情報の確認

API呼び出しのための連携情報を確認する方法は、次の通りです。

参考

APIを呼び出して認識対象ファイルを送信し、認識結果を受け取ることができます。APIの呼び出し方法は、CLOVA Speech APIガイドをご参照ください。

  1. ドメインのビルダで設定メニューをクリックします。
  2. [連携情報] タブをクリックします。
  3. ドメインの Secret KeyCLOVA Speech Invoke URLを確認します。
    • [作成] ボタン: クリックして Secret Keyの作成/再作成
    • [コピー] ボタン: クリックしてその情報をクリップボードにコピー

ドメイン情報の確認

ビルダに接続されたドメイン情報を確認する方法は、次の通りです。

  1. ドメインのビルダで設定メニューをクリックします。
  2. [ドメイン情報] タブをクリックします。
  3. ビルダに接続されたドメイン情報を確認します。
    • ドメイン情報
      • ドメイン名: ドメインの名前
      • ドメインコード: ドメインのコード
      • タイプ: ドメインに適用された料金プランのプラン
    • Storage設定
      • 結果ファイルの保存パス: 認識結果ファイルを保存する Object Storageのパス
      • 認識対象の保存パス: 認識対象ファイルを選択する Object Storageのパス
      • [Object Storageに移動] ボタン: クリックして Object Storageのコンソール画面に移動