- 印刷する
- PDF
Template
- 印刷する
- PDF
Classic/VPC環境で利用できます。
NAVERクラウドプラットフォームコンソールの CLOVA OCR > Domain では、判読領域を直接指定して認識値を抽出した後、テストと結果を転送できるテンプレートビルダをサポートする Templateドメインを作成・管理できます。ここでは、Templateタイプのドメインを作成して使用する方法を説明します。ドメインリストを確認、削除、コピーする方法と、API Gatewayと連携する方法の詳細は、Domainをご参照ください。
ドメイン作成
サービスタイプが Templateのドメインを作成する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- [ドメイン作成] ボタンをクリックし、[General/Template] ボタンをクリックします。
- ドメイン作成のポップアップが表示されたら、必要な情報を入力します。
- ドメイン名: 韓国語、英字の大小文字、中国語、日本語、記号の全角/半角( & 。_ - × 々)を使用して1~50文字まで入力し、重複有無を確認するために [チェック] ボタンをクリック
- ドメインコード: 英字の大小文字、記号(.?&。_-×々)を使用して空白を除いて1~50文字まで入力し、重複有無を確認するために [チェック] ボタンをクリック
- サポート言語: ドメインでサポートする言語の種類をクリックして選択
- サービスタイプ: テンプレート をクリックして選択
- 認識モデル: ドメインに適用する認識モデルをクリックして選択
- サービスプラン: ドメインに適用するサービスプランをクリックして選択
- [ドメイン作成] ボタンをクリックします。
6.の各項目についての詳細説明は、Domainのドメインリスト確認をご参照ください。
テンプレートビルダの実行
Templateドメインを作成すると、テンプレートビルダを実行できます。テンプレートビルダは、画像や文章からテキストを抽出するためのテンプレートを作成してテストできるウェブコンソールで、Template OCRに必要な様々な機能を提供します。テンプレートビルダは、以下のような機能メニューで構成されています。
- テンプレート作成: 代表テンプレートを作成、分析対象となるテンプレート別の代表サンプルリストを管理
- テストと分析: 判読領域が設定されたテンプレート・モデルに対するテストと結果を確認、サービスプラン別 OCR統計データを照会
- コンポーネント: 特化した単語や類義語を用語辞典に登録してテンプレートに適用、用語辞典を管理
- 設定: ドメイン情報を確認、外部連携を設定、検証連携を設定、権限管理を設定
- リリース管理: テンプレートのベータをリリース、サービスをリリース
テンプレート作成
テンプレートの作成では、代表テンプレートを作成し、分析対象となるテンプレート別の代表サンプルリストを管理できます。
特定のテンプレートの認識率向上、CLOVA OCRのパフォーマンス改善に関する相談、テンプレートの作成にサポートが必要な場合、テクニカルサポートまでお問い合わせください。
テンプレートリスト
代表テンプレートを作成し、サンプルを追加して管理する方法は、次の通りです。
NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
Services > AI Services > CLOVA OCR メニューを順にクリックします。
Domain メニューをクリックします。
Templateドメインの [テンプレートビルダ] ボタンをクリックします。
テンプレート作成 のテンプレートリスト メニューをクリックします。
[テンプレート作成] ボタンをクリックします。
テンプレートの基本情報 でテンプレート名を入力し、 [確認] ボタンをクリックします。
- テンプレート名 : 韓国語、英字の大小文字、中国語、日本語、数字、記号の全角/半角(? & 。_ - × 々)を使用して1~30文字で入力
- 認識モデル : 選択した Template Domainに適用された認識モデルの種類を確認
[確認] ボタンをクリックします。
代表サンプル設定 で画像ファイルをアップロードします。
* 画像ファイルのアップロード条件
* ファイルサイズ: 20MB以下(pdf、tiffの場合、最大50MB対応)
* ファイル形式: jpg、png、pdf、tiff(最大5ページで構成された pdf、tiffを対応)
* ファイル解像度: A4基準150dpi以上、最小解像度10px以上~長辺基準1960px以下を推奨
:::(Info) (参考)
APIを介して入力される画像は、歪みやノイズの少ない最低150dpi以上の高画質が推奨されます。
:::
アップロードした画像サンプルが表示されたら、文書のタイトル領域を指定します。
- タイトル領域の指定: 代表サンプルをアップロードした後、領域指定の四角形をドラッグして設定
- 既に指定された領域をクリックすると領域指定の四角形が有効になり、をクリックすると領域指定を解除
- 既に指定された領域をクリックすると領域指定の四角形が有効になり、マウスで点線をドラッグすると領域が再設定され、をクリックすると再設定された領域を保存
- タイトル領域の指定: 代表サンプルをアップロードした後、領域指定の四角形をドラッグして設定
代表サンプル名 で、文書のテンプレート分類に使用されるサンプル名を韓国語、英字の大小文字、中国語、日本語、数字、記号の全角/半角(? & 。_ - × 々)を使用して1~30文字で入力し、[確認] ボタンをクリックします。
* [確認] ボタンをクリックすると保存および類義語登録画面を確認可能
* [確認] ボタンをクリックした後でも、代表サンプル名は [変更] ボタンをクリックして変更可能
* [類義語管理] ボタン: クリックすると、代表サンプル名とほぼ同様に認識される単語を登録して分類性能を向上でき、複数の類義語を入力する際はコンマで区切って入力
{height=" " width="70%"}
* 例) 地方税告知書, 地方税, 地方税の告知書
* 類義語管理の代表サンプル名は変更できず、類義語の登録および編集のみ可能
- 判読フィールド指定 で、判読したい個々のフィールドを指定して設定します。
* フィールド追加 をクリックした場合
* 判読領域指定: 新規フィールド指定の四角形が表示されたら、四角形のサイズを調整して設定
{height=" " width="70%"}
* 既に指定された領域をクリックすると領域指定の四角形が有効になり、をクリックすると領域指定を解除
* 既に指定された領域をクリックすると領域指定の四角形が有効になり、マウスで点線をドラッグすると領域が再設定され、をクリックすると再設定された領域を保存
* をクリックするとそのフィール名(元の名前_#)、設定値がコピーされ、既存フィールドの下部にフィールド指定ボックスが新規作成される
* フィールドボックスの [削除] ボタンをクリックすると、フィールドを削除可能
* マルチボックス (Premium専用)をクリックした場合
{height=" " width="70%"}
* 銀行口座番号や携帯電話番号のように入力フィールドが分かれている場合、マルチボックスで指定すると個々のボックス内の文字を認識・抽出できる
* マルチボックスの外枠にフィールド領域を設定すると、抽出したいボックス内の文字のみ認識(マルチボックスの枠線は認識しない)
* 判読領域指定: 新規フィールド指定の四角形が表示されたら、四角形のサイズを調整して設定
* 既に指定された領域をクリックすると領域指定の四角形が有効になり、をクリックすると領域指定を解除
* 既に指定された領域をクリックすると領域指定の四角形が有効になり、マウスで点線をドラッグすると領域が再設定され、をクリックすると再設定された領域を保存
* をクリックするとそのフィール名(元の名前_#)、設定値がコピーされ、既存フィールドの下部にフィールド指定ボックスが新規作成される
* フィールドボックスの [削除] ボタンをクリックすると、フィールドを削除可能
* チェックボックス (Premium専用)をクリックした場合
{height=" " width="70%"}
* セレクトボックスやラジオボタンのようなチェックボックス内に V、X、O、· などの非定型文字が認識された場合は Trueを、認識されない場合は Falseを返す
* アンケート用紙、サービス登録書類など様々な形式の文書で OCRを利用してチェックマークを認識可能
* チェックボックスを指定する際には、入力フィールドの枠線が見えるようにフィールドを設定し、指定された領域内に他の文字や図形なしでチェックボックスのみ認識されるように指定。また、マルチボックスの枠線とフィールド領域ボックスができるだけ一致するように設定
* チェックボックス領域外の非定型文字の場合や消えたり不鮮明になった非定型文字の場合、変更して同じボックスに非定型文字が重複して記入された場合、チェックボックス内に顧客がチェックできるように非定型文字とガイド文字が既に記入されている場合、正常に認識されない可能性がある
* 判読領域指定: 新規フィールド指定の四角形が表示されたら、四角形のサイズを調整して設定
* 既に指定された領域をクリックすると領域指定の四角形が有効になり、をクリックすると領域指定を解除
* 既に指定された領域をクリックすると領域指定の四角形が有効になり、マウスで点線をドラッグすると領域が再設定され、をクリックすると再設定された領域を保存
* をクリックするとそのフィール名(元の名前_#)、設定値がコピーされ、既存フィールドの下部にフィールド指定ボックスが新規作成される
* フィールドボックスの [削除] ボタンをクリックすると、フィールドを削除可能
* 認識対象外 : 必要な場合、判読範囲に設定したフィールド領域で文字の入力や手書き作成領域の他に特定の領域を認識対象外に指定可能
* フィールド追加 をクリックして既存フィールド内で認識対象外として処理する領域を指定する方法
* 認識対象外に設定した領域内のテキストは抽出されない
* 一般フィールド(Value type All)に設定するとサポートする Masking機能を使用する方法
* マルチボックス、チェックボックス、Value type Numericの場合はサポートしない
* フィールド内に作成方法の案内文がバック文字として記入されている場合、ガイド文(バックの文字)やウォーターマーク認識対象外などはサポートしない
追加したフィールドの名前を入力し、関連オプションを設定します。
- フィール名の入力: フィールド名 に韓国語、英字の大小文字、中国語、日本語、数字、記号の全角/半角(? & 。_ - × 々)を使用して入力
- フィールド名はそのフィールド内で自由に変更可能
- フィールド: をクリック
- Value typeと用語の設定: 個々のフィールドでフィールドやマルチボックスをクリックした場合
- Value type: AIIを選択するとテキストと数字の組み合わせを、Numericを選択すると数字のみ認識するように指定できるため、フィールドに入力される値の形式を予め指定して特定の値のみ抽出可能
- 用語登録: ドメインに特化した単語および類義語が含まれた用語辞典を登録可能。辞典を登録するとその辞典に含まれた代表語のみ認識され、類義語が識別される場合は代表語に置き換えて表示されます。代表語や類義語以外の単語が認識される場合は、失敗処理されます。
- チェックボックス認識結果の文字変換設定: 個別のフィールドとしてチェックボックスを選択した場合
- チェックボックスの True(Y)、False(N)の戻り値を特定の文字に置き換えて出力
- チェックボックスの True(Y)、False(N)の戻り値を特定の文字に置き換えて出力
- Value typeと用語の設定: 個々のフィールドでフィールドやマルチボックスをクリックした場合
- フィール名の入力: フィールド名 に韓国語、英字の大小文字、中国語、日本語、数字、記号の全角/半角(? & 。_ - × 々)を使用して入力
必要な場合は、追加したフィールドのソートやフィールド判読結果の結合を設定します。
- フィールドソート: Shiftキー を押したままマウスをドラッグしてソートするフィールドを選択し、フィールドソート の左揃えか上揃えをクリック
- 判読結果結合: 個々のフィールドの OCR抽出値を結合して新しい値を出力するには、 [判読結果結合] ボタンをクリック
- 結合するフィールドと出力順序に応じて加工された OCR結果値を抽出できる
- 固定 TEXTを入力すると、「各フィールド別出力値+固定 TEXT」が一緒に表示
- フィールドソート: Shiftキー を押したままマウスをドラッグしてソートするフィールドを選択し、フィールドソート の左揃えか上揃えをクリック
[保存] ボタンをクリックします。
テンプレートリストで、必要な管理を行います。
- 代表サンプル画像変更: 代表サンプルリストで代表サンプル変更の [変更] ボタンをクリック
- 代表サンプル画像を変更すると、現在保存されている内容はすべて削除
- テンプレート削除: 代表サンプルリストで削除するテンプレートをクリックし、 [削除] ボタンをクリック
- テンプレートの検証: 保有中の独自検証サーバと連携してテンプレート別に検証を行うには、代表サンプルリストで 検証機能 の [登録] ボタンをクリック
- 代表サンプル画像変更: 代表サンプルリストで代表サンプル変更の [変更] ボタンをクリック
サンプルリスト
テンプレート別に登録した代表画像サンプル情報を確認してダウンロードできます。サンプルリストを確認してダウンロードする方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- テンプレート作成 のテンプレートリスト メニューをクリックします。
- テンプレートリストが表示されたら、情報を確認して、必要な場合は画像サンプルをダウンロードします。
- アップロードした代表サンプル画像を確認: 個々のサンプル番号をクリック
- アップロードした代表サンプル画像をダウンロード: テンプレートリストの ダウンロード で をクリック
テストと分析
テストと分析では、テキストを抽出したい画像ファイルをアップロードした後、判読結果をテストしたり、ダウンロードしたりできます。また、サービスプランの日別の API呼び出し回数、各テンプレートの外部検証結果、認識結果に対する統計データも確認できます。
テスト
テキストを抽出したい画像ファイルをアップロードした後、判読結果をテストしたり、ダウンロードする方法は、次の通りです。
ベータとテンプレート判読テストの回数を合算し、月300回まで無料テストを提供します。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- テストと分析 のテスト メニューをクリックします。
- テスト条件 で、テストする条件をベータ とテンプレート判読 の中からクリックして選択します。
- ベータ : サービスリリースと同じ環境でテンプレートの自動分類、判読領域をテスト。ベータリリース後にベータテストやサービスリリースが可能
- テンプレート判読 : 判読領域が設定されたテンプレート、モデルに対するテスト
- テストデータ にテストするデータをアップロードします。
- テスト結果 で結果を確認します。
- テスト結果確認: 判読結果を表で提供
- テスト結果ダウンロード: CSVと JSONの中からクリックして選択し、 [ダウンロード] ボタンをクリック
指標
サービスプランの日別の API呼び出し回数、各テンプレートの外部検証結果、認識結果に対する統計データを確認する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- テストと分析 の指標 メニューをクリックします。
- 照会する期間とテンプレートを設定します。
- 照会期間: 最大90日まで設定できる
- 照会結果を確認します。
- API呼び出し数: 使用中のサービスプランが設定された期間中に呼び出された API件数
- 検証結果: 各テンプレートの外部検証結果およびそのドメインに対する検証回数。検証結果グラフにマウスオーバーすると、VALID、UNCHECKED、ERROR、INVALIDの回数を表示
- テンプレート認識の失敗回数: テンプレートがマッチングされず認識結果がない場合、テンプレート認識失敗としてカウントして設定した期間の件数を表示
- 照会結果を xlsファイルでダウンロードするには、 [統合指標ダウンロード] ボタンをクリックします。
用語管理
用語管理では、用語辞典にドメインに特化した単語や類義語を登録してテンプレートに適用できます。特定フィールドにその辞典の単語のみを認識するように指定した場合や、登録した類義語が認識された場合、代表語に置換された結果を表示します。用語辞典を設定する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- 用語管理 の用語辞典 メニューをクリックします。
- [用語辞典作成] ボタンをクリックします。
- 用語辞典作成のポップアップが表示されたら、必要な情報を入力します。
- 辞典名 : 重複しない固有の辞典名を入力
- 代表語 : 辞典を構成する代表語を入力
- 類義語 : 入力した代表語の同義語または類義語を入力。複数の類義語を入力する場合、コンマ(,)で区切る 例) 地方税告知書, 地方税, 地方税の告知書
- [確認] ボタンをクリックします。
- 用語辞典管理画面の [アップロード] ボタンと [ダウンロード] ボタンをクリックすると、用語辞典のバルクファイルを xls形式でアップロードしたり、ダウンロードしたりできます。
- 用語辞典管理画面の右上にある検索画面で辞典名を入力すると、目的の結果を検索できます。
- 用語辞典管理画面の [更新] ボタンをクリックすると、用語辞典の最初のページが表示されます。
設定
設定では、ドメイン情報を確認したり、外部連携、権限管理などのオプションを設定したりできます。確認および設定方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- [設定] ボタンをクリックします。
- 目的のタブメニューをクリックし、必要な内容を確認したり、設定します。
- [ドメイン情報] タブメニューをクリック: ドメインやテンプレート情報を確認
- [API Gateway連携] タブメニューをクリック: API Gateway連携設定
- 使用方法の詳細は、 Domain を参照
- [外部検証サーバ] タブメニューをクリック: [作成] ボタンをクリックし、OCR結果を転送するアドレスを直接設定して管理
- ${結果転送名}形式で名前を入力
- URLフィールドに https://で始まる URLを入力
- [権限管理] タブメニューをクリック: 新しい管理者を追加して権限を付与
- [URL作成] ボタンをクリックすると Invite URLを作成し、URLを通じて権限を付与可能
- [削除] ボタンをクリックすると Invite URLを削除
リリース管理
ベータリリースは、モデルに反映される最終保存機能で、テンプレートに適用したサンプルや判読領域、用語辞典などを学習できます。ベータリリース後にベータテストやサービスリリースが行えます。リリースを管理する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- [リリース管理] ボタンをクリックします。
- テンプレートリストが表示されたら、 現在のリリースステータス で各テンプレートの最新状態を確認します。
- リリースするテンプレートをクリックして選択し、 [ベータリリース] ボタンをクリックします。
- ベータリリース完了後に テスト メニューでベータテスト可能
- テスト メニューで判読結果テスト後に変更した情報は、新しいベータリリースを通じて適用
- ベータテストが完了した最新ベータリリーステンプレートのサービスリリースを行うために、 [サービスリリース] ボタンをクリックします。
サービスリリースは、テンプレートビルダ上部の [サービスリリース] ボタンを介しても行えます。
API Gateway連携
Template OCRの Invoke URLを設定するために API Gatewayを連携する方法は、次の通りです。
- NAVERクラウドプラットフォームコンソールの Region メニューから、利用中のリージョンをクリックして選択します。
- Platform メニューから、VPC と Classic のどちらかをクリックして選択します。
- Services > AI Services > CLOVA OCR メニューを順にクリックします。
- Domain メニューをクリックします。
- Templateドメインの [テンプレートビルダ] ボタンをクリックします。
- [API Gateway連携] タブメニューをクリックし、[連携] ボタンをクリックします。
- API Gateway連携のポップアップが表示されたら、必要な情報を設定します。
- 連携方法の詳細は、Domainの API Gateway連携を参照
API呼び出し
Template OCRの Invoke URL設定を完了したら、CLOVA OCRで提供する APIを呼び出して画像を入力し、認識値を返してもらえるようになります。APIの呼び出し方法は、以下のガイドをご参照ください。