画像処理
画像処理ツールを使用して、画像にさまざまなアクションを実行します。これらのツールでは、画像の位置合わせ、閾値処理、スケール、シフト、トリミングなどを行うことができます。また、輝度バランスの調整やグレースケールへの変換も可能です。
Alteryx Intelligence Suiteが必要です
このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designerに加え、別途のライセンスとアドオンインストーラーが必要です。Designerをインストール後、Intelligence Suiteをインストールし、 無料トライアルを開始 します。
ツールコンポーネント
画像処理ツールには、3 つのアンカーがあります (入力が 2 つ、出力が 1 つ)。
入力アンカー: 入力アンカーを使用して、処理する画像に接続します。
オプションの入力アンカー: 画像テンプレートツール からの注釈を接続します。これらの注釈は、 [シフト] ステップのアンカーポイントとして使用できます。
出力アンカー: 出力アンカーは、処理された画像をダウンストリームに渡す際に使用します。
注記: 「image_processed」列には、処理済みの画像が格納されます。
ツールの設定
キャンバスに画像処理ツールを追加します。
入力アンカーを使用して、処理する画像に接続します。
画像 フィールドから、処理する画像を選択します。
ステップを追加 ボタンを選択してドロップダウンを開きます。ここから次のいずれかの手順を追加できます。
このツールは、各ステップを上から下へと順番に処理します。すでに追加したステップをドラッグして、順序を変更できます。個々のステップを削除するには、ゴミ箱アイコンを選択します。
アラインメント
輝度バランス
トリミング
エンハンス
グレースケール
OCR の最適化
スケール
シフト
閾値処理
ワークフローを 実行 します。
詳細
画像処理のステップごとに、高度な設定オプションがあります。
アラインメント
画像またはスキャンした文書を回転させるには、 [アラインメント] ステップを使用します。[アラインメント]を使用すると、歪んだスキャン文書のOCR結果を改善できます。
[アラインメント] には2つのモードがあります。
自動 : OCRワークフローでスキャンしたドキュメントまたは画像を自動的に回転します。 自動 は、テキストを含む画像に最適です。自動回転は、回転の角度が45度以下の画像に対してのみ機能します。
カスタム : スライダーを使用して、画像に適用する回転の角度と方向を指定できます。スライダーをリセットするには、更新アイコンを選択します。正確な回転角度がわかっている場合、または画像が45度以上回転している場合は、 カスタム を使用します。
輝度バランス
画像の輝度を自動または手動で調整します。
マルチチャネルの画像をシングルチャネルに変換します。 自動 オプションを使用すると、ツールが自動的に画像の輝度を調整します。 カスタム オプションを選択した場合は、スライダーを使用して、画像の明るさまたは暗さを任意に指定できます。
トリミング
画像の一部を削除します。
画像をトリミングするには、保持する画像の大きさを選択します。この選択では、幅と高さをピクセル単位またはパーセンテージで指定できます。次に、アンカーグリッドを使用して、トリミング後に保持する画像部分を選択します。
エンハンス
画像の解像度を上げ、画質を向上させます。 [エンハンス] を使用すると、OCRなどのコンピュータービジョンタスクの結果が改善されます。使用可能な画像強調モデルは次のとおりです。
OCRのテキスト :入力したテキストを含む画像の場合は、解像度を400%アップスケールします。このオプションを使用すると、OCRの結果を改善できます。 OCRのテキスト は、1000 × 1000ピクセル以下の画像にのみエンハンス機能を適用します。大きな画像は、エンハンス機能なしでツールで処理されます。
重要
[エンハンス] はディープラーニングモデルに依存しているため、他の手順よりも処理に時間がかかる場合があります。
グレースケール
マルチチャネルの画像をシングルチャネルに変換します。何も設定する必要はありません。
OCR の最適化
スキャンした PDF ファイルを光学文字認識 (OCR) 用に最適化します。 OCR最適化 は、加工品、印刷された背景テクスチャ、白以外の背景をスキャンしたノイズの多いドキュメントの場合にだけ使用してください。ノイズのないドキュメントに OCR 最適化 を使用することはお勧めしません。
OCR最適化 には次の3つのモードがあります。
自動 : ドキュメントごとに 濃いめ 処理と 薄め 処理のどちらを適用するのか自動的に決定します。
濃いめ : より密度の高いドキュメントやノイズの多いドキュメントに使用します。
薄め : 比較的ノイズの少ないドキュメントに使用します。
ドキュメントの背景が白以外になっている部分がある場合は、 [背景が白ではないテキストがあります] を選択します。たとえば、ドキュメントの背景が青色で文字が白い場合は、このオプションを選択します。
スケール
画像のサイズを変更します。
作成する画像のサイズを選択します。幅と高さは、ピクセル単位または元の画像のサイズを基準にしたパーセンテージで指定できます。
また、画像のアスペクト比を固定することもできます。これにより、高さや幅を変更しても比率は変わらなくなります。
シフト
スキャン時に位置がずれた文書を自動的にシフトします。 [シフト] を使用することで、スキャン文書のOCR結果を改善できます。 [シフト] を使用するには、次の手順に従います。
画像テンプレートツール に、アンカーとして機能するアノテーションを作成します。 [シフト] は、アンカーを使用して、他のスキャンした文書を整列させます。注記: [シフト] は [テーブル検出] を使用している場合機能しません。手動アノテーションモードで追加されるアノテーションのみを使用してください。
画像テンプレートツールを、オプションの入力アンカーに接続します。
[シフト] ステップを追加します。
スキャンした文書を自動的にシフトするには、 [シフト] の下の [アンカー] を選択します。
ステップ1で作成したアノテーションから [アンカー名] を選択します。
ワークフローを 実行 します。
閾値処理
閾値を設定して、各チャネルの画像を白黒などのバイナリに変換します。
画像の閾値処理に使用できるアルゴリズムがいくつか用意されています。ほとんどの場合、書籍のスキャンページのようなテキストの画像には 適応型ガウシアン を使用し、写真などのその他の画像には バイナリ を使用することをお勧めします。閾値処理の詳細については、「 OpenCV の閾値処理に関するドキュメント(Image Thresholding) 」を参照してください。
注記: 適応的閾値処理法では、画像がシングルチャネル (つまりグレースケール) であることが必要です。 閾値処理 ステップの前に グレースケール ステップがない場合、グレースケール処理は実行されますが、設定ウィンドウにグレースケールステップは追加されません。