テキストへ変換
テキストへ変換ツールを使用して、 画像入力ツール によって作成された BLOB 画像ファイルからテキストを抽出します。このツールを使用して、テーブルを自動検出することもできます。
Alteryx Intelligence Suiteが必要です
このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designerに加え、別途のライセンスとアドオンインストーラーが必要です。Designerをインストール後、Intelligence Suiteをインストールし、 無料トライアルを開始 します。
重要
テキストへ変換ツールでは、Null または空の行はサポートされていません。
ツールコンポーネント
テキストへ変換ツールには、3 つのアンカーがあります。
「 D (データ) 」入力アンカー: D アンカーを使用して、変換する PDF 画像に接続します。 画像入力ツール を使用して、ワークフローに画像を取り込むことができます。
「 T (テンプレート) 」入力アンカー: T 入力アンカーを使用して、 画像テンプレートツール からアノテーションを接続します。
出力アンカー: 出力アンカーを使用して、変換されたテキストを下流のツールに渡します。各画像の全出力を表示するには、 閲覧ツール を使用します。
ツールの設定
画像入力ツールをキャンバスに追加し、それをテキストへ変換ツールに接続します。
テキストの抽出元の 画像 を選択します。
画像に含まれているテキストの 言語 を識別します。
画像テンプレートツール に接続していて、すべてのページのレイアウトが同じ場合は、 [すべてのページに画像テンプレートの最初のページのアノテーションを適用] を選択します。
ワークフローを 実行 して、画像をテキストに変換します。
出力
D アンカーを使用して画像をテキストに変換すると、テキストへ変換ツールによってデータセットに列が作成されます。列の各行には、PDF 画像のページのテキストが含まれます。 T アンカーを使用すると、指定した画像ファイル内で検出されたテーブルと一致するテーブルがツールによって出力されます。