Zero-shot テキスト分類
Zero-shot テキスト分類ツールでは、定義したカテゴリリストに基づいてスコアリングされたカテゴリがテキストの本文に割り当てられます。たとえば、新聞記事にフィードして、「政治」および「テクノロジー」というラベルカテゴリを定義し、各ラベルの関連性を判断する確率をツールで指定できます。Zero-shot テキスト分類ツールはトレーニングデータを必要とせず、 Huggingface Transformer モデルを使用して ONNX Runtime を活用します。
Alteryx Intelligence Suiteが必要です
このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designerに加え、別途のライセンスとアドオンインストーラーが必要です。Designerをインストール後、Intelligence Suiteをインストールし、 無料トライアルを開始 します。
言語サポート
Zero-shot テキスト分類ツールは、現時点では英語のみをサポートしています。
ツールコンポーネント
Zero-shot テキスト分類ツールには、3 つのアンカーがあります (入力が 2 つ、出力が 1 つ):
D 入力アンカー: D 入力アンカーを使用して、分類するテキストデータを接続します。
L 入力アンカー: L 入力アンカーを使用して、カテゴリラベルをツールに渡します。
出力アンカー: 出力アンカーを使用して、テキストの各本文のスコアリングされたカテゴリをダウンストリームに渡します。
ツールの設定
キャンバスに Zero-shot テキスト分類ツールを追加します。
D 入力アンカーを使用して、Zero-shot テキスト分類ツールをワークフローで使用するテキストデータに接続します。
テキストの本文が大きい場合は、テキストを小さなセクションに分割するか、 テキスト前処理 ツールまたは テキストサマリー ツールを使用してテキストを前処理します。
カテゴリラベルを Zero-shot テキスト分類ツールに渡すには、 L 入力アンカーを使用します。 テキスト入力ツール を使用して、カテゴリラベルのリストを作成できます。
分析対象にする テキストを含む列 を選択します。このツールには、トレーニングデータは必要ありません。
スコアを付けるカテゴリの [ラベルを含む列] を選択します。
(オプション) カテゴリをそれぞれ独立して扱うには、 [マルチラベルの分類] を選択してください。テキストが複数のカテゴリに属するかどうかを決定するには、このオプションを使用してください。
ワークフローを 実行 します。
出力
出力には 2 セットの列が含まれます。
各カテゴリラベルの列です。各列は、各行のテキストが各カテゴリに関連付けられる度合いを表します。カテゴリ列の値が高いほど、テキストとそのカテゴリとの関連付けが強い可能性があります。
複数のカテゴリラベルを使用する場合は、確率値が最も高いカテゴリラベルを含む列です。