Skip to main content

コードページ

コードページ(文字セットまたはエンコーディングとも呼ばれる)は、各文字に数値表現が割り当てられた値のテーブルです。コードページを使用すると、コンピュータは文字を識別してテキストを正しく表示できます。

Alteryxは、 データ入力ツール および データ出力ツール を介してデータファイルを入出力する際、あるいは Blob 変換ツール を使用してデータ型を変換する際に選択できるコードページを多数サポートしています。さらに、式エディタを持つツールで使用できる ConvertFromCodepage 関数と ConvertToCodepage 関数は、コードページ識別子を使用して、複数のコードページと Unicode® ( ユニコードコンソーシアム が作成したすべての文字の汎用文字エンコーディング標準) の間で文字列を変換できます。

Alteryx では、ワイド (全角) 文字列は Unicode® 文字列であり、ナロー (半角英数) 文字列は Latin 1 の文字列であるという前提で扱います。文字列を別のコードページに変換すると、正しく表示されません。従って、コードページは、ファイル内のテキストエンコーディングの問題を上書きするためにのみ使用する必要があります。コードページは、コンピュータの種類により異なる場合があり、同じコンピュータの上でも変更される場合があります。データの破損を招くこともあります。最も一貫性のある結果を得るには、特定のコードページではなく、UTF-8 や UTF-16 エンコードなどの Unicode® を使用します。これにより、同じデータストリーム内で異なる言語をエンコードできます。

UTF-8 は、任意の文字を格納できる最もポータブルでコンパクトな方法であり、最も広く使用されています。UTF-8とUTF-16は両方とも可変幅のエンコーディングですが、UTF-8はASCIIと互換性があり、ファイルはUTF-16よりも小さくなる傾向があります。

コードページの詳細な情報については、 MSDN ライブラリ を参照してください。

Linux で同じ機能をサポートするために、Alteryx は ICU ライブラリを採用しています。Windows 上と同じ ID を使用し、ID を文字列 ICU コンバータに変換します。ICU は Windows エンコーディングの全リストをサポートしておらず、異なるコードページ間でデータを変換するときに差分が生じる可能性があります。

コードページ識別子

これらのコードページ識別子は、 ConvertFromCodepage 関数および ConvertToCodepage 関数でサポートされます。詳細については、 関数 を参照してください。

ID

説明

サポート

37

IBM EBCDIC - 米国/カナダ

従来のエンジンと AMP エンジン。

500

IBM EBCDIC - インターナショナル

従来のエンジンと AMP エンジン。

932

ANSI/OEM - 日本語 Shift-JIS

従来のエンジンと AMP エンジン。

949

ANSI/OEM - 韓国語 EUC-KR

従来のエンジンと AMP エンジン。ダウンロードと Blob Convert ではサポートされていません。

1250

ANSI - 中央ヨーロッパ

従来のエンジンと AMP エンジン。

1251

ANSI - キリル文字

従来のエンジンと AMP エンジン。

1252

ANSI - ラテン語I

従来のエンジンと AMP エンジン。

1253

ANSI - ギリシャ語

従来のエンジンと AMP エンジン。

1254

ANSI - トルコ語

従来のエンジンと AMP エンジン。

1255

ANSI - ヘブライ語

従来のエンジンと AMP エンジン。

1256

ANSI - アラビア語

従来のエンジンと AMP エンジン。

1257

ANSI - バルト言語

従来のエンジンと AMP エンジン。

1258

ベトナム語 ANSI/OEM

従来のエンジンと AMP エンジン。

10000

MAC - ローマン

従来のエンジンと AMP エンジン。

28591

ISO 8859-1 Latin I

従来のエンジンと AMP エンジン。

28592

ISO 8859-2中央ヨーロッパ

従来のエンジンと AMP エンジン。

28593

ISO 8859-3 Latin 3

従来のエンジンと AMP エンジン。

28594

ISO 8859-4バルト語

従来のエンジンと AMP エンジン。

28595

ISO 8859-5キリル文字

従来のエンジンと AMP エンジン。

28596

ISO 8859-6 アラビア語

従来のエンジンと AMP エンジン。

28597

ISO 8859-7 ギリシャ語

従来のエンジンと AMP エンジン。

28598

ISO 8859-8 ヘブライ語: 視覚的順序

従来のエンジン。

28599

ISO 8859-9 Latin 5

従来のエンジンと AMP エンジン。

28605

ISO 8859-15 Latin 9

従来のエンジンと AMP エンジン。

54936

簡体字中国語 GB18030

従来のエンジンと AMP エンジン。ダウンロードツールと Blob 変換ツールではサポートされていません。

65001

Unicode UTF-8

従来のエンジンと AMP エンジン。

1200

Unicode UTF-16

従来のエンジンと AMP エンジン。