コードページ
コードページ(文字セットまたはエンコーディングとも呼ばれる)は、各文字に数値表現が割り当てられた値のテーブルです。コードページを使用すると、コンピュータは文字を識別してテキストを正しく表示できます。
Alteryxは、
データ入力ツール
および
データ出力ツール
を介してデータファイルを入出力する際、あるいは
Blob 変換ツール
を使用してデータ型を変換する際に選択できるコードページを多数サポートしています。さらに、式エディタを持つツールで使用できる
ConvertFromCodepage
関数と
ConvertToCodepage
関数は、コードページ識別子を使用して、複数のコードページと Unicode® (
ユニコードコンソーシアム
が作成したすべての文字の汎用文字エンコーディング標準) の間で文字列を変換できます。
Alteryx では、ワイド (全角) 文字列は Unicode® 文字列であり、ナロー (半角英数) 文字列は Latin 1 の文字列であるという前提で扱います。文字列を別のコードページに変換すると、正しく表示されません。従って、コードページは、ファイル内のテキストエンコーディングの問題を上書きするためにのみ使用する必要があります。コードページは、コンピュータの種類により異なる場合があり、同じコンピュータの上でも変更される場合があります。データの破損を招くこともあります。最も一貫性のある結果を得るには、特定のコードページではなく、UTF-8 や UTF-16 エンコードなどの Unicode® を使用します。これにより、同じデータストリーム内で異なる言語をエンコードできます。
UTF-8 は、任意の文字を格納できる最もポータブルでコンパクトな方法であり、最も広く使用されています。UTF-8とUTF-16は両方とも可変幅のエンコーディングですが、UTF-8はASCIIと互換性があり、ファイルはUTF-16よりも小さくなる傾向があります。
コードページの詳細な情報については、 MSDN ライブラリ を参照してください。
Linux で同じ機能をサポートするために、Alteryx は ICU ライブラリを採用しています。Windows 上と同じ ID を使用し、ID を文字列 ICU コンバータに変換します。ICU は Windows エンコーディングの全リストをサポートしておらず、異なるコードページ間でデータを変換するときに差分が生じる可能性があります。
コードページ識別子
これらのコードページ識別子は、
ConvertFromCodepage
関数および
ConvertToCodepage
関数でサポートされます。詳細については、
関数
を参照してください。
ID | 説明 | サポート |
37 | IBM EBCDIC - 米国/カナダ | 従来のエンジンと AMP エンジン。 |
500 | IBM EBCDIC - インターナショナル | 従来のエンジンと AMP エンジン。 |
932 | ANSI/OEM - 日本語 Shift-JIS | 従来のエンジンと AMP エンジン。 |
949 | ANSI/OEM - 韓国語 EUC-KR | 従来のエンジンと AMP エンジン。ダウンロードと Blob Convert ではサポートされていません。 |
1250 | ANSI - 中央ヨーロッパ | 従来のエンジンと AMP エンジン。 |
1251 | ANSI - キリル文字 | 従来のエンジンと AMP エンジン。 |
1252 | ANSI - ラテン語I | 従来のエンジンと AMP エンジン。 |
1253 | ANSI - ギリシャ語 | 従来のエンジンと AMP エンジン。 |
1254 | ANSI - トルコ語 | 従来のエンジンと AMP エンジン。 |
1255 | ANSI - ヘブライ語 | 従来のエンジンと AMP エンジン。 |
1256 | ANSI - アラビア語 | 従来のエンジンと AMP エンジン。 |
1257 | ANSI - バルト言語 | 従来のエンジンと AMP エンジン。 |
1258 | ベトナム語 ANSI/OEM | 従来のエンジンと AMP エンジン。 |
10000 | MAC - ローマン | 従来のエンジンと AMP エンジン。 |
28591 | ISO 8859-1 Latin I | 従来のエンジンと AMP エンジン。 |
28592 | ISO 8859-2中央ヨーロッパ | 従来のエンジンと AMP エンジン。 |
28593 | ISO 8859-3 Latin 3 | 従来のエンジンと AMP エンジン。 |
28594 | ISO 8859-4バルト語 | 従来のエンジンと AMP エンジン。 |
28595 | ISO 8859-5キリル文字 | 従来のエンジンと AMP エンジン。 |
28596 | ISO 8859-6 アラビア語 | 従来のエンジンと AMP エンジン。 |
28597 | ISO 8859-7 ギリシャ語 | 従来のエンジンと AMP エンジン。 |
28598 | ISO 8859-8 ヘブライ語: 視覚的順序 | 従来のエンジン。 |
28599 | ISO 8859-9 Latin 5 | 従来のエンジンと AMP エンジン。 |
28605 | ISO 8859-15 Latin 9 | 従来のエンジンと AMP エンジン。 |
54936 | 簡体字中国語 GB18030 | 従来のエンジンと AMP エンジン。ダウンロードツールと Blob 変換ツールではサポートされていません。 |
65001 | Unicode UTF-8 | 従来のエンジンと AMP エンジン。 |
1200 | Unicode UTF-16 | 従来のエンジンと AMP エンジン。 |