UCS漢字のコレクション
Collections of UCS Ideographs
付属書A "Collections of Graphic Characters for Subsets"
Collection(組)は、UCS文字集合のサブセットを定めます(箇条12)。情報交換の際にどの組を使うかは、JIS X 0211制御符号を用いて指定したり(箇条16.3)、ASN.1による情報交換でも指定できます(箇条N.2)。文字未定義な符号がなく、将来にわたって変更されない組は Fixed Collection (確定組)と呼ばれます(箇条4.19)。漢字が主体となる組として以下が規定されています。(数字は組番号です。)
番号 | 組名 | 組の範囲 |
---|---|---|
60 | CJK UNIFIED IDEOGRAPHS | 4E00-9FFFに含まれる漢字の組です。 |
62 | CJK COMPATIBILITY IDEOGRAPHS | F900-FAFFに含まれる漢字の組です。 |
81 | CJK UNIFIED IDEOGRAPHS EXTENSION A | 3400-4DBF FA1F, FA23 に含まれる漢字の組です。 |
285 | BASIC JAPANESE | JIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。 |
286 | JAPANESE NON IDEOGRAPHICS EXTENSION | JIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。 |
287 | COMMON JAPANESE | JIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。 |
370 | IICORE | IICORE (International Ideograph CORE Set) は東アジアの一般漢字利用者が日常的に使用する漢字の確定組です。IICOREには拡張Bの漢字が64文字含まれています。これらは香港や澳門がソースとなっています。IICOREの制定は情報処理学会の試行標準(IPSJ-TS0005)がきっかけとなっています。(参考:情報規格調査会のプレスリリース) |
371 | JIS2004 IDEOGRAPHICS EXTENSION | JIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。 |
372 | JAPANESE IDEOGRAPHICS SUPPLEMENT | JIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。 |
383 | CJK COMPATIBILITY IDEOGRAPHS-2005 | UCS互換漢字の確定組です。F900-FA0D, FA10, FA12, FA15-FA1E, FA20, FA22, FA25-FA26, FA2A-FA6A, FA70-FAD9, 2F800-2FA1Dから構成されます。これらはCJK互換漢字の455文字、CJK互換漢字補助の542文字から構成されます(FA2E, FA2Fは未定義です)。 |
384 | CJK UNIFIED IDEOGRAPHS-2007 | UCS統合漢字の確定組です。3400-4DB5, 4E00-9FC3, FA0E-FA0F, FA11, FA1F, FA21, FA23-FA24, FA27-FA29, 20000-2A6D6から構成されます。これらは UROの20,902文字、拡張A漢字の6,584文字、それ以外のBMPの統合漢字38文字、そして拡張B漢字の42,711文字から構成されます。 |
385 | CJK UNIFIED IDEOGRAPHS-2008 | UCS統合漢字の確定組です。3400-4DB5, 4E00-9FC6, FA0E-FA0F, FA11, FA1F, FA21, FA23-FA24, FA27-FA29, 20000-2A6D6, 2A700-2B734から構成されます。これらは UROの20,902文字、拡張A漢字の6,584文字、それ以外のBMPの統合漢字41文字、拡張B漢字の42,711文字、拡張C漢字の4,149文字の、合計74,387文字から構成されます。 |
2001 | CJK UNIFIED IDEOGRAPHS EXTENSION B | 20000-2A6DF に含まれる漢字の組です。 |
2002 | CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT | 2F8000-2FA1F に含まれる漢字の組です。 |
2003 | CJK UNIFIED IDEOGRAPHS EXTENSION C | 2A700-2B73F に含まれる漢字の組です。 |