UCS漢字のコレクション

Collections of UCS Ideographs

付属書A "Collections of Graphic Characters for Subsets"

Collection(組)は、UCS文字集合のサブセットを定めます(箇条12)。情報交換の際にどの組を使うかは、JIS X 0211制御符号を用いて指定したり(箇条16.3)、ASN.1による情報交換でも指定できます(箇条N.2)。文字未定義な符号がなく、将来にわたって変更されない組は Fixed Collection (確定組)と呼ばれます(箇条4.19)。漢字が主体となる組として以下が規定されています。(数字は組番号です。)

 番号 組名組の範囲
60CJK UNIFIED IDEOGRAPHS4E00-9FFFに含まれる漢字の組です。
62CJK COMPATIBILITY IDEOGRAPHSF900-FAFFに含まれる漢字の組です。
81CJK UNIFIED IDEOGRAPHS EXTENSION A 3400-4DBF FA1F, FA23 に含まれる漢字の組です。
285BASIC JAPANESEJIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。
286JAPANESE NON IDEOGRAPHICS EXTENSIONJIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。
287COMMON JAPANESEJIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。
370IICOREIICORE (International Ideograph CORE Set) は東アジアの一般漢字利用者が日常的に使用する漢字の確定組です。IICOREには拡張Bの漢字が64文字含まれています。これらは香港や澳門がソースとなっています。IICOREの制定は情報処理学会の試行標準(IPSJ-TS0005)がきっかけとなっています。(参考:情報規格調査会のプレスリリース
371JIS2004 IDEOGRAPHICS EXTENSIONJIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。
372JAPANESE IDEOGRAPHICS SUPPLEMENTJIS X 0221:2007の附属書JAで規定された同名のレパートリと同じ確定組です。
383CJK COMPATIBILITY IDEOGRAPHS-2005UCS互換漢字の確定組です。F900-FA0D, FA10, FA12, FA15-FA1E, FA20, FA22, FA25-FA26, FA2A-FA6A, FA70-FAD9, 2F800-2FA1Dから構成されます。これらはCJK互換漢字の455文字、CJK互換漢字補助の542文字から構成されます(FA2E, FA2Fは未定義です)。
384CJK UNIFIED IDEOGRAPHS-2007 UCS統合漢字の確定組です。3400-4DB5, 4E00-9FC3, FA0E-FA0F, FA11, FA1F, FA21, FA23-FA24, FA27-FA29, 20000-2A6D6から構成されます。これらは UROの20,902文字、拡張A漢字の6,584文字、それ以外のBMPの統合漢字38文字、そして拡張B漢字の42,711文字から構成されます。
385CJK UNIFIED IDEOGRAPHS-2008 UCS統合漢字の確定組です。3400-4DB5, 4E00-9FC6, FA0E-FA0F, FA11, FA1F, FA21, FA23-FA24, FA27-FA29, 20000-2A6D6, 2A700-2B734から構成されます。これらは UROの20,902文字、拡張A漢字の6,584文字、それ以外のBMPの統合漢字41文字、拡張B漢字の42,711文字、拡張C漢字の4,149文字の、合計74,387文字から構成されます。
2001CJK UNIFIED IDEOGRAPHS EXTENSION B20000-2A6DF に含まれる漢字の組です。
2002CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT2F8000-2FA1F に含まれる漢字の組です。
2003CJK UNIFIED IDEOGRAPHS EXTENSION C2A700-2B73F に含まれる漢字の組です。