CNS漢字

Infomation About CNS Ideographs

CNS11643・UCS対応表

上記のデータは、台湾のCNS 11643の公式サイト “中文全字庫” で公開されているCNS関連データを整理したものです。CNS 11643では、未符号化文字・重複符号化文字など、通常のUCSに対応しない文字はすべて、UCS15面(UCSの私用領域の1つで、U+Fxxxxの領域)に対応付けられています。

CNS漢字の構成と変遷

CNS符号は、ISO/IEC 2022の2バイト符号化形式に基づく 94x94 の符号面15個から構成されます。そのうち、最初の7面は1992年に制定され、ISO/IEC 2375に基づいて、RA-JAC に登録されました。2007年に改正され、その後は必要に応じて文字の追加・修正などが行われています。

1986年1992年2007年 2011年注記
1 5,401 5,401 5,401 5,401
2 7,650 7,650 7,650 7,650
3 6,148 6,276 6,395
4 7,298 7,298 7,298
5 8,603 8,603 8,603
6 6,388 6,388 6,387
7 6,539 6,539 6,539
8 8,825UCSのBMP非漢字類
9 1,930UCSのBMP非漢字類
10 8,836 8,836UCS統合漢字拡張Bの非Tソース漢字
11 3,698 7,870
12 3,672 6,270
13 4,726 5,852
14 4,197 5,473 6,9911986年当時の14面の文字は3面へ移動。
15 6,831 6,968
17,24948,02781,39110,2656

CNS漢字の現状(2011年8月)

符号数文字数BMP SIP PUA 2121-4F4F2150-4F7E5021-7E4F5050-7E7E
1 6,312 6,312 6,295 0 172121-4F4F2150-4F7E5021-7E4F5050-7E7E
2 7,650 7,650 7,650 0 02121-4F4F2150-4F7E5021-7E4F5050-7E7E
3 6,395 6,395 6,323 71 12121-4F4F2150-4F7E5021-7E4F5050-7E7E
4 7,298 7,298 3,810 3,476 122121-4F4F2150-4F7E5021-7E4F5050-7E7E
5 8,603 8,603 459 8,142 22121-4F4F2150-4F7E5021-7E4F5050-7E7E
6 6,388 6,387 227 6,158 22121-4F4F2150-4F7E5021-7E4F5050-7E7E
7 6,539 6,539 150 6,388 12121-4F4F2150-4F7E5021-7E4F5050-7E7E
8 8,836 8,825 8,825 0 02121-4F4F2150-4F7E5021-7E4F5050-7E7E
9 1,935 1,930 1,930 0 02121-4F4F2150-4F7E5021-7E4F5050-7E7E
10 8,836 8,836 0 8,836 02121-4F4F2150-4F7E5021-7E4F5050-7E7E
11 8,020 7,870 0 3,698 4,1722121-4F4F2150-4F7E5021-7E4F5050-7E7E
12 8,753 6,270 0 634 5,6362121-4F4F2150-4F7E5021-7E4F5050-7E7E
13 8,836 5,852 0 767 5,0852121-4F4F2150-4F7E5021-7E4F5050-7E7E
14 8,755 6,991 3,209 350 3,4322121-4F4F2150-4F7E5021-7E4F5050-7E7E
15 7,235 6,898 248 6,472 1782121-4F4F2150-4F7E5021-7E4F5050-7E7E
110,391102,65639,12644,99218,538

CNS 11643 非漢字符号

CNS11643の非漢字のUCS符号対応は、実装によって異なります。以下に、UnicodeのObsoleteな対応表(主にglibc等が採用)、IBM ICUの対応表、CNSの公式対応表の差をまとめます。(現在、CNSの1面には様々な非漢字が追加されているため、この他にもUnicode, ICUの対応表に未記載の記号は多数あります。)

CNS符号UnicodeICU CNS Note
T1-2126U+030FB同左 U+02027KATAKANA MIDDLE DOT / HYPHENATION POINT
T1-2136U+0FE31同左 U+0FF5CPRESENTATION FORM FOR VERTICAL EM DASH / FULLWIDTH VERTICAL LINE
T1-2137U+02014U+02015同左 EM DASH / HORIZONTAL BAR
T1-2138U+0FE32同左 U+0FE31PRESENTATION FORM FOR VERTICAL EN DASH / PRESENTATION FORM FOR VERTICAL EM DASH
T1-2139U+02013U+0FE58U+02014EN DASH / SMALL EM DASH / EM DASH
T1-213A未定義 U+0F8D1U+0FE33nil / PRESENTATION FORM FOR VERTICAL LOW LINE
T1-213B未定義 U+0F8D0U+02574nil / BOX DRAWINGS LIGHT LEFT
T1-213C未定義 U+0F8CFU+0FE34nil / PRESENTATION FORM FOR VERTICAL WAVY LOW LINE
T1-213D未定義 U+0F8CEU+0FE4Fnil / WAVY LOW LINE
T1-216AU+02032U+0FF40U+02035PRIME / FULLWIDTH GRAVE ACCENT / REVERSED PRIME
T1-216BU+02035U+000B4U+02032REVERSED PRIME / ACUTE ACCENT / PRIME
T1-2171U+03003U+002BAU+03003DITTO MARK / MODIFIER LETTER DOUBLE PRIME / DITTO MARK
T1-2223U+0203EU+0FFE3U+0203EOVERLINE / FULLWIDTH MACRON / OVERLINE
T1-2224未定義 U+0203EU+0FFE3OVERLINE / FULLWIDTH MACRON
T1-2242U+0FE66U+0FE65同左 SMALL EQUALS SIGN / SMALL GREATER-THAN SIGN
T1-2243U+0FE65U+0FE66同左 SMALL GREATER-THAN SIGN / SMALL EQUALS SIGN
T1-2244U+0223CU+0FF5E同左 TILDE OPERATOR / FULLWIDTH TILDE
T1-2253U+02641U+02295同左 EARTH / CIRCLED PLUS
T1-2254U+02609U+02299同左 SUN / CIRCLED DOT OPERATOR
T1-2257U+02192同左 U+02190RIGHTWARDS ARROW / LEFTWARDS ARROW
T1-2258U+02190同左 U+02192LEFTWARDS ARROW / RIGHTWARDS ARROW
T1-225DU+02016U+02225同左 DOUBLE VERTICAL LINE / PARALLEL TO
T1-225EU+0FF5C同左 U+02223FULLWIDTH VERTICAL LINE / DIVIDES
T1-2261U+02215U+02044U+02215DIVISION SLASH / FRACTION SLASH / DIVISION SLASH
T1-243FU+05344同左 U+03039CJK IDEOGRAPH-5344 / HANGZHOU NUMERAL TWENTY
T1-2721~
T1-293A
未定義 CJK漢字U+02FXXKANGXI RADICAL XX (T1-2728=U+04EA0, T1-272F=U+051AB, T1-2734=U+052F9 除く)

参考:Big5における符号の違い

Big-5B5-2003CP950notes
0xA156U+2015U+2013HORIZONTAL BAR / EN DASH
0xA1C2U+203EU+00AFOVERLINE / MACRON
0xA2A4U+2501U+2550BOX DRAWINGS HEAVY HORIZONTAL / BOX DRAWINGS DOUBLE HORIZONTAL
0xA2A5U+251DU+255EBOX DRAWINGS VERTICAL LIGHT AND RIGHT HEAVY / BOX DRAWINGS VERTICAL SINGLE AND RIGHT DOUBLE
0xA2A6U+253FU+256ABOX DRAWINGS VERTICAL LIGHT AND HORIZONTAL HEAVY / BOX DRAWINGS VERTICAL SINGLE AND HORIZONTAL DOUBLE
0xA2A7U+2525U+2561BOX DRAWINGS VERTICAL LIGHT AND LEFT HEAVY / BOX DRAWINGS VERTICAL SINGLE AND LEFT DOUBLE
0xA2CCU+3038U+5341HANGZHOU NUMERAL TEN / CJK IDEOGRAPH-5341
0xA2CDU+3039U+5344HANGZHOU NUMERAL TWENTY / CJK IDEOGRAPH-5344
0xA2CEU+303AU+5345HANGZHOU NUMERAL THIRTY / CJK IDEOGRAPH-5345

UCS2011 規格表未記載T3~T7面漢字

上記のcns2ucs.txtにおいて、PUA 15面(U+FFFFx)に対応付けられているデータは、ISO/IEC 10646 に添付されている "CJKU_SR.txt" や、"CJKC_SR.txt" には記載されていません。以下に、本データと UCS 2011年版の CJKU_SR.txt / CJKC_SR.txt テキストファイルでのデータの比較一覧を示します。

CNS符号UCS2011本データコメント
T3-6168未記載 U+FFF79T2-715C(U+07C6F 籯)と字形が包摂
T4-225B未記載 U+FFF7AT4-2625(U+05B90 宐)と統合ミス
T4-2361未記載 U+FFFFDT3-645F(U+05759 坙)と字形が重複
T4-276A未記載 U+FFFFCT3-6631(U+080BB 肻)と字形が重複
T4-2827未記載 U+FFFFBTF-2872(U+04C88 䢌)と字形が重複
T4-287D未記載 U+FFFFAT3-646D(U+05CD5 峕)と字形が重複
T4-2A6E未記載 U+FFFF9T3-654C(U+079CC 秌)と字形が重複
T4-3042未記載 U+FFFF8T3-6670(U+098E4 飤)と字形が重複
T4-385C未記載 U+FFFF7T3-6542(U+06E7C 湼)と字形が重複
T4-434E未記載 U+0FA3ET1-5F35(U+06168 慨)と字形が重複
T4-4458未記載 U+FFFF6T3-655B(U+07193 熓)と字形が重複
T4-6339未記載 U+FFFF5T3-6677(U+05E71 幱)と字形が重複
T4-655F未記載 U+FFFF4T1-7822(U+09BFD 鯽)と字形が包摂
T5-234B未記載 U+FFFF3T3-6450(U+05324 匤)と字形が包摂
T5-756C未記載 U+FFFF2T4-6B2E(U+29572 𩕲)と字形が重複
T6-2A21未記載 U+FFFF1T3-6451(U+05365 卥)と字形が重複
T6-5C2F未記載 U+FFFF0T3-6466(U+05900 夀)と字形が重複
T7-2C3A未記載 U+0FACET1-733F(U+09F9C 龜) と字形が重複
T7-4159未記載 U+FFFEFT3-662C(U+07E64 繤)と字形が重複
TF-3C3E未記載 U+06BF6T3-653A(U+06BF6 毶)と字形が重複
T3-653AU+06BF6U+06BF5毶→毵へ変更、TF-3C3E(U+06BF6 毶)との重複を解消。
T3-2623U+225D6U+05FF9TA-4336をU+225D6に対応(𢗖)
T5-2438U+05FF9U+2F89FT3-2623と字形を入替え、互換漢字に。
T4-684FU+04D56U+2FA16T5-6F54と対応を入替
T5-6F54U+2FA16U+04D56T4-684Fと対応を入替
T5-7A38U+2F9CBU+04695T4-6E3B(𧢮)の互換漢字から、統合漢字へ変更。
T4-533CU+08786U+FFF7BT4-533C=U+FFF7B=「⿰虫玆」で固定。
TF-517DU+2F9BEU+08786TF-517D=U+08786=「⿰虫兹」で固定。

UCS2011 規格表未記載TF面漢字

TF面は文字が符号化されていない区点が1,886符号ありますが、以下はそれ以外で、UCSに未記載なTF面の漢字の一覧表です。いずれも、CNS11643の他の区点と包摂可能であり、重複符号化された可能性があります。

CNS符号UCS2011本データコメント
TF-2273未記載 U+FFFEE邜と字形が重複
TF-2327未記載 U+FFFED佨と字形が重複
TF-2458未記載 U+FFFEC毜と字形が重複
TF-245B未記載 U+FFFEB毝と字形が重複
TF-2650未記載 U+FFFEA孧と字形が重複
TF-2752未記載 U+FFFE9枬と字形が重複
TF-2868未記載 U+FFFE8虲と字形が重複
TF-2930未記載 U+FFFE7俧と字形が重複
TF-293B未記載 U+FFFE6枣と字形が重複
TF-295D未記載 U+FFFE5哋と字形が重複
TF-2B3E未記載 U+FFFE4栐と字形が重複
TF-2C62未記載 U+FFFE3砛と字形が重複
TF-2D2C未記載 U+FFFE2朑と字形が重複
TF-2D5F未記載 U+FFFE1𠂹と字形が重複
TF-2D65未記載 U+FFFE0倿と字形が重複
TF-2F25未記載 U+FFFDF屗と字形が重複
TF-2F59未記載 U+FFFDE挿と字形が重複
TF-2F5F未記載 U+FFFDD捠と字形が重複
TF-303C未記載 U+FFFDC涥と字形が重複
TF-305C未記載 U+FFFDB烪と字形が重複
TF-3144未記載 U+FFFDA砙と字形が重複
TF-3147未記載 U+FFFD9砽と字形が重複
TF-3223未記載 U+FFFD8聁と字形が重複
TF-3234未記載 U+FFFD7荢と字形が重複
TF-324D未記載 U+FFFD6茒と字形が重複
TF-334B未記載 U+FFFD5啲と字形が重複
TF-335C未記載 U+FFFD4堒と字形が重複
TF-335D未記載 U+FFFD3堓と字形が重複
TF-362B未記載 U+FFFD2渏と字形が重複
TF-364F未記載 U+FFFD1焑と字形が重複
TF-372D未記載 U+FFFD0硓と字形が重複
TF-3842未記載 U+FFFCF衐と字形が重複
TF-3931未記載 U+FFFCE𪔂と字形が重複
TF-3B26未記載 U+FFFCD愥と字形が重複
TF-3B33未記載 U+FFFCC搃と字形が重複
TF-3B5E未記載 U+FFFCB朂と字形が重複
TF-3B66未記載 U+FFFCA木と字形が重複
TF-3B6A未記載 U+FFFC9椬と字形が重複
TF-3C4C未記載 U+FFFC7楹と字形が重複
TF-3C65未記載 U+FFFC6焿と字形が重複
TF-3C73未記載 U+FFFC5焹と字形が重複
TF-3C74未記載 U+FFFC4焽と字形が重複
TF-3C76未記載 U+FFFC3焻と字形が重複
TF-3D3C未記載 U+FFFC2琻と字形が重複
TF-3D7D未記載 U+FFFC1粩と字形が重複
TF-3E59未記載 U+FFFC0萡と字形が重複
TF-3E6C未記載 U+FFFBF萞と字形が重複
TF-3F73未記載 U+FFFBE鈡と字形が重複
TF-3F77未記載 U+FFFBD閗と字形が重複
TF-4055未記載 U+FFFBC嗴と字形が重複
TF-407B未記載 U+FFFBB嫑と字形が重複
TF-4124未記載 U+FFFBA𡠌と字形が重複
TF-417C未記載 U+FFFB9稥と字形が重複
TF-4277未記載 U+FFFB8煷と字形が重複
TF-4324未記載 U+FFFB7煵と字形が重複
TF-4332未記載 U+FFFB6煱と字形が重複
TF-4342未記載 U+FFFB5獇と字形が重複
TF-4766未記載 U+FFFB4廍と字形が重複
TF-477B未記載 U+FFFB3慐と字形が重複
TF-4935未記載 U+FFFB2潉と字形が重複
TF-4961未記載 U+FFFB1熖と字形が重複
TF-4A4E未記載 U+FFFB0碷と字形が重複
TF-4B49未記載 U+FFFAF聣と字形が重複
TF-4C4A未記載 U+FFFAD賘と字形が重複
TF-4E5A未記載 U+FFFAC嶥と字形が重複
TF-4F45未記載 U+FFFAB樭と字形が重複
TF-4F60未記載 U+FFFAA澝と字形が重複
TF-5021未記載 U+FFFA9潨と字形が重複
TF-5067未記載 U+FFFA8磘と字形が重複
TF-5121未記載 U+FFFA7篐と字形が重複
TF-513B未記載 U+FFFA6緓と字形が重複
TF-5247未記載 U+FFFA5躼と字形が重複
TF-5261未記載 U+FFFA4鋴と字形が重複
TF-5450未記載 U+FFFA3懓と字形が重複
TF-552A未記載 U+FFFA2橺と字形が重複
TF-556C未記載 U+FFFA1燝と字形が重複
TF-557E未記載 U+FFFA0璤と字形が重複
TF-562A未記載 U+FFF9F璍と字形が重複
TF-5648未記載 U+FFF9E磮と字形が重複
TF-5730未記載 U+FFF9D朥と字形が重複
TF-574B未記載 U+FFF9C蕳と字形が重複
TF-585B未記載 U+FFF9B錿と字形が重複
TF-5862未記載 U+FFF9A鍂と字形が重複
TF-593B未記載 U+FFF99鮘と字形が重複
TF-5A68未記載 U+FFF98濸と字形が重複
TF-5B3A未記載 U+FFF97皼と字形が重複
TF-5D32未記載 U+FFF96鎆と字形が重複
TF-5D7E未記載 U+FFF95鵉と字形が重複
TF-6063未記載 U+FFF94蟵と字形が重複
TF-613B未記載 U+FFF93鎼と字形が重複
TF-613F未記載 U+FFF92鎽と字形が重複
TF-6250未記載 U+FFF91櫦と字形が重複
TF-626B未記載 U+FFF90瀮と字形が重複
TF-6273未記載 U+FFF8F爎と字形が重複
TF-633D未記載 U+FFF8E糭と字形が重複
TF-6353未記載 U+FFF8D藔と字形が重複
TF-6422未記載 U+FFF8B贌と字形が重複
TF-642F未記載 U+FFF8A鏱と字形が重複
TF-6437未記載 U+FFF89鏯と字形が重複
TF-6538未記載 U+FFF88櫵と字形が重複
TF-6549未記載 U+FFF87爘と字形が重複
TF-6559未記載 U+FFF86礢と字形が重複
TF-6665未記載 U+FFF85鐤と字形が重複
TF-6850未記載 U+FFF84趰と字形が重複
TF-6877未記載 U+FFF83霻と字形が重複
TF-694A未記載 U+FFF82欎と字形が重複
TF-694D未記載 U+FFF81欍と字形が重複
TF-6A73未記載 U+FFF80蠴と字形が重複
TF-6A7B未記載 U+FFF7F鑧と字形が重複
TF-6B28未記載 U+FFF7E鑦と字形が重複
TF-6C70未記載 U+FFF7D靍と字形が重複
TF-6D36未記載 U+FFF7C𩫳と字形が重複

CNS11643の「攵」と「攴」

CNS11643に含まれるいくつかの「攵」を部首として持つ漢字は、本来、 統合は不可能なはずのUCSの「攴」と統合されています。

UCS CNS
(CJKU_SR.txt)
03A81(㪁)T4-265E
03A88(㪈)T4-2D42
03A8C(㪌)T4-3228
03A8E(㪎)T4-322C
03A9C(㪜)T4-3D5C
03AA2(㪢)T5-462E
03AAC(㪬)T4-5B3A

CNS11643の字形ミス

UCS CNS注記
047CD(䟍)T4-694E 「八」が「心」になっています。
272F0(𧋰)T7-496B 「䖵」が「虫」になっています。

リンク・資料集