汎用電子情報交換環境整備プログラム
Hanyo-Denshi
IVDに2番目に登録された、汎用電子情報交換環境整備プログラム(以下、汎用電子プログラム)コレクションは、日本の戸籍・住基・登記の各システムで登録・利用されている外字(漢字)グリフをUCSで利用可能にすることを目指します。
汎用電子プログラム委員会は2003年度から2008年度にかけて戸籍・住基・登記システムの調査とグリフ開発を行い、計67,951グリフを選定、当面は非漢字と判断された167文字をのぞき、577組1,173字を統合して、67,187漢字グリフを平成明朝体化しました。これらは「汎用電子情報交換環境整備プログラム成果報告書・別冊(2009年3月・全12分冊)」にまとめられています。
2009年度からは、ISO/IEC 10646:2011規格書のJ欄漢字に記載されるグリフも整理しました。2008年度までの成果のバグフィックスも含めて、これらの成果は、「汎用電子情報交換環境整備プログラム フォローアップ成果報告書(2011年3月)」等にまとめられています。
汎用電子コレクションに関するデータ
以下のデータのうち、グリフ識別子に ”*” が付記されているものは、「成果報告書・別冊」には記載されていないグリフです。これらは、主にUCS規格に関連するグリフです。汎用電子コレクションは、UCS規格書との整合性を高めるために、JA, JB, IA の規格書記載グリフなどを優先的に利用しているため、グリフ名やグリフ形状が、実際の汎用電子とは異なるものがあります。
- 汎用電子グリフ・UCS対応データ
- 本データは、汎用電子で管理しているグリフと、UCSの対応表です。 UCSコードの後ろに [U] とある場合はUCS規格書の代表字形であることを示します。また、[18]~[46]の数字がある場合は、このグリフがIVDに登録されていることを示します。 "~"で始まる他グリフID(*なし)を参照する場合は、汎用電子文字表ではそのグリフを参照します。 "="で始まる他グリフID(*付き)を参照する場合は、汎用電子コレクションはそのグリフを参照します。
- 汎用電子グリフ・AJ1-6 CID対応データ
- 本データは、汎用電子のコレクションのグリフと、アドビのコレクションのグリフのもっとも近いと思われる字形の参考対応表です。本対応表はあくまでも参考程度に留めてください。また、汎用電子IDに"*"が付いているグリフと、"*"がついていないグリフでCIDが重複する場合がありますので注意ください。なお、Adobe-Japan1と汎用電子の両コレクションとも、各グリフが包摂する字形範囲は暗示的です。そのため、将来、各コレクションがグリフを拡充・追加登録する過程において、コレクションをまたがる類似グリフの対応は変化する可能性があります。
平成明朝体グリフ名
汎用電子はグリフとして平成明朝体を採用しました。各行政システムで利用される漢字グリフを比較・統合し、対応する平成明朝体グリフを、既製の平成明朝体グリフから探し、不足分は新規に作字されました。以下は汎用電子で利用される既存の平成明朝体グリフの識別子の一覧です。(ただし、グリフ数に、改良版グリフ(末尾にSが付く)は除きます。)
平成明朝体グリフ | グリフ識別子 | グリフ数 | 説明 |
---|---|---|---|
JIS X 0208 | JA1601 - JA8406 | 6,355 | JIS X 0208:1990の規格書用のグリフ |
JIS X 0212 | JB1601 - JB7767 | 5,801 | JIS X 0212:1990の規格書用のグリフ |
FDPC追加 | FT1601 - FT3030 | 1,247 | 78JISの字形を追加 FDPC会員から要望のあった文字の追加 |
ISO/IEC 10646拡充対応1 | IA0101 - IA6730 | 5,658 | ISO/IEC 10646 統合漢字拡張Aの策定に際して作成された文字。(FDPC追加と重複の可能性がある) |
ISO/IEC 10646拡充対応2 | IB0101 - IB3313 | 2,742 | 人名、地名用漢字の追加(FDPC追加と重複の可能性がある) |
IPA向け漢字 | IP4E0F - IP9FA4 | 5,908 | JIS X 0221のCJK統合漢字の中で、X0208/0212に含ない文字で大漢和辞典に掲載されている漢字を追加(FDPC追加と重複の可能性がある) |
JIS X 0213 JIS3 | JC1402 - JC9489 | 1,249 | JIS X 0213:2000の規格書用のグリフ(以前作成したものの流用含む) |
JIS X 0213 JIS4 | JD0101 - JD9486 | 2,436 | JIS X 0213:2000の規格書用のグリフ(以前作成したものの流用含む) |
表外漢字不足 | HG1601 - HG1670 | 70 | 表外漢字字体表を作成するために、既存の平成明朝で不足している文字を追加 |
上記にないグリフは新規に作字されました。
母体文字 | グリフ識別子 | 文字数 | 新規作字数 | 説明 |
---|---|---|---|---|
住基統一文字 | JTxxxx | 19,432文字 | 約2,900文字追加。 | 住民基本台帳ネットワーク用の文字。 |
戸籍統一文字 | KSdddddd | 56,040文字 | 約30,000文字追加。 | JTにない戸籍システム用に作字した文字。 |
登記固有文字 | TKdddddddd | 10,330文字 | 約9,200文字追加。 | JT,KSにない登記システム用に作字した文字。 |
汎用電子コレクションのバグ
- U+067D7[18] における "JC8559" は、本来は "JB3532" が対応すべきものです。ただし名称のみで、字形に違いはありません。
- U+06BA9[19] における "JC8639" は、本来は "JC8639S" が対応すべきものです。
- U+07DCB[20] における "FT1664" は、使用を推奨されません。 "FT1664" と、U+07DCB[19] "JA4076" は、汎用電子「デザイン統一基準」(平成20年度成果報告書 4.4.4.2 参照)では、区別して扱わないことになっています。
汎用電子文字一覧のバグ
- 登記01053890(第3分冊1,349ページ)は、IB2290ではなくIB2291に割り当てられます。
- 別冊第04分冊・1667ページの JTB80E は、「糸へん」の代わりに「米へん」となっています。
- 別冊第11分冊・5269ページの TK01035730 は、「扌へん」の代わりに「木へん」となっています。
汎用電子文字一覧表の重複掲出字
汎用電子プログラムでは、住基・戸籍・登記等の各システムを整理した67,951文字に対し、デザイン統一基準の適用の結果、同じ形になるグリフや、明らかな原典(辞書等)重複記載に基づくもの、約580組に対して同じグリフを割り当てています。しかし、それでも未だ、多くの字形重複が残っています。以下はそれらを整理したものです。
大漢和辞典での重出に関連する重複
- KS161220(14344)とIA4342(29321)(第1分冊316ページ)
- KS255660(22838)とIA4349(29383)(第1分冊316ページ)
- KS246260(21951)とKS412000(36299)(第7分冊3,456ページ)
- KS066630(5812)とKS281590(25153)(第8分冊3,602ページ)
- KS315370(28229)とKS164030(14570)(第8分冊3,738ページ)
- KS102570(9063)とKS338340(30311)(第8分冊3,840ページ)
- KS428270(37829)とKS531620(46965)(第9分冊4,187ページ)
- KS527380(46574)とKS212170(18827)(第10分冊4,613ページ)
デザイン統一などに関連する重複
汎用電子デザイン統一基準では、「筆押さえ」の有無や「とめと払いの違い」を区別しないことになっていますが、この統一基準に反して区別しているものも含みます。
- IA0157とIB0604(第1分冊24ページ)
- IA0191とJTC0B6(第1分冊41ページ)
- IA0182SSとJTAEFB(第1分冊34ページ)
- IA0273とIB1794(第1分冊89ページ)
- IA0314SとJTB189(第1分冊105ページ)
- JTB3ABとIA0410S(第1分冊154ページ)
- KS203120とIA2846(第1分冊179ページ)
- TK01082800とIA0651(第1分冊355ページ)
- IA0679とIB2924(第1分冊379ページ)
- IB2949とIA0693(第1分冊389ページ)
- IA5175とTK01086620(第1分冊393ページ)
- JT5125とIP5125(第2分冊598ページ)
- JD8484とTK01073480(第2分冊608ページ)
- JB2459とJTAEA6(第2分冊782ページ)
- JTB051SとIA1607(第2分冊911ページ)
- JC8523とJTB29DS(第3分冊1,125ページ)
- JTB494 (第3分冊1,333ページ)とJTC0BF(第11分冊5,032ページ)
- KS256020とJA6615(第4分冊1,505ページ)
- IP7776(第4分冊1,523ページ)とTK01063070(第11分冊5,439ページ)
- TK01072860とJB5257(第4分冊1,702ページ)
- JA7659とJTBBDBS(第5分冊2,096ページ)
- KS440200とFT2605(第5分冊2,161ページ)
- KS443250SとFT2623(第5分冊2,177ページ)
- JTBFF0とJB7364S(第5分冊2,406ページ)
- KS544990とIP9EF3(第5分冊2,495ページ)
- KS008390とKS008560(第6分冊2,553ページ)
- KS083220とKS083420(第6分冊2,840ページ)
- JTB655(第6分冊2,837ページ)とTK01062790(第11分冊5,437ページ)
- KS310030とKS310790(第8分冊3,716ページ)
- KS315300(第8分冊3,736ページ)とTK01016420(第11分冊5,143ページ)
- KS435340とKS435610(第9分冊4,220ページ)
- JD8990とIB3017(第9分冊4,250ページ)
- KS509920とTK01099440(第10分冊4,538ページ)
- JD9344とJTC01AS(第10分冊4,602ページ)
- JTB49F(第10分冊4,985ページ)とTK01052370(第11分冊5,373ページ)
- JB3431とJTB29DS
- JD9344とJTC01AS
汎用電子関連情報
文字情報基盤
文字情報基盤では、汎用電子の成果を受け、その普及を促進することを目的に、IPAmjm明朝体を作成しました。ただし、本プロジェクトは汎用電子の成果を評価せずにそのままフォントを実装しているため、現在のβ版のフォントには多数の不具合があります。
関連リンク・参考文献
成果報告書別冊は、国会図書館や印刷図書館・国立国語研究所・北海道大学・東京外語大AA研・京都大学・大東文化大学等に所蔵されています。