汎用電子情報交換環境整備プログラム

Hanyo-Denshi

IVDに2番目に登録された、汎用電子情報交換環境整備プログラム(以下、汎用電子プログラム)コレクションは、日本の戸籍・住基・登記の各システムで登録・利用されている外字(漢字)グリフをUCSで利用可能にすることを目指します。

汎用電子プログラム委員会は2003年度から2008年度にかけて戸籍・住基・登記システムの調査とグリフ開発を行い、計67,951グリフを選定、当面は非漢字と判断された167文字をのぞき、577組1,173字を統合して、67,187漢字グリフを平成明朝体化しました。これらは「汎用電子情報交換環境整備プログラム成果報告書・別冊(2009年3月・全12分冊)」にまとめられています。

2009年度からは、ISO/IEC 10646:2011規格書のJ欄漢字に記載されるグリフも整理しました。2008年度までの成果のバグフィックスも含めて、これらの成果は、「汎用電子情報交換環境整備プログラム フォローアップ成果報告書(2011年3月)」等にまとめられています。

汎用電子コレクションに関するデータ

以下のデータのうち、グリフ識別子に ”*” が付記されているものは、「成果報告書・別冊」には記載されていないグリフです。これらは、主にUCS規格に関連するグリフです。汎用電子コレクションは、UCS規格書との整合性を高めるために、JA, JB, IA の規格書記載グリフなどを優先的に利用しているため、グリフ名やグリフ形状が、実際の汎用電子とは異なるものがあります。

汎用電子グリフ・UCS対応データ
本データは、汎用電子で管理しているグリフと、UCSの対応表です。 UCSコードの後ろに [U] とある場合はUCS規格書の代表字形であることを示します。また、[18]~[46]の数字がある場合は、このグリフがIVDに登録されていることを示します。 "~"で始まる他グリフID(*なし)を参照する場合は、汎用電子文字表ではそのグリフを参照します。 "="で始まる他グリフID(*付き)を参照する場合は、汎用電子コレクションはそのグリフを参照します。
汎用電子グリフ・AJ1-6 CID対応データ
本データは、汎用電子のコレクションのグリフと、アドビのコレクションのグリフのもっとも近いと思われる字形の参考対応表です。本対応表はあくまでも参考程度に留めてください。また、汎用電子IDに"*"が付いているグリフと、"*"がついていないグリフでCIDが重複する場合がありますので注意ください。なお、Adobe-Japan1と汎用電子の両コレクションとも、各グリフが包摂する字形範囲は暗示的です。そのため、将来、各コレクションがグリフを拡充・追加登録する過程において、コレクションをまたがる類似グリフの対応は変化する可能性があります。

平成明朝体グリフ名

汎用電子はグリフとして平成明朝体を採用しました。各行政システムで利用される漢字グリフを比較・統合し、対応する平成明朝体グリフを、既製の平成明朝体グリフから探し、不足分は新規に作字されました。以下は汎用電子で利用される既存の平成明朝体グリフの識別子の一覧です。(ただし、グリフ数に、改良版グリフ(末尾にSが付く)は除きます。)

平成明朝体グリフグリフ識別子グリフ数説明
JIS X 0208JA1601 - JA84066,355JIS X 0208:1990の規格書用のグリフ
JIS X 0212JB1601 - JB7767 5,801JIS X 0212:1990の規格書用のグリフ
FDPC追加FT1601 - FT30301,24778JISの字形を追加
FDPC会員から要望のあった文字の追加
ISO/IEC 10646拡充対応1IA0101 - IA67305,658ISO/IEC 10646 統合漢字拡張Aの策定に際して作成された文字。(FDPC追加と重複の可能性がある)
ISO/IEC 10646拡充対応2IB0101 - IB33132,742人名、地名用漢字の追加(FDPC追加と重複の可能性がある)
IPA向け漢字IP4E0F - IP9FA45,908JIS X 0221のCJK統合漢字の中で、X0208/0212に含ない文字で大漢和辞典に掲載されている漢字を追加(FDPC追加と重複の可能性がある)
JIS X 0213 JIS3JC1402 - JC94891,249JIS X 0213:2000の規格書用のグリフ(以前作成したものの流用含む)
JIS X 0213 JIS4JD0101 - JD94862,436JIS X 0213:2000の規格書用のグリフ(以前作成したものの流用含む)
表外漢字不足HG1601 - HG167070表外漢字字体表を作成するために、既存の平成明朝で不足している文字を追加

上記にないグリフは新規に作字されました。

母体文字グリフ識別子文字数新規作字数説明
住基統一文字JTxxxx19,432文字約2,900文字追加。住民基本台帳ネットワーク用の文字。
戸籍統一文字KSdddddd56,040文字約30,000文字追加。JTにない戸籍システム用に作字した文字。
登記固有文字TKdddddddd10,330文字約9,200文字追加。JT,KSにない登記システム用に作字した文字。

汎用電子コレクションのバグ

汎用電子文字一覧のバグ

汎用電子文字一覧表の重複掲出字

汎用電子プログラムでは、住基・戸籍・登記等の各システムを整理した67,951文字に対し、デザイン統一基準の適用の結果、同じ形になるグリフや、明らかな原典(辞書等)重複記載に基づくもの、約580組に対して同じグリフを割り当てています。しかし、それでも未だ、多くの字形重複が残っています。以下はそれらを整理したものです。

大漢和辞典での重出に関連する重複
デザイン統一などに関連する重複

汎用電子デザイン統一基準では、「筆押さえ」の有無や「とめと払いの違い」を区別しないことになっていますが、この統一基準に反して区別しているものも含みます。

汎用電子関連情報

文字情報基盤

文字情報基盤では、汎用電子の成果を受け、その普及を促進することを目的に、IPAmjm明朝体を作成しました。ただし、本プロジェクトは汎用電子の成果を評価せずにそのままフォントを実装しているため、現在のβ版のフォントには多数の不具合があります。

関連リンク・参考文献

成果報告書別冊は、国会図書館や印刷図書館・国立国語研究所・北海道大学・東京外語大AA研・京都大学・大東文化大学等に所蔵されています。