字形IDSデータ
字形IDSデータは、UCS漢字の字形を可能な限り、IDSで表記する試みです。本データは、CHISE 漢字情報構造データのブランチ(枝)として、IRGの標準化作業の一環として整備しています。
CHISE IDSの主枝と比較して、本枝は (1) 部品の表現にUCSのAnnex Sの規定を適用する (2) CJK統合漢字の字形差をできるだけ明確にする (3) DC (Description Character) にはUCS文字を可能な限り使用し、やむを得ない場合に限って、CDP外字を使用する、ようにしています。CDP外字には複数のバージョンが知られていますが、本データは中期バージョンを使用しています。詳細はこちらの一覧表を確認ください。現状では CDP の中期バージョンを、CDPのサイトからダウンロードするのは難しいため、GlyphWikiにて互換フォントを作成することを目指しています。
上記のうち、IDS-UCS-XXXX, IDS-CDP-XXXX の分が、開発該当部分です。なお、&CDP-XXYY; から、UCS(PUA)への変換式は以下の通りです。
Unicode = ((XX - 128) * 157) + (YY>129)?(YY-64):(YY-98) + 0xEE1B;
日本地名外字IDSデータ
日本地名外字IDSデータは、『汎用電子情報交換環境整備プログラム・文字対応作業委員会資料「地名外字」資料(平成20年3月 独立行政法人国立国語研究所)』に記載された外字地名をUCS化・IDS化し、用例の地名を引用、XML化して整理したものです。
本資料の利用にあたっては、必ず原典を参照ください。
日本国字外字IDSデータ
日本国字外字IDSデータは、『汎用電子情報交換環境整備プログラム・文字対応作業委員会資料「辞書非掲載字」資料(平成20年3月 独立行政法人国立国語研究所)』に記載された国字をUCS化・IDS化し、用例を引用、XML化して整理したものです。
本資料の利用にあたっては、必ず原典を参照ください。