字形IDSデータ

字形IDSデータは、UCS漢字の字形を可能な限り、IDSで表記する試みです。本データは、CHISE 漢字情報構造データのブランチ(枝)として、IRGの標準化作業の一環として整備しています。

CHISE IDSの主枝と比較して、本枝は (1) 部品の表現にUCSのAnnex Sの規定を適用する (2) CJK統合漢字の字形差をできるだけ明確にする (3) DC (Description Character) にはUCS文字を可能な限り使用し、やむを得ない場合に限って、CDP外字を使用する、ようにしています。CDP外字には複数のバージョンが知られていますが、本データは中期バージョンを使用しています。詳細はこちらの一覧表を確認ください。現状では CDP の中期バージョンを、CDPのサイトからダウンロードするのは難しいため、GlyphWikiにて互換フォントを作成することを目指しています。

上記のうち、IDS-UCS-XXXX, IDS-CDP-XXXX の分が、開発該当部分です。なお、&CDP-XXYY; から、UCS(PUA)への変換式は以下の通りです。

 Unicode = ((XX - 128) * 157) + (YY>129)?(YY-64):(YY-98) + 0xEE1B;

日本地名外字IDSデータ

日本地名外字IDSデータは、『汎用電子情報交換環境整備プログラム・文字対応作業委員会資料「地名外字」資料(平成20年3月 独立行政法人国立国語研究所)』に記載された外字地名をUCS化・IDS化し、用例の地名を引用、XML化して整理したものです。

本資料の利用にあたっては、必ず原典を参照ください。

日本国字外字IDSデータ

日本国字外字IDSデータは、『汎用電子情報交換環境整備プログラム・文字対応作業委員会資料「辞書非掲載字」資料(平成20年3月 独立行政法人国立国語研究所)』に記載された国字をUCS化・IDS化し、用例を引用、XML化して整理したものです。

本資料の利用にあたっては、必ず原典を参照ください。

IDS Data

'IDS Data' are an attempt to describe Unified CJK Ideographics by the IDS. These data are based on, and branch project of CHISE Kanji Structure Information Database.

For the DCs (Description Characters) that are not encoded in the UCS, the EUDCs (End-User Defined Characters) of CDP (Chinese Document Processing Lab) are used instead. The font file for the CDP-EUDC (`cdpeudc.tte') can be obtained from this archive.

These data have been used in the standardization activities at ISO/IEC JTC1/SC2/WG2/IRG. By referring these data, newly proposed Ideographs for Extension-C and Extension-D are also converted to the IDS. These data are used for detecting the duplicate/unifiable characters.