異体字データベース

異体字データベースは、各種文献に記載されている異体字・関連字情報を収集・整理したものです。本データの一部は、情報処理学会 試行標準 IPSJ-TS 0008:2007 「大規模漢字集合の異体字構造」に記載されている異体字情報を整理、バグフィックスしたものです。

全ての異体字関係は、「トリプル」形式で表現されます。これは、「漢字A」、「関係」、「漢字B」の3項目をカンマで区切って表現するものです。関係に対してコメント情報がある場合は、さらに4項目目に記述しています。また、「関係1」,"<rev>",「関係2」のトリプルにより、逆関係も定義します。

Variants Database

    ファイル名    注記
UCS 互換漢字
compat-variants.txt
互換漢字対応表
部品異体字
component-variants.txt
漢字の特定部分が異体関係であるような異体字
重複文字
duplicate-chars.txt
UCSで誤って重複符号化された漢字の一覧表。
漢語大字典通假字
hydzd-interchangeable.txt
漢語大字典に記載されている通仮字一覧
漢語大字典異体字
hydzd-variants.txt
漢語大字典に記載されている異体字一覧。
表外漢字・異体字表
hyogai-variants.txt
表外漢字表に記載された印刷標準字体と簡易慣用字体の対応表
人名用漢字
jinmei-variants.txt
法務省・人名漢字表(2010年現在)の、別表2の1で同一の字種とされる漢字および人名漢字表 別表2の2で規定される異体字
JIS X 0213関係字
jisx0213-variants.txt
JIS X 0213 「関係字」
JIS X 0212関係字
jisx0212-variants.txt
JIS X 0212 「関係字」
常用漢字表異体字
joyo-variants.txt
文科省・常用漢字表に記載された異体字(2010年現在)
日本語の書き換え文字
jp-interchangeable.txt
『国語審議会の建議と報告』(昭和三十一年七月五日発表)のうち「同音の漢字による書きかえ」について(報告)に基づく一覧表。拡張新字体を含む。
繁体字・簡体字対応表
kdp-simplified.txt
簡化字総表・第一批異体字整理表・通用規範漢字表・GB 2312/7589/7590に基づく簡体字・繁体字の対応表
漢字・非漢字対応表
non-cjkui.txt
UCSにおける非漢字・擬似漢字と漢字の対応表
相対異体字一覧表
positional-variants.txt
漢字の構成部品の配置の差による異体字の一覧表
部首一覧表
radical-variants.txt
漢字の部品化字形と元字の対応一覧表
原規格分離一覧表
ucs-scs-variants.txt
ISO/IEC 10646 Annex S.3 例字一覧
JIS X 0213/0212 異体字
x0212-x0213-variants.txt
JIS X 0213 附属書11箇条3.2 に基づく異体字
第一批異体字整理表
yyb-variants.txt
第一批異体字整理表に基づく異体字一覧。1956年、1986年、1988年、1993年、1997年の改正データ含む。
漢字データベース異体字表
kdp-variants.txt
上記のいずれにも属さない関連字の一覧表