漢字画数データベース

Kanji Strokes Database

本データベースは、UCSのBMP/Ext-B/Ext-Cの全統合漢字データに対し、可能な限り正確な画数のデータベースを提供します。 Unihan.txt の"kTotalStrokes" 情報は、康煕字典の数え方を主体としつつ、 一部に簡体字風な画数の数え方が混じるなど一貫性に欠け、多数の誤りがあり、 また拡張漢字B, Cの画数情報は提供されていません。 本データベースは、これらの問題を解決し、IDSと組合せた漢字の検索に対して十分な実用性を提供できることを目指して開発されました。

本データは UCS の BMP/Ext-B/Ext-Cの全統合漢字に対し、可能な限り正確な画数データを提供します。 本データは、3部首(艹・礻・辶)のように、複数の画数の数え方がある漢字部品に対しては、 「必ず」複数の画数を与えるようにしています。

そのため、たとえば「草冠+4画」の検索を行いたい場合は、 IDSデータに対する検索と組み合わせ、画数としては 7(3+4)画と 8(4+4)画の検索結果の「共通集合」を取ることで、目的の検索を行うことができます。 詳細はメインページのSQL操作例を参照ください。

複数の数え方がある主な漢字部首・部品

下表に、複数の数え方がある漢字部品の一覧(例)を示します。

漢字部品画数備考
3,4
4,5
17,18
5,6康煕字典では5画ですが、日本では6画で数える場合があります。
4,5中国の標準字体では4画で数えます。
4,5礻偏は康煕字典では4画で数えます。
4,5禸の厶は正式には3画で、「私」の厶は2画です。
6,7康煕字典では6画ですが、日本では7画で数える場合があります。
3,4
5,6衤偏は康煕字典では6画と数えます。
9,10
3,4
3,4
𦣝7,8
𦣞7,8