漢字画数データベース
Kanji Strokes Database
漢字画数データベースについて
本データベースは、UCSのBMP/Ext-B/Ext-Cの全統合漢字データに対し、可能な限り正確な画数のデータベースを提供します。 Unihan.txt の"kTotalStrokes" 情報は、康煕字典の数え方を主体としつつ、 一部に簡体字風な画数の数え方が混じるなど一貫性に欠け、多数の誤りがあり、 また拡張漢字B, Cの画数情報は提供されていません。 本データベースは、これらの問題を解決し、IDSと組合せた漢字の検索に対して十分な実用性を提供できることを目指して開発されました。
本データは UCS の BMP/Ext-B/Ext-Cの全統合漢字に対し、可能な限り正確な画数データを提供します。 本データは、3部首(艹・礻・辶)のように、複数の画数の数え方がある漢字部品に対しては、 「必ず」複数の画数を与えるようにしています。
そのため、たとえば「草冠+4画」の検索を行いたい場合は、 IDSデータに対する検索と組み合わせ、画数としては 7(3+4)画と 8(4+4)画の検索結果の「共通集合」を取ることで、目的の検索を行うことができます。 詳細はメインページのSQL操作例を参照ください。
複数の数え方がある主な漢字部首・部品にいて
下表に、複数の数え方がある漢字部品の一覧(例)を示します。
漢字部品 | 日本 | 康煕字典 | 中国 | 備考 |
---|---|---|---|---|
及 | 3 | 4 | 3 | |
㐄 | 4 | 3 | 3 | |
牙 | 5 | 4 | 4 | 一部辞書は4画。 |
旡 | 5 | 4 | 4 | 一部辞書は4画。 |
瓜 | 6 | 5 | 6 | |
着 | 12 | 11 | 「著」俗字 | |
瓦 | 5 | 5 | 4 | |
礻 | 4 | 5 | 4 | |
禸 | 4 | 5 | 「禸」の厶は3画、「私」の厶は2画。 | |
艹 | 3 | 4 | 3 | 「艹󠄀」は3画、「艹󠄂」は4画。 |
衤 | 5 | 6 | 5 | |
骨 | 10 | 10 | 9 | |
辶 | 3 | 4 | 3 | 「辶󠄁」は3画、「辶󠄀」は4画。 |
成 | 6 | 7 | 6 | 「成󠄀」は6画、「成󠄁」は7画。 |
臣 | 7 | 6 | 7 | 常用漢字7画、それ以外6画とする辞書もあります。 |
爵 | 17 | 18 | 爵が旧字形の場合は18画。 |