漢字データのSQLでの利用

Using SQL for Kanji Database

漢字データスのSQLでの利用

漢字データベースのファイルは基本的にテキストファイルとして提供され ています。これらのデータは、データベースソフトウェアに組み込むことで、 情報の取得・検索などの処理を高速化できます。本ページでは、Unicode Consortiumの、"Unihan.zip" のデータや、漢字データベースのデータ をSQLiteに入れる方法を紹介します。

UnihanデータベースのSQLでの利用

漢字データベースでは、"Unihan.zip" (version 5.2以降) のデータを、簡単にSQLデータベースに投入するスクリプトを用意していますのでご利用下さい

Unihan.sl3の利用例

以下に、Unihanから、日本語の訓「たたか(う)」を持つ漢字を検索する例を示します。

#
$ sqlite3 Unihan.sl3
$ select k,v from kJapaneseKun where v glob "TATAKA*";
U+6226|TATAKAU
U+6230|TATAKAU
U+95D8|TATAKAU
U+95D8|TATAKAI
U+9B25|TATAKAU
U+9B26|TATAKAU
U+9B2A|TATAKAU
U+9B2C|TATAKAU
U+9B2D|TATAKAU