漢字データのSQLでの利用

Using SQL for Kanji Database

漢字データスのSQLでの利用

漢字データベースのファイルは基本的にテキストファイルとして提供されています。これらのデータは、データベースソフトウェアに組み込むことで、情報の取得・検索などの処理を高速化できます。本ページでは、Unicode Consortiumの、"Unihan.zip" のデータや、漢字データベースのデータをSQLiteに入れる方法を紹介します。

UnihanデータベースのSQLでの利用

漢字データベースでは、"Unihan.zip" (version 6.1以降) のデータを、高速にSQLite3データベースに投入するスクリプトを用意していますのでご利用下さい

Unihan.sl3の利用例

以下に、Unihanから、日本語の訓「たたか（う）」を持つ漢字を検索する例を示します。

#
$ sqlite3 Unihan.sl3
$ select k,v from kJapaneseKun where v glob "TATAKA*";
U+6226|TATAKAU
U+6230|TATAKAU
U+95D8|TATAKAU
U+95D8|TATAKAI
U+9B25|TATAKAU
U+9B26|TATAKAU
U+9B2A|TATAKAU
U+9B2C|TATAKAU
U+9B2D|TATAKAU