漢字データのSQLでの利用
Using SQL for Kanji Database
漢字データスのSQLでの利用
漢字データベースのファイルは基本的にテキストファイルとして提供され ています。これらのデータは、データベースソフトウェアに組み込むことで、 情報の取得・検索などの処理を高速化できます。本ページでは、Unicode Consortiumの、"Unihan.zip" のデータや、漢字データベースのデータ をSQLiteに入れる方法を紹介します。
UnihanデータベースのSQLでの利用
漢字データベースでは、"Unihan.zip" (version 6.1以降) のデータを、高速にSQLite3データベースに投入するスクリプトを用意していますのでご利用下さい
Unihan.sl3の利用例
以下に、Unihanから、日本語の訓「たたか(う)」を持つ漢字を検索する例を示します。
#
$ sqlite3 Unihan.sl3
$ select k,v from kJapaneseKun where v glob "TATAKA*";
U+6226|TATAKAU
U+6230|TATAKAU
U+95D8|TATAKAU
U+95D8|TATAKAI
U+9B25|TATAKAU
U+9B26|TATAKAU
U+9B2A|TATAKAU
U+9B2C|TATAKAU
U+9B2D|TATAKAU