青空文庫の関連プロジェクト
青空文庫文法プロセッサ・ aozora-proc.el
aozora-proc は、青空文庫の注記記法の誤りをチェックし、 HTML5, LaTeX, IDML (Story.xml … 開発中) への出力を行うツールです。
本ツールは、以下の特徴があります。
- 青空文庫の注記を解析表現文法で解析し、中間データへ変換します。そのため、パーザ部分は実質的にプログラムコードがなく、簡潔に記述されます。
- 中間データからは、HTML5, LaTeX, IDML等、様々なマークアップ言語へ変換できます。
- UCS漢字とアクセント付き欧文のUCSに対応しています。現状では青空文庫での利用が確認されている非JIS X 0208漢字8,000字程度が利用できます。
- org-mode 等、既存のアウトラインプロセッサへの組込みが可能になるよう、APIを提供しています。
- シェルスクリプトからのバッチ処理で、複数の作品を一括変換できます。
本プログラムはまだ青空文庫の注記の一部しか対応していませんが、プログラム末尾の解析後の出力設定部分を適当に拡張・変更することで、自由にカスタマイズ可能です。
青空文庫・修正プロジェクト
青空文庫のテキストには様々なミスや、現在の注記記法には従っていない注記があります。 修正プロジェクトは、これらの注記の修整を行います。
その他の情報
- Internet Explorer のルビサポートに関する情報
Aozora Bunko
- Aozora Bunko Data, compressed by
".tar.xz" format, all encoded by the UTF-8, is deistributed by
bittorrent.