ここでは、前章で触れなかった諸々の細かな注意点をいくつか記しておきます。
FreePWING では、文字コードに EUC-JP を使用していますが、正確には
honmon
ファイルの中では JIS X 0208 の文字 (全角文字) しか
使用できません。
このため、JIS X 0201 のカタカナ (半角カタカナ) および ASCII の文字
(半角英数字) が与えられると、FreePWING 側で対応する JIS X 0208 の文字
に置き換えられます。
また、JIS X 0212 の文字 (補助漢字) は使用することができず、与えると エラーになります。
JIS X 0213 で定義されている第三、第四水準漢字については、扱いが微妙 です。 FreePWING 自体は「文字コードに EUC-JP を用いる」としていますが、 第四水準漢字を用いないという制限付きであれば、代わりに EUC-JIS-2004 を使用しても動作上の問題は生じません。 JIS X 0208 にしても、JIS X 0213 の第四水準を除外した部分にしても、 どちらも ISO 2022 でいう「G1 の範囲内」だからです。
FreePWING によって生成された書籍データについても、この点は同じです。 「G1 の範囲内」で収まっているが故に、多くの検索ソフトウェアでは、 書籍データアクセス時にエラーを起こすようなことはないと思います。 あとは、検索ソフトウェア側で EUC-JIS-2004 を表示および検索語として 入力できるか否かでしょう。 これはソフトウェア次第なので、何とも言えません。
とはいえ、JIS X 0418 の最大の特長は、動作環境に依存しない書籍データ 形式であることですので、書籍データは多くの環境で読めるのが望ましい でしょう。 したがって、第三、第四水準漢字の採用は、慎重にすべきだと思います。
検索語に関する注意点は、次の通りです。
本文の各エントリの冒頭では、以下のように add_keyword_start()
と add_keyword_end()
で囲い、囲った部分が検索キーであると
いう印を付けるようにすることは既に記しました。
## 読み込んだ見出しを「本文部」に書き込む。 if (!$fpwtext->add_keyword_start() || !$fpwtext->add_text($_) || !$fpwtext->add_keyword_end() || !$fpwtext->add_newline()) { die $fpwtext->error_message() . "\n"; }
EPWING の検索ソフトウェアによっては、この検索キーのを本文の切れ目を 意味する印として扱っているものもあります。 こうした検索ソフトウェアでは、2 度目の検索キー開始指定子が出現すると、 そこが次のエントリの開始位置であり、今のエントリが終了したのだと判断 して、そこで本文の表示、出力を止めるようになっています。 したがって、このような検索ソフトウェアで正しく書籍の本文が表示、出力 されるように考慮して、検索キーの指定をエントリの冒頭で入れることが推奨 されます。 さもないと、次のエントリ、次の次のエントリ、とどこまでも本文を表示、 出力してしまいます。
逆に、必要があればエントリの途中で検索キーを置いても構いませんが、 むやみに置いてしまうと、エントリの本文の出力がそこで途切れてしまうこと になります。 検索キーの配置は慎重に行って下さい。