無料ブログ「rentafree.net」の管理人ブログ

検索インデックスの生成処理を変更しました。

随分前から問題点を認識しつつ放置していましたが、ブログ検索インデックスの生成処理を改善しました。

検索リクエストが発生した際にインデックスの生成を、元々は一番古い記事から順に生成していましたが、
記事数が多くタイムアウトが発生した場合に新しい記事を優先して検索した結果を返すべきだと思うので改善しました。
キーワードの初回リクエスト時に最新記事から順に検索して、2回目以降は「新しい方→古い方」の順で双方に向かって検索範囲を広げるようにしました。
また、スペース区切りの単語数が6以上の場合6個目以降無視されるようになりました。

記事数が少なければ1発で全件のインデックスが作成されます。


Wikiの検索にも同様の問題がありますが、ブログに比べて利用者少ないしめんどいから当面放置。