DITA-OT htmlsearchプラグインへの、MeCab形態素解析エンジンの組み込みに成功!!

土曜日丸1日かかったけど、何とかMeCabの組み込みに成功した。きちんと日本語の形態素解析が行われるので、検索した単語が文書中にあれば確実にヒットするようになった。ハマッた点などについては、後日まとめる予定。
まだ、以下の課題が残っている。

?辞書を整備しないと、キーワードがヒットしない
例えば、「特殊」ではヒットするが、「特殊化」ではヒットしない

?キーワードが現れる頻度や、キーワードが使われている場所(title, indexterm, keyword, termなど)で重み付けをしないと、どのページから見るべきか判断できない

?キーワードをハイライト表示させたい

?Win32では動いたが、Win64ではまだ動かない

まともな全文検索を実装するのは、容易ではないなぁ。。。
GoogleやYahooなど、いつも何気なく使っているけど、実はスゴいんだなぁ・・・と敬服 <(_ _)>