DITA-OT htmlsearchプラグインへの、MeCab形態素解析エンジンの組み込みに成功!!
土曜日丸1日かかったけど、何とかMeCabの組み込みに成功した。きちんと日本語の形態素解析が行われるので、検索した単語が文書中にあれば確実にヒットするようになった。ハマッた点などについては、後日まとめる予定。
まだ、以下の課題が残っている。
?辞書を整備しないと、キーワードがヒットしない
例えば、「特殊」ではヒットするが、「特殊化」ではヒットしない
?キーワードが現れる頻度や、キーワードが使われている場所(title, indexterm, keyword, termなど)で重み付けをしないと、どのページから見るべきか判断できない
?キーワードをハイライト表示させたい
?Win32では動いたが、Win64ではまだ動かない
まともな全文検索を実装するのは、容易ではないなぁ。。。
GoogleやYahooなど、いつも何気なく使っているけど、実はスゴいんだなぁ・・・と敬服 <(_ _)>