ページ ツリー

Contents

質問

HipChatのHistoryから日本語のキーワードで検索した場合、想定以上の検索結果が出力されてしまいます。
以下で報告されているような現象に遭遇します。
http://help.hipchat.com/forums/138883-suggestions-ideas/suggestions/5811297-unable-to-search-chat-history-in-japanese-with-hir
これは仕様でしょうか?

回答

(警告) HipChatの実装やソースコードは公開されていないためこの情報は不確実です。

公開されている情報から推測する限り…

HipChatでは、検索ライブラリにLuceneを使っており Analyzerを StandardAnalyzer (推測) で検索インデックスを作っているためです。

下記情報より、HipChatでは検索システムに Elasticsearch を利用しているようです。
https://blog.hipchat.com/2013/10/16/how-hipchat-scales-to-1-billion-messages/
https://blog.hipchat.com/2014/06/24/elasticsearch-at-hipchat-10x-faster-queries/

(情報) Elasticsearch (http://www.elasticsearch.org/) は大規模向けな検索エンジンシステムで、内部的に Luceneを使って実装されています。

Lucene ではデフォルトが OR検索 に設定されており、StandardAnalyzer では、漢字・ひらがなは1文字区切り、カタカナ、英語はトークン単位にインデックスが作られます。

 

そのため、漢字やひらがなで検索すると、以下のようなクエリに内部変換されて、検索結果が多く出てきます。

 

問い合わせ

問 OR い OR 合 OR わ OR せ

回避策

検索キーワードをダブルコーテーション「”」で囲む検索方法(フレーズ検索)を活用してください。

"問い合わせ"

で検索すると減らすことができます。

This page has no comments.