情報検索 :検索エンジンの実装と評価 5章の「クエリ処理」
entity searchのメモ1
はじめに
Entity-Oriented Searchの読書めも www.springer.com
entityとは?
意味的には
- 参照可能なこと thing
- 参照可能なもの object
- e.g. 人、物、場所、商品、イベント
特徴として複雑性をもつ。 単語だけではなにを指しているのかわからないもの。 例えば、"スーパーマン"といったときに指しているのは、映画のこと?映画の登場人物のこと?ヒーローのこと?どれかわからない。
プログラム的には
- ERモデル
- 実態と関係
knowledge repository(KR)データ構造
エンティティを表すデータ構造としてknowledge repository(KR)がある。
knowledge repository(KR)
- エンティティのタイプ情報説明、属性(プロパティ), を含むエンティティのカタログ
knowledge base(KB)
- 構造化されたエンティティのassertionsとのセットを含むknowledge repository
関係性として、KB => KRとなり、 逆はない。
構造として
- KB > KR > entity
- KB: ナレッジ同士の関係性
- attribute
- relationships
- KR: entitiyの説明(おそらく。理解があいまい)
- type
- description
- relationships
- entitiry
- id
- name
- KB: ナレッジ同士の関係性
検索の事例
TREC Entity (2009–2011) tracks
- ユーザーが求めいてるのは文章ではなく答えである
- e.g. トピックXの専門家はだれ?
- というクエリの場合、トピックXの部分を入力としてランク付けされたリストを返す - 文章から任意のエンティティタイプにまでひろげた.
google knowledge graph
- おなじみのあれ
Entity-Oriented Search
- エンティティ指向検索はエンティティとその属性や関係性を中心に情報を整理してアクセスする検索パラダイム
意義
ユーザー視点からみて、エンティティは情報を整理するための自然な単位。現実世界でもその関連性を考慮しているため、従来のテキストベースよりもユーザー体験が向上する。???? エンティティは検索クエリや文章の内容、ユーザーの理解を深めることができる
検索パラダイム
- キーワード検索
- 構造化検索
- SQL とかでアクセスできる検索方法
- キーワード検索+フィルター
- e.g. 詳細検索、キーワードと特定フィールドのフィルター
- 自然言語検索
- 「日本の首都はどこ?」的なやつ
- ゼロクエリ
- ユーザーに入力させないレコメンドみたいなやつ
Entity-Oriented Searchのタスク
実態検索
web検索の40~70%は特定のエンティティをターゲットにしている それらのクエリにたいして実態を返す
知識表現
構造化されたデータと構造化されていないデータのギャップをうめる テキスト中のエンティティと知識ベースとを紐付ける
UX向上
ユーザーの情報ニーズを明確化させる エンティティをクエリと文章に結びつけることでコンテンツの理解を向上させる googleみたいなやつ