情報検索 :検索エンジンの実装と評価 5章の「クエリ処理」

「情報検索:検索エンジンの実装と評価」(Buttcher本) Advent Calendar2020の5日目の記事です。

adventar.org

情報検索 :検索エンジンの実装と評価 5章の「クエリ処理」をまとめます。

この章ではランキング検索と軽快な実装とよばれる手法についての説明されています。 本エントリーでは前半のクエリ処理について,DAATとTAATの違いについて扱います。

続きを読む

アプリの検索UI

はじめに

20個ほどの(Android)アプリの検索画面から共通している機能を分類しました。

ちなみに、筆者がデザイナー, アプリエンジニアではなくサーバーサイド中心にやっているエンジニアであることから、 今回は具体的なUIの話というより検索機能の視点での分類になっています。 以下ではアプリ=スマホネイティブアプリとします。

続きを読む

entity searchのメモ1

はじめに

Entity-Oriented Searchの読書めも www.springer.com

entityとは?

意味的には

  • 参照可能なこと thing
  • 参照可能なもの object
    • e.g. 人、物、場所、商品、イベント

特徴として複雑性をもつ。 単語だけではなにを指しているのかわからないもの。 例えば、"スーパーマン"といったときに指しているのは、映画のこと?映画の登場人物のこと?ヒーローのこと?どれかわからない。

プログラム的には

  • ERモデル
  • 実態と関係

knowledge repository(KR)データ構造

エンティティを表すデータ構造としてknowledge repository(KR)がある。

  • knowledge repository(KR)

    • エンティティのタイプ情報説明、属性(プロパティ), を含むエンティティのカタログ
  • knowledge base(KB)

    • 構造化されたエンティティのassertionsとのセットを含むknowledge repository

関係性として、KB => KRとなり、 逆はない。

構造として

  • KB > KR > entity
    • KB: ナレッジ同士の関係性
      • attribute
      • relationships
    • KR: entitiyの説明(おそらく。理解があいまい)
      • type
      • description
      • relationships
    • entitiry
    • id
    • name

検索の事例

TREC Entity (2009–2011) tracks

  • ユーザーが求めいてるのは文章ではなく答えである
  • e.g. トピックXの専門家はだれ?
    • というクエリの場合、トピックXの部分を入力としてランク付けされたリストを返す  - 文章から任意のエンティティタイプにまでひろげた.

google knowledge graph

  • おなじみのあれ

Entity-Oriented Search

  • エンティティ指向検索はエンティティとその属性や関係性を中心に情報を整理してアクセスする検索パラダイム

意義

ユーザー視点からみて、エンティティは情報を整理するための自然な単位。現実世界でもその関連性を考慮しているため、従来のテキストベースよりもユーザー体験が向上する。???? エンティティは検索クエリや文章の内容、ユーザーの理解を深めることができる

検索パラダイム

  • キーワード検索
  • 構造化検索
    • SQL とかでアクセスできる検索方法
  • キーワード検索+フィルター
    • e.g. 詳細検索、キーワードと特定フィールドのフィルター
  • 自然言語検索
    • 「日本の首都はどこ?」的なやつ
  • ゼロクエリ
    • ユーザーに入力させないレコメンドみたいなやつ

Entity-Oriented Searchのタスク

実態検索

web検索の40~70%は特定のエンティティをターゲットにしている それらのクエリにたいして実態を返す

知識表現

構造化されたデータと構造化されていないデータのギャップをうめる テキスト中のエンティティと知識ベースとを紐付ける

UX向上

ユーザーの情報ニーズを明確化させる エンティティをクエリと文章に結びつけることでコンテンツの理解を向上させる googleみたいなやつ