2019/2/26に検索技術勉強会というものに参加してきました。参加してきましたというか運営側での参加です。そろそろ第２回が開催される時期ですが、会社向けに書いていたまとめをブログに投稿します。

検索勉強会とは

connpussから

検索技術勉強会の目的は、「検索」/「検索システム」にまつわる技術や手法に関して共有できる場を提供することです。検索エンジンごとの勉強会などもありますが、検索エンジンには関係なく、 「検索」というシステム、サービスを作る上で共通の解決すべき課題があります。
これらの課題をみんながどのように解決しているのかといった知識を共有できる場になればと思っています。

elasticの大谷さんとか検索界隈の強い人たちが、自分たちが聞きたいからやるという感じでやっています。昨日が初めて開催でした。 https://noti.st/johtani/ZsQG5A/search-engineering-tech-talk#swnRxKA

発表

いい「検索」とはないか

https://www.slideshare.net/shuryouchida/ss-133351464

memo

リクルートテクノロジーの人
教科書のような発表。これは全部読むべき。
システムだけではなくUIも大事。UIで解決されることもある。
サービスによって「いい検索」は異なる。
サービスの役割と紐づくように指標を設定しそれに貢献する検索機能を設計する
システムとUIと両面から改善する

UI/UXが無意識に検索行動に与える影響について

https://www.slideshare.net/tairosan/uiux-133386571/tairosan/uiux-133386571

memo

メルカリの人
メルカリはSolor
検索チームが激強
- google, yahoo, 楽天, リクルートの検索やってた人がいっぱい
- Solor本の著者6人のうち3人がいる
メルカリ検索したときにsoldoutを出しているのはわざと
- soldoutを消すと全KPIが下がる
- 買いたい人だけではなく売りたい人も検索している
適合率をあげて関連度の高い結果を出すようにしたらCTRが激下がりした
- 新着商品がわからないので、結果がほとんど変わらないから
メルカリのUIでは１，２，３みたいなランキングはあまり意味ない。上位の塊に含まれていればOK
新着性 > 再現率 > 適合率

Efficient top-k query processing in Lucene 8

https://speakerdeck.com/mocobeta/efficient-top-k-query-processing-in-lucene-8

memo

AIsamurai(特許データベースとかやっている)とこの人。この間までnewspicksにいたっぽい
Solr本の著者。9章が、solrに関わらず日本語検索のことが書いてあって、検索の評価とか改善の話が書いてあるらしい
Lucene8で追加されるtop-k queryで早くなるらしい。これはes7で導入される
- 特にOR検索が早くなる。うちのようにORが大量につながるクエリが早くなる。
- 検索結果が返ってこなくなる。オプションをつければ返ってくるが正確な検索数が必要なサービスはちゃんと検証しましょうとのこと
基本的に実装とかアルゴリズムの話。詳細な解説はブログにある

懇親会で話したこと

以下辞書＝ユーザー辞書です。

みんな辞書が必要なのではと考えるけど、実際ほんとに必要なのかはわからない
辞書追加は開発者の自己満
たぶん、多くはなんとなくやっている。やっている人も追加するだけ。追加した辞書を削除してる人いないのでは。
当たり前だけど目的によるのに、意外と辞書はあるといいんでしょ？と考えられがち。使わないメソッドに今はつかってないみたいなコメントをつけてるのは非難するけど、使わない辞書は放置している
- 放置すると１年後とかに変な結果がでてきてハマる
測定して運用して結果どうなるのかやってみて発表するの面白そう
- ちょうど今辞書管理をどうするという話をしているので1,2ヶ月やってみて次回発表しようかな

精度の測定はみんな困ってるみたい。

検索メモ

検索技術勉強会第１回に参加してきました

検索勉強会とは

発表

いい「検索」とはないか

memo

UI/UXが無意識に検索行動に与える影響について

memo

Efficient top-k query processing in Lucene 8

memo

懇親会で話したこと