検索技術勉強会第1回に参加してきました
2019/2/26に検索技術勉強会というものに参加してきました。参加してきましたというか運営側での参加です。 そろそろ第2回が開催される時期ですが、会社向けに書いていたまとめをブログに投稿します。
検索勉強会とは
connpussから
検索技術勉強会の目的は、「検索」/「検索システム」にまつわる技術や手法に関して共有できる場を提供することです。検索エンジンごとの勉強会などもありますが、検索エンジンには関係なく、 「検索」というシステム、サービスを作る上で共通の解決すべき課題があります。 これらの課題をみんながどのように解決しているのかといった知識を共有できる場になればと思っています。
elasticの大谷さんとか検索界隈の強い人たちが、自分たちが聞きたいからやるという感じでやっています。昨日が初めて開催でした。 https://noti.st/johtani/ZsQG5A/search-engineering-tech-talk#swnRxKA
発表
いい「検索」とはないか
https://www.slideshare.net/shuryouchida/ss-133351464
memo
- リクルートテクノロジーの人
- 教科書のような発表。これは全部読むべき。
- システムだけではなくUIも大事。UIで解決されることもある。
- サービスによって「いい検索」は異なる。
- サービスの役割と紐づくように指標を設定しそれに貢献する検索機能を設計する
- システムとUIと両面から改善する
UI/UXが無意識に検索行動に与える影響について
https://www.slideshare.net/tairosan/uiux-133386571/tairosan/uiux-133386571
memo
- メルカリの人
- メルカリはSolor
- 検索チームが激強
- メルカリ検索したときにsoldoutを出しているのはわざと
- soldoutを消すと全KPIが下がる
- 買いたい人だけではなく売りたい人も検索している
- 適合率をあげて関連度の高い結果を出すようにしたらCTRが激下がりした
- 新着商品がわからないので、結果がほとんど変わらないから
- メルカリのUIでは1,2,3みたいなランキングはあまり意味ない。上位の塊に含まれていればOK
- 新着性 > 再現率 > 適合率
Efficient top-k query processing in Lucene 8
https://speakerdeck.com/mocobeta/efficient-top-k-query-processing-in-lucene-8
memo
- AIsamurai(特許データベースとかやっている)とこの人。この間までnewspicksにいたっぽい
- Solr本の著者。9章が、solrに関わらず日本語検索のことが書いてあって、検索の評価とか改善の話が書いてあるらしい
- Lucene8で追加されるtop-k queryで早くなるらしい。これはes7で導入される
- 特にOR検索が早くなる。うちのようにORが大量につながるクエリが早くなる。
- 検索結果が返ってこなくなる。オプションをつければ返ってくるが正確な検索数が必要なサービスはちゃんと検証しましょうとのこと
- 基本的に実装とかアルゴリズムの話。詳細な解説はブログにある
懇親会で話したこと
以下辞書=ユーザー辞書です。
- みんな辞書が必要なのではと考えるけど、実際ほんとに必要なのかはわからない
- 辞書追加は開発者の自己満
- たぶん、多くはなんとなくやっている。やっている人も追加するだけ。追加した辞書を削除してる人いないのでは。
- 当たり前だけど目的によるのに、意外と辞書はあるといいんでしょ?と考えられがち。使わないメソッドに今はつかってないみたいなコメントをつけてるのは非難するけど、使わない辞書は放置している
- 放置すると1年後とかに変な結果がでてきてハマる
- 測定して運用して結果どうなるのかやってみて発表するの面白そう
- ちょうど今辞書管理をどうするという話をしているので1,2ヶ月やってみて次回発表しようかな
精度の測定はみんな困ってるみたい。