2019-04-28から1日間の記事一覧

sudachiの分割モードを複数使ってword2vecの精度を上げる

tl;dr 日本語でword2vecするには、学習用コーパスの分かち書きに大きく依存するけど、sudachiを使って複数の分割粒度を同時に使って学習したらいい感じになるよ。っていう論文があったので、pythonでやってみた。 論文紹介 「複数粒度の分割結果に基づく日本…