Webマーケティングの「コールドスタート問題」とはー現状の解決方法ー
レコメンド機能でおすすめされた商品を、思わず購入してしまった経験はありませんか?
レコメンド機能は、多くのユーザーの行動履歴データを分析して「あなたへのおすすめ」の商品をレコメンド(おすすめ)してくれます。ユーザーにとっては「興味がある商品・ページが表示されやすくなる」という利点があります。レコメンド機能は、データ分析によってユーザー一人一人のおすすめをレコメンドしてくれる、とても便利な機能なのです。
そんなレコメンド機能ですが、「データの蓄積が少ない頃」はどのようにして「おすすめ」を割り出しているのでしょうか?
ユーザーの行動データが極端に少ない状態だと、分析できるデータがほとんど存在しません。そのため、ユーザーに適切な「おすすめ」ができなくなってしまう可能性が高まります。
結果、「あまり興味のないおすすめ情報や、脈絡のない商品をおすすめされる」なんてことになると、レコメンド機能は便利どころかむしろ逆効果になってしまう可能性さえありますよね。
調べてみると、どうやらそのような問題は本当に存在するらしく、既に
「コールドスタート問題」
という名前が付けられているようです。
今回はこのコールドスタート問題について、整理していきたいと思います。
1.コールドスタート問題とは
Cold-Start問題(コールドスタート問題)とは、機械学習を用いたウェブマーケティングにおける課題の一つで、例えばECサイトなどでユーザーに商品などを推薦する際に、数件しかデータのない過去ログを参考にユーザーに商品を提案した場合、一部の人気商品ばかりが提案されることになるという問題ということです。*1
まだユーザーの目に触れたことのない商品などはおすすめされず、サイトからのおすすめ商品が新規性のないものになってしまうことにより、多様性が失われます。
あまりにもワンパターンなレコメンドになると、ユーザーはそのシステムをむしろ邪魔に感じるという状態も想像できます。
以上のような状態では、レコメンドがうまくいっているとは言い難いですから、このコールドスタート問題を解決する必要があります。
2.現状の解決方法
現状では、この問題の解決方法として以下のような方法が挙げられています。*2
- ハイブリッド・タイプ
- 半教師学習
1.ハイブリッド・タイプ
「様々な手法を組み合わせてレコメンドすること」です。
いろいろなフィルタイリングの方法を組み合わせて、解決しようというものです。ハイブリッド・レコメンデーション・システムとも呼ばれ、救数のレコメンデーションの技術を使用することで、先ほどの機械学習を用いたコールドスタート問題の解決を図る手法です。
2.半教師学習
すでに観測されたデータとまだ観測されていないデータの両方を使用し、少量の観測済みデータを用いることで、大量の未観測データを学習することができるというものです。*3
実際にこの半教師学習と、「特異値分解」という分解手法を用いてコールドスタート問題を解決する実験をしている文献もありますので、参考にしてみてはいかがでしょうか。*4
現状では、上に挙げた二つが解決方法として挙げられているようです。
新たな解決方法が見つかった場合は、また報告したいと思います。