テクノロジー|分析力をコアとする情報最適化企業・株式会社ALBERT(アルベルト)レコメンデーション

2005年、ALBERTは「レコメンデーションの専門企業」として設立されました。レコメンデーションはALBERTの原点であり、専門企業としてあらゆるタイプのレコメンドテクノロジーを保有しています。しかしながら、数年前はレコメンデーションということばの概念整理もできておらず、業界内での誤解もありました。そこで、ALBERTが専門企業として構築したのが、このレコメンデーションの定義であり分類です。

レコメンデーションとは

レコメンデーションとは、対象者にとって価値があると思われるコンテンツ(商品や情報)をより個別的に提示することです。必ずしもインターネットの世界だけではなく、初めて店頭に訪れた顧客に「今日はサンマが旨いよ!」という行為も、マクドナルドで「ご一緒にポテトもいかがですか?」という店頭でのおすすめもALBERTではレコメンデーションの一つと考え、より広く網羅的な解釈をしています。なぜならレコメンデーションの原点は、店頭での顧客対応にあると考えており、行きつけの魚屋さんや地域家電店が、なぜ顧客に最適な商品をお薦めできるのかをマーケティングサイエンス的視点で分析しています。

魚屋 ファーストフード

一方、レコメンドエンジンという場合は、主にWEB上で用いられるレコメンデーションを指す場合が多く、たとえば新商品の案内や単純な売れ筋ランキングの提示はレコメンデーションですが、「レコメンドエンジン」とは言いません。レコメンドエンジンは、一般的には対象者の何らかのアクションに対して、判断し予測するステップを経てコンテンツをリアルタイムに提示する場合が多いといえます。

レコメンデーションとパーソナライゼーション

レコメンデーションは必ずしも個別化(パーソナライズ)されているわけではありません。ユーザーに受動的にコンテンツを発見させることもできる技術であり、場合によってはユーザーがサイトを訪れた瞬間に、一切アクションを起こさずとも、最適な商品やサービスを推薦することも可能です。
身近な例を挙げると、様々なECサイトで見られる「売れ筋ランキング」などは、多くのユーザーに受け入れられている商品を紹介することで、当該商品がそのユーザーにとっても、価値が高い商品であるということを明示し、「レコメンド」していると言えるのですが、ユーザーごとに個別化されているわけではありません。ユーザーごとに個別化されているレコメンデーションは、より高度な推薦技術ということになります。

レコメンデーションは、能動的にユーザーにアクションを求める場合もあるのですが、完全な受動でも完全な能動でもなく、「ユーザー(またはそれに紐づく属性情報)とのインタラクション」によって推薦されるものもあります。例を挙げれば、ドメインやCookieを用いて何らかの個別化された情報を提示する場合、ユーザーには能動的にアクションを起こしたという意識はないですが、何らかの個別化された情報がサイトに送られている訳です。

個別化されたレコメンデーションは、個別化の程度によって「一時的個別化」と「永続的個別化」の2つに分類できます。一時的個別化は、ユーザーの過去の履歴を使うのではなく、最長でもそのセッションのアクション履歴しか使わないことにあります。永続的個別化は、Cookieに蓄積するかサーバーに蓄積するかに関わらず、過去の履歴を何らかの形でデータ処理をし、レコメンドに利用します。

レコメンデーションのステップと体系化

ユーザーから何らかの情報を取得するパターンの場合で重要なことは、ユーザーの起こしたアクションを「判断し予測する」というプロセスを挟むという点です。例えば、「接待に使える雰囲気のよいレストランに行きたい」「子供の運動会の撮影に使えるカメラが欲しい」などのユーザーのインプット(アクション)に対して、何らかの「根拠に基づいた判断」を経て、コンテンツを推薦することを指します。

レコメンデーションの分類方法や名称は様々存在しているにも関わらず、体系的にはあまり整理されていません。例えば、一般的にレコメンド手法として最もよく知られている「協調フィルタリング」がレコメンドエンジンの全てかのごとく認識されていたり、レコメンド手法には「協調フィルタリング」と「コンテンツベースフィルタリング」の2種類であるとか、「ベイジアンネット」といった一般的分析、解析手法の名称が混同されて使われていたりします。しかし、実際にECサイトで採用され実績を上げているほとんどのシステムは、このどれにも当てはまらない方法が主流です。

なぜこの様な誤解が多いのかは、「協調フィルタリング」「コンテンツベースフィルタリング」「ベイジアンネット」といった手法が、レコメンド手法の一部分を切り取っていたり、解析手法を示しているに過ぎず、一定の軸の基に同じレイヤーで整理されていたりしていないことが原因だと考えられます。

レコメンデーションの分類

ALBERTでは、レコメンド手法を、レコメンデーションに用いる情報(データ)と対象者以外の情報と対象者の情報という2つの軸によって体系的に分類することで各手法の特性を評価し、様々なケースにおいて最適なレコメンド手法の提案を行なっています。ここでは、簡便のため商品のレコメンデーションに話を限定することとします。ただし、ここで紹介する全ての手法で、サービスのレコメンデーションやニュース、情報のレコメンデーション、さらには検索システムやリアルのコミュニケーションにおける情報のマッチングの方法論として包括的に適用できることにご留意ください。

レコメンドに用いる対象者以外の情報による分類

レコメンデーションに用いる情報の中で、対象者以外の情報としては、商品データや消費者の行動履歴データ、専門家や店員などの知識などがあります。それぞれそのような情報をどのような考え方に基づいて商品を提示するかによって、レコメンデーションはまず大きく3つに分類できます。

A モノ属性ベース
(Attribute)
「人はモノの各属性を評価することでモノを総合的に評価している」という考え方に基づき、商品を提示する手法。対象となる全ての商品のスペック/特徴等を格納したデータを使用する。レコメンデーションの精度は商品データベースの精度に依存するため、対象となる商品の主要な属性が、データとして表現し易いもので、かつ、データベース化し易い場合に適している。
C 人ベース
(Consumers)
「似たような特徴を持つ人や、過去の購買履歴が似ている人は同じようなものを好む」「多くの人が同時に検討や購買した商品や情報は、対象者にとっても価値のある商品や情報である」という考え方に基づき、提示する商品を決める手法。対象者以外の人々がどのような閲覧行動や購買行動をしているかに関するデータが必要となる。ただし、まだ誰も購入していない新商品には適用できない。
K ナレッジベース
(Knowledge)
対象者の嗜好等との関係有無に関わらず、第三者(専門家や店員に限らない)の知識や経験及び一般常識(ナレッジ)に基づいて、対象者にとって価値があると考えられる商品を提示する手法。一見恣意的とも見られるこの手法では、第三者意見の信頼性・妥当性をどのように担保するかがポイントとなる。
レコメンドに用いる対象者情報による分類

もう一つの軸として、レコメンドを受けようとしている対象者が起こしたアクションデータ(クリックや注文など)、対象者の行動履歴データ(過去の閲覧履歴や購買履歴)、対象者の申告データ(アンケートデータや申告データ)等の、用いるデータの種類によって分類することができます。

対象者を特定しない 年齢性別、嗜好、購買履歴など、対象者個人を特定するデータを用いない場合
アクションなし
対象者の個人の情報に関するデータも、対象者のサイト上でのアクションもレコメンデーションに用いない。
どんな訪問者にも一様に同じ商品を提示する。
対象者を特定するデータ 対象者の個人を特定する情報をレコメンデーションの直前までに取得し、そのデータを反映して提示する商品を決める場合
アクションデータ
対象者がサイト上でとるアクションに反応して提示する商品を決める。
例えば、ある商品を閲覧または買おうとしている対象者に、関連する商品を提示するなど。ただし、個人の嗜好は考慮する訳ではないので、同じ商品を閲覧していればどんな対象者にも同じ商品が提示される。

履歴データ
対象者個人のレコメンド対象の商品に関する購買履歴データや行動履歴データ(アクションデータが蓄積されたもの)を総合的に学習する。
例 えばCDのレコメンデーションを行なう場合、過去のCDの購買履歴やチェック履歴、視聴履歴等が履歴データとなる。また、対象者の個別のCDに対する評価データや所有の有無等のデータの場合も、対象者の過去の履歴を表現するデータとして、この履歴データに含めるものとする。各対象者の実際の購買履歴や行動履歴データを使用するため、One tooneマーケティングを実現する上でも納得性が高いが、一般的に大規模な購買履歴データベースが必要となる。また、他人のために商品を購入した場合に、その履歴も対象者の嗜好を反映したものとして扱われてしまうため、データの精度が落ちてしまうことにも注意が必要である。

申告データ
対象者個人の属性やニーズ・購入時等に関するプロフィールデータを使用する。
会員登録時やレコメンデーションの直前に質問する年齢・性別・職業・趣味関心事や、商品選択時の重視点のデータなどがここに含まれる。対象者のレコメンド対象商品群に関する過去の購買履歴等はここに含まない。
ACKマトリクス(ALBERTオリジナル・レコメンデーションの分類)

ここまでで紹介した「レコメンドに用いる対象者情報」と「レコメンドに用いる対象者以外の情報」の種類を組み合わせることで、ALBERTではレコメンド手法を下図のような12種類に分類しています。この分類により、扱う商材やデータの取得状況に応じて最適なレコメンド手法を検討することが可能となっています。
(ただし、ここでの分類はあくまで基本的な考え方の類型化に過ぎず、実際には複数の類型を組み合わせたハイブリッド式のレコメンド手法を設計することもできます)

*ACKとは、レコメンデーションの性質を最も大きく左右すると考えられるAttribute(モノ属性ベース)、Consumers(人ベース)、Knowledge(ナレッジベース)という3種類のレコメンドロジックの頭文字

  レコメンドに用いる対象者情報
対象者全てに同様なレコメンデーション パーソナライズされたレコメンデーション
対象者を特定しない 対象者を特定するデータ
データ不要 アクションデータ 履歴データ 申告データ
















モノ属性
ベース
(Attribute)
商品属性データ、情報データベース A-1
スペックランキング型
A-2
商品関連性評価型
A-3
ディープナレッジ型
A-4
ニーズインプット型
人ベース
(Consumer)
消費者の行動履歴データ C-1
人気ランキング型
C-2
アクションアソシエーション型
C-3
履歴アソシエーション型(協調フィルタリング)
C-4
アンケートベース型
ナレッジ
ベース
(Knowledge)
ナレッジ、知見(信頼性・妥当性の担保が必要) K-1
ナレッジベース
独断型
K-2
ナレッジベース
反応型
K-3
ナレッジベース
観察型
K-4
ナレッジベース
診断型
A-1. スペックランキング型
【概要】 商品のスペックや特性の優劣を基準に提示する商品を決める方法。例えば、「商品を価格順に提示」「商品の軽い順に提示」など。
【特徴】 導入へのコストが小さく、簡単に実装が可能だが、消費者が重視する属性を基準に絞込みを行なう必要がある。
A-2. 商品関連性評価型
【概要】 ある商品をチェックまたは購入した人に対して、その商品に関連の深い商品を提示する方法。関連の深さは、商品の類似性や相互補完性により定義する。例えば、「チェックした商品と性能が近い商品」や「購入した商品に必要な消耗品」を提示するなど。
【特徴】 商品の類似性や相互補完性の程度を定義できる場合に有効。
A-3. ディープナレッジ型
【概要】

対象者が過去にチェックまたは購入した商品リストから、対象者が好む商品の特徴を抽出し、商品データベースから同種の特徴を持つ商品を抽出して提示する方法。
~参考:ディープナレッジ型のアルゴリズムの一例~
下の表はある顧客が、オンラインブックショップA店で過去に購入した商品を表しているとする。このリストを見るだけで、この顧客は基本的には経済に関する本に興味があり、●●という作家に興味があり、その次に▲▲という作家に興味がある。また出版社ではあまりこだわりはないが、強いて言えばB社に興味がありそう・・・などと推測ができる。

ルールベースフィルタリング

このような推測に基づいて、この顧客にとってのそれぞれのジャンル・作家・出版社がどれほど価値を持っているかをスコア化し、スコアの高い商品を提示する。例えば、「作家●●」が書いた「経済」に関する本が他にあれば、それが提示される商品となる。

【特徴】 対象者が好む商品の特徴をヒントに新商品であってもレコメンドすることが可能である一方で、商品の特徴をデータ化することが可能であること、対象者個人の十分な購入履歴データがあることが前提となる。また、他人のために何かを購入した場合であってもそれが対象者の嗜好を反映したものとして扱われることや、対象者個人の購入履歴のみを推薦の根拠とするため、好みが絞り込まれすぎてしまい、対象者にとって新鮮な出会いが少なくなってしまうという短所なども知られている。
A-4. ニーズインプット型
【概要】 対象者がどのようなニーズを持っているかを予め聴取し、対象者が求める理想の特性を持った商品を定義する。その理想の商品をレコメンド対象商品の特性データベースと突き合わせ、対象者の理想の商品に最も近いと思われる商品から順に提示する手法。

ニーズインプット型

【特徴】 対象者のニーズを直接質問するため、精度の高いレコメンドができるが、対象者にストレスを与えないニーズの聴取方法や質問項目の設定にノウハウが必要であると同時に、商品データベースを構築することが前提となる。
~参考~
ニーズインプット型のレコメンドエンジンは、ALBERTが運営するショッピングポータルサイト「見つかる.jp」の パソコンデジカメテレビなどの各カテゴリで使用されています。
C-1. 人気ランキング型
【概要】 人気商品を提示するというシンプルな手法。売れ筋商品紹介や人気投票上位商品の紹介、閲覧数の多い情報の紹介などが該当する。
【特徴】 導入へのコストが小さく簡単に実装が可能。最も一般的なレコメンド手法。
C-2. アクションアソシエーション型
【概要】 ある対象者が商品をチェックまたは購入したデータと、対象者以外がチェックまたは購入したデータを用い、その購入パターンから商品間の共起性をアソシエーション分析(相関分析)を用いて導出、提示する手法。Amazonでよく用いられている。「この商品を買った人は、こんな商品も買っています」は、このアクションアソシエーション型に含まれる。ただし、どんな対象者であっても同じ商品をチェックまたは購入すれば同じ商品が提示されるという点で、個人の過去の購入履歴を全て学習し、パーソナライズされている協調フィルタリング等の履歴アソシエーション型とは異なることに注意が必要。
【特徴】 同じ商品カテゴリ内で何度も購入される商品に適しているが、耐久消費財では購買データを用いることができない(「この本を買った人は、この本も買っています」には意味があるが、「この冷蔵庫を買った人はこの冷蔵庫も買っています」には意味がないと考えられるため)。耐久消費財の場合は、購入検討時に比較した同時検討データを用い、この冷蔵庫を検討している人は、この冷蔵庫にも興味があります」という使い方をする。
C-3. 履歴アソシエーション型(協調フィルタリング)
【概要】 ある対象者が商品をチェックまたは購入したデータと、対象者以外がチェックまたは購入したデータを用い、その購入パターンから人同士の類似性、または商品間の共起性をアソシエーション分析(相関分析)を用いて導出し、対象者個人の行動履歴を関連づけることでパーソナライズされた商品を提示する手法。アクションアソシエーション型と似ているが、対象者個人の履歴データを用いてパーソナライズしているところに特徴がある。分析アルゴリズムの一つとして代表的なものが「協調フィルタリング」。協調フィルタリングは、同じような好みや購入履歴を持っている人は同じようなものが好きであるという仮説に基づいており、対象者の行動履歴と似たような行動履歴を持つ人々を抽出し、その人々が興味を持っている商品や買っている商品で対象者がまだ出会っていないと考えられる商品を提示する方法。似た人々を定義し、かつ彼らが購入しているが対象者が購入していないものを提示するところに特徴がある。
【特徴】 商品データベースがなくても対象者と対象者以外の購入履歴データのみがあれば実行可能なことがメリット。しかし、商品数が非常に多い場合では対象者の購入履歴と似た購入履歴を持つ顧客を探すことが困難であるため、大規模な購入履歴データがあることが前提となること、また、まだ他の誰も使っていない新商品を推奨することができないこと、同じカテゴリの中で繰り返し購入されない商品では適用しづらいこと、他人のために何かを購入した場合であってもそれが対象者の嗜好を反映したものとして扱われてしまうことなどが短所として知られている。
C-4. アンケートベース型
【概要】 予め対象者が申告していた対象者属性(性別・年齢・職業・興味関心事など)から、対象者と同じ属性あるいは近い属性を持つ人々や同じクラスターに属する人々が多く購入している商品を提示するレコメンデーション。それぞれの属性の消費者がどの商品に興味を持っているか、あるいはどの商品を購入しているかに関して別途データを分析する必要がある。
【特徴】 会員登録を要するサイト等であれば、一般的な対象者属性は取得できている場合が多い。この場合、過去の購入データの分析などから、属性別の購入行動の傾向を抽出することができる。また、過去の購入データが存在しない場合でも、別途アンケート調査等を行なうことにより、属性別の傾向を抽出し、そこから各属性に対して提示する商品を決めることも可能である。
K-1. ナレッジベース独断型
【概要】 専門家や社員・販売員が考える普遍的なお薦めを一様に提示する方法。「当店のオススメ商品」「本日のオススメ商品」「評論家○○氏の一押し商品」などが当てあまる。
【特徴】 お薦め根拠の信頼性や妥当性を担保することができれば、一定の効果が見込める。
K-2. ナレッジベース反応型
【概要】 第三者(専門家・販売員であるとは限らない)が独自の判断で、ある商品をチェックまたは購入した人に、好ましいと思われる商品を提示する手法。
【特徴】 お薦め根拠の信頼性や妥当性を担保することができれば、一定の効果が見込める。
K-3. ナレッジベース観察型
【概要】 対象者の過去の行動履歴や購入履歴を観察した結果、第三者(専門家・販売員であるとは限らない)の独自の判断により、ある基準で推奨すべき商品や情報を提示する手法。例えば、肉ばかり購入している対象者に、栄養のバランスを考慮して野菜を推奨するなど。
【特徴】 お薦め根拠の妥当性や納得性が高ければ、対象者にとっては意外な提案を受けることができるが、場合によっては「余計なお世話」ともなりかねないことに注意が必要である。
K-4. ナレッジベース診断型
【概要】 対象者が申告した属性(性別・年齢・職業・興味関心)やニーズ、悩みに応じて、専門家や社員・販売員などのナレッジにより、ある基準で最適と考えられる商品を提示する手法。顧客との対話の末の販売員による推奨や医師の処方等はこれに当てはまると考えられる
【特徴】 お薦め根拠の信頼性や妥当性の担保や、対象者がエンターテインメント性を感じられる設計が可能な場合、効果が見込める。

協調フィルタリングとは

現在、多くのECサイト等で用いられている「この本を見ている人はこの本も見ています」や「このDVDを買った人はこのDVDも買っています」というレコメンドエンジンは、商品間の共起性を定義し提示するものですが、パーソナライズされている訳ではなく、誰が訪れても同じ結果しか出ないものが主流でした。
協調フィルタリングとは、ある対象者が商品をチェックまたは購入したデータと、対象者以外がチェックまたは購入したデータの両方を用い、その購入パターンから人同士の類似性、または商品間の共起性をアソシエーション分析(相関分析)で解析し、対象者個人の行動履歴を関連づけることでパーソナライズされた商品を提示することができる手法です。前提となっている仮説は「自分に似ている人の評価と自分の評価は似ているだろう。従って、自分は持っていないが自分に似ている人が持っている商品は欲しいに違いない!」というものです。従って、多くの顧客の中から自分に似ている人々を探しだし、その人々が持っていて自分が持っていないものをおすすめするのが基本となっています。

協調フィルタリングは、商品スペックの関連性や商品閲覧の共起性だけで推薦するわけではなく、購買データ等を基に人と人の類似性を定義し、自分が似た人が持っていて自分が持っていない商品を推薦するのが基本なので、意外性のある商品を提示すること(セレンディピティ)もでき、よりコンバージョンレートのアップが見込まれる手法です。

一般的な協調フィルタリングのアルゴリズム

下表は、あるオンラインショップにおいて、各顧客と商品の購入履歴を示しているものとします。データは、各顧客が商品を買った場合を「1」、商品画面が顧客に表示されたが顧客が買っていない場合を「0」、商品が顧客に表示されていない場合は買ったか買わないかのデータがないので「-」(グレーの網掛け)として表しています。
顧客Xに対して、次にどの商品を推薦するべきかを決めていきたいと思います。

協調フィルタリング図解01

まず、顧客Xに近い好みを持つ顧客を探す必要があります。ここでは、類似性を「相関係数」という尺度を用いて表現することとします。例えば、顧客Xと顧客Aの「近さ」は、顧客Xにも顧客Aにも表示されている商品(顧客Aの行にも、顧客Xの行にも共通して数字が入っている列)の0、1データに対する相関係数とします。ここでは0.167となりましたが、この「相関係数」は、顧客Aと顧客Xが同じ商品を買っていたり、あるいは同じ商品を表示されたのに買っていなかったりする傾向が強ければより高い値となります。
さて、顧客Xとの相関係数を見ると、顧客C、顧客D、顧客Eの3人の相関係数が0.5以上で高いことがわかりました(赤枠)。仮に相関係数が上位の3人の平均値(「-」の場合は計算から除外する)で顧客Xへの推薦度合いを決めるとすると、「商品5」が顧客Dも顧客Eも購入している商品として、平均値1.0と最も推薦度合いが高いので、顧客Xに次に推薦すべき商品は、「商品5」であることがわかります。

より高度な協調フィルタリングのアルゴリズム

上記で説明したデータは、購入した場合は「1」、購入しなかった場合は「0」、表示されていない場合は「-」で表しました。つまり、その商品が評価が高かった場合は「1」、評価が低かった場合は「0」の2段階での評価データを扱っていたと言えます。しかしよく考えてみると、購入したが読んでみたら面白くなかったとか、使ってみたら不満足だったという場合もありますし、また他人へのプレゼントであって自分の好みではないかもしれません。さらに、購入はしなかったものの、実は非常に気に入っているが既に持っているので買わなかったということもあるかもしれません。
このように考えていくと、1/0の2段階の評価だけで、推薦商品を決めることには問題があるように思われます。より精度が高いレコメンデーションを実現するためには、商品評価の観点を入れたほうがよいということになります。
市場調査の回答方式で、チェックボックス(□にレ点と入れて)で好き嫌いを回答させるものと、好きから嫌いまでを5段階にして、ラジオボタン(○)で回答させるものがありますが、単純に好き嫌いを1/0で回答させたほうが回答は楽ですが、分析することを考えると5段階評価でデータを取得したほうが、より精度が上がるのと同じことだと言えます。

元々協調フィルタリングという手法は、他のユーザー評価を基に顧客にアイテムを表示するもので、その評価は5段階等で取っていました。代表的な協調フィルタリングのシステムとしてResnickらのGroupLensがあります。(応用例:映画推薦システム
GroupLensは、Usenetの記事を対象としたシステムで、顧客が興味を持つであろう記事を推薦するものです。顧客は記事を読んだ後にその記事を5段階で評価し、システムはその評価を基に顧客間の相関を算出し推薦記事を提示する方法で、顧客の明示的評価を前提としていました。
その後、アクセス履歴や購買履歴などの暗黙的評価を利用するシステムが出現し、現在よく知られている購入したか、しないかの1/0データでの協調フィルタリングが主流になったと考えられます。

レコメンデーションが最も進んでいると言われるamazonでは、この明示的評価をする協調フィルタリングが用いられています。顧客は嫌い/好きではない/普通/好き/大好きの5段階評価ができるようになっており、この評価データを基にし、高度にパーソナライズされたおすすめを実現しています。

ALBERTでは、5段階からさらに進んだスライダーでの評価を実現しており、KDDI研究所で培った高度な協調フィルタリングのアルゴリズムを用いた協調フィルタリングエンジンを提供しています。

スライダーを用いた商品評価イメージ
スライダーを用いた商品評価イメージ

この、より高度な協調フィルタリングのアルゴリズムを、さきほどの1/0データと同じ表で比較してみましょう。 下表は、あるオンラインショップにおいて、各顧客と商品の購入後の評価を示しているものとします。データは、各顧客が商品を買って評価が高かった場合を「5」、低かった場合を「1」として5段階で評価しています。商品が顧客に表示されていない場合は買ったか買わないかのデータがないので「-」(グレーの網掛け)として表しています。
顧客Xに対して、次にどの商品を推薦するべきかを決めていきたいと思います。

協調フィルタリング図解02

まず、顧客Xに近い好みを持つ顧客を探す方法は、前記の1/0データの場合と同じ相関係数法を用います。
顧客Xとの相関係数を見ると、顧客C、顧客D、顧客Eの3人の相関係数が0.5以上で高いことがわかりました(赤枠)。相関係数が上位の3人の平均値(「-」の場合は計算から除外する)で顧客Xへの推薦度合いを決めるとすると、「商品5」が顧客Dも顧客Eも購入している商品として、平均値4.5と最も推薦度合いが高く、よって、顧客Xに次に推薦すべき商品は「商品5」であることがわかります。

実際の購買データの場合、顧客数も商品数もこの事例の比ではなく大きい。顧客同士の相関係数や、おすすめ度を算出する上で、評価データを用いたほうが精度が高いことは自明の理であるといえます。評価データを取得するには、それなりのモチベーションが必要となるので、何らかの工夫が必要となりますが、よりパーソナライズされた推薦を実現するためには、こういった明示的評価を前提とした協調フィルタリングが用いられることが多いです。

このページのトップへ