投稿日:2014/09/17 更新日: WWW 論文紹介

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew
Dominowska, Ewa
Ragno, Robert
In Proc. of WWW2007

概要

検索結果の横に表示される広告のCTRの推定を目的としている。十分な回数表示された広告であれば、クリックされた回数/表示された回数でCTRは求まるが、この研究では、新しく登録された広告のように、十分な統計量が得られない広告に対してもCTRを推定することを目的としている。

データ・手法

広告ごとに複数の素性を用意し、回帰モデルを用いてCTRの推定を行う。使用したデータはBingに表示される100万件以上の広告と、広告主が各広告に設定した50万件以上のキーワード。
その中から、100回以上表示された広告だけを使用し、訓練データとテストデータを作成。つまり、100回以上表示された広告から求められるCTRは統計的に信用できる値として、CTRの正解値としている。
回帰には以下の4カテゴリの素性を使用。素性の数を増やすほどCTRの推定精度が高くなることを示した。

1.キーワード

広告に設定されたキーワードに基づく素性。例えばある広告に「red shoes」というキーワードが設定されていたら、同じキーワードが設定された他の広告のCTRや、「buy red shoes」や「blue shoes」のような類似キーワードが設定された広告のCTRからスコアを求める。

2.広告のクオリティ

広告のクオリティが高くなるほどCTRは高くなるという仮説のもと、さらに以下の4つのカテゴリに分けて広告のクオリティを数値化。
Appearance:広告のタイトルや本文中の単語数、「$」の有無など。
Attention Capture:タイトルや本文中に「buy」や「join」などの後が含まれるかなど。
Reputations:URLが「.com」で終わっているかや、URLの長さなど。
Landing page quality:広告をクリックした際の遷移先のページにフラッシュが含まれるか、スタイルシートを使っているかなど。
Relevance:キーワードと完全一致する語があるか、キーワードの一部がタイトルや本文中に含まれるかなど。
以上に加えて、出現頻度の高い上位10,000単語の有無も素性として使用。

3.キーワードの多様性

1つの広告に対して設定されているキーワードのトピックの多様性が低いほど、クリックされやすいと仮定。各キーワードのトピックを74カテゴリのいずれかに割り振り、トピックのエントロピーを計算。

4.キーワードの一般性

広告のキーワードが一般的な語であるほどクリックされやすいと仮定。キーワードでWeb検索した際のヒットカウントと、検索エンジンの3ヶ月間のクエリログ中でのキーワードの出現頻度を素性として使用。


-WWW, 論文紹介

関連記事

What’s in a hashtag?: content based prediction of the spread of ideas in microblogging communities

sur, Oren Rappoport, Ari In Proc. of WSDM 2012 http://dl.acm.org/citation.cfm?id=2124320 概要 ツイッター上で、 …

Happy, Nervous or Surprised? Classification of Human Affective States in Social Media

Munmun De Choudhury Michael Gamon Scott Counts In Proc. of ICWSM 2012 概要 ツイートを11種類の感情に分類することを目的とした論文 …

Semantic Annotation of Mobility Data using Social Media

Wu, Fei and Li, Zhenhui and Lee, Wang-Chien and Wang, Hongjian and Huang, Zhuojie In Proc. of WWW 20 …

Mining long-term search history to improve search accuracy

Tan, Bin Shen, Xuehua Zhai, ChengXiang In Proc. of KDD2006 http://dl.acm.org/citation.cfm?id=1150493 …

【論文紹介】Regularising Factorised Models for Venue Recommendation using Friends and their Comments

Manotumruksa, Jarana and Macdonald, Craig and Ounis, Iadh CIKM 2016 Link 概要 グラスゴー大学のIadh Ounisのグループの …