投稿日:2014/09/17 更新日: WWW 論文紹介

Predicting clicks: estimating the click-through rate for new ads

Richardson, Matthew
Dominowska, Ewa
Ragno, Robert
In Proc. of WWW2007

概要

検索結果の横に表示される広告のCTRの推定を目的としている。十分な回数表示された広告であれば、クリックされた回数/表示された回数でCTRは求まるが、この研究では、新しく登録された広告のように、十分な統計量が得られない広告に対してもCTRを推定することを目的としている。

データ・手法

広告ごとに複数の素性を用意し、回帰モデルを用いてCTRの推定を行う。使用したデータはBingに表示される100万件以上の広告と、広告主が各広告に設定した50万件以上のキーワード。
その中から、100回以上表示された広告だけを使用し、訓練データとテストデータを作成。つまり、100回以上表示された広告から求められるCTRは統計的に信用できる値として、CTRの正解値としている。
回帰には以下の4カテゴリの素性を使用。素性の数を増やすほどCTRの推定精度が高くなることを示した。

1.キーワード

広告に設定されたキーワードに基づく素性。例えばある広告に「red shoes」というキーワードが設定されていたら、同じキーワードが設定された他の広告のCTRや、「buy red shoes」や「blue shoes」のような類似キーワードが設定された広告のCTRからスコアを求める。

2.広告のクオリティ

広告のクオリティが高くなるほどCTRは高くなるという仮説のもと、さらに以下の4つのカテゴリに分けて広告のクオリティを数値化。
Appearance:広告のタイトルや本文中の単語数、「$」の有無など。
Attention Capture:タイトルや本文中に「buy」や「join」などの後が含まれるかなど。
Reputations:URLが「.com」で終わっているかや、URLの長さなど。
Landing page quality:広告をクリックした際の遷移先のページにフラッシュが含まれるか、スタイルシートを使っているかなど。
Relevance:キーワードと完全一致する語があるか、キーワードの一部がタイトルや本文中に含まれるかなど。
以上に加えて、出現頻度の高い上位10,000単語の有無も素性として使用。

3.キーワードの多様性

1つの広告に対して設定されているキーワードのトピックの多様性が低いほど、クリックされやすいと仮定。各キーワードのトピックを74カテゴリのいずれかに割り振り、トピックのエントロピーを計算。

4.キーワードの一般性

広告のキーワードが一般的な語であるほどクリックされやすいと仮定。キーワードでWeb検索した際のヒットカウントと、検索エンジンの3ヶ月間のクエリログ中でのキーワードの出現頻度を素性として使用。


-WWW, 論文紹介

関連記事

Towards Better Measurement of Attention and Satisfaction in Mobile Search

Lagun, Dmitry Hsieh, Chih-Hung Webster, Dale Navalpakkam, Vidhya In Proc. of SIGIR2014 http://dl.acm …

Are Web User Comments Useful for Search?

Wai Gen Yee Andrew Yates Shizhu Liu Ophir Frieder In Proc. of LSDS-IR Workshop 2009 概要 YouTubeの動画を検索 …

Topic-Driven Reader Comments Summarization

Ma, Zongyang and Sun, Aixin and Yuan, Quan and Cong, Gao In Proc. of CIKM 2012 概要 ニュース記事のコメントをトピックごと …

Sentiment-Based Topic Suggestion for Micro-Reviews

Ziyu Lu, Nikos Mamoulis, Evaggelia Pitoura, Panayiotis Tsaparas In Proc. of ICWSM 2016 概要 Foursquare …

Mobile App Retrieval for Social Media Users via Inference of Implicit Intent in Social Media Text

Park, Dae Hoon and Fang, Yi and Liu, Mengwen and Zhai, ChengXiang In Proc. of CIKM 2016 概要 ツイートに含まれる …