Recommendation System-based Upper Confidence Bound for Online Advertising - Télécom Paris Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Recommendation System-based Upper Confidence Bound for Online Advertising

Dana Marinca
  • Fonction : Auteur
  • PersonId : 995494
Kinda Khawam
  • Fonction : Auteur
  • PersonId : 880972
David Rohde
  • Fonction : Auteur
  • PersonId : 1053680
Flavian Vasile
  • Fonction : Auteur
  • PersonId : 1053681
Elena Simona Lohan
  • Fonction : Auteur
  • PersonId : 1053682
Steven Martin
  • Fonction : Auteur
  • PersonId : 837952
Dominique Quadri
  • Fonction : Auteur
  • PersonId : 957864

Résumé

In this paper, the method UCB-RS, which resorts to recommendation system (RS) for enhancing the upper-confidence bound algorithm UCB, is presented. The proposed method is used for dealing with non-stationary and large-state spaces multi-armed bandit problems. The proposed method has been targeted to the problem of the product recommendation in the online advertising. Through extensive testing with RecoGym, an OpenAI Gym-based reinforcement learning environment for the product recommendation in online advertising, the proposed method outperforms the widespread reinforcement learning schemes such as Epsilon-Greedy, Upper Confidence (UCB1) and Exponential Weights for Exploration and Exploitation (EXP3).
Fichier principal
Vignette du fichier
RSUCB.pdf (497.76 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02282575 , version 1 (10-09-2019)

Identifiants

  • HAL Id : hal-02282575 , version 1

Citer

Nhan Nguyen-Thanh, Dana Marinca, Kinda Khawam, David Rohde, Flavian Vasile, et al.. Recommendation System-based Upper Confidence Bound for Online Advertising. REVEAL 2019, Sep 2019, Copenhagen, Denmark. ⟨hal-02282575⟩
178 Consultations
502 Téléchargements

Partager

Gmail Facebook X LinkedIn More