Modèle de distraction pour la sélection séquentielle de contenu

Olivier Cappé 1, 2 Claire Vernade 1, 2
1 S2A - Signal, Statistique et Apprentissage
LTCI - Laboratoire Traitement et Communication de l'Information
Résumé :

Dans le contexte du marketing sur Internet, il est fréquent que les publicités présentées aux utilisateurs soient hiérarchisées : les mieux placées retiennent l’attention de l’utilisateur et obtiennent plus de clics, indépendamment de leur contenu propre. Pour construire séquentiellement une campagne qui recueille de nombreux clics sans information a priori sur la qualité des articles, il faut donc être capable d’apprendre quelle est la meilleure liste ordonnée de L parmi K produits disponibles dans le catalogue. À chaque fois qu’une liste est proposée à l’internaute, celui-ci clique sur certains produits et c’est l’unique information qu’il envoie au système. Dans le cadre de l’apprentissage séquentiel, ce dernier doit alors mettre à jour ses estimateurs afin de proposer une liste potentiellement meilleure au futur visiteur. L’inconvénient des méthodes existantes pour résoudre ce problème réside dans les modèles : ceux-ci négligent la relative inattention de l’utilisateur, ce qui induit une sous-estimation des probabilités de clics pour les produits présentés et de possibles failles dans l’exploration. Nous proposons donc une manière d’inclure cet aspect dans un modèle de Bandits Manchots original. Après avoir précautionneusement étudié l’impact de la distraction de l’utilisateur sur les performances asymptotiques des algorithmes, nous exploitons le principe d’optimisme face à l’incertitude pour proposer une série d’algorithmes efficaces que nous évaluons expérimentalement.

Complete list of metadatas

https://hal.telecom-paristech.fr/hal-02287453
Contributor : Telecomparis Hal <>
Submitted on : Friday, September 13, 2019 - 4:58:17 PM
Last modification on : Thursday, October 17, 2019 - 12:37:02 PM

Identifiers

  • HAL Id : hal-02287453, version 1

Citation

Olivier Cappé, Claire Vernade. Modèle de distraction pour la sélection séquentielle de contenu. Journées de Statistiques, Jun 2016, Montpellier, France. ⟨hal-02287453⟩

Share

Metrics

Record views

5