Polygraphe

Améliorer la confiance des consommateurs en détectant des faux avis sur Internet

Service public
Promotion 3

Direction générale de la concurrence, de la consommation et de la répression des fraudes (DGCCRF)

Paris

Data science, Développement

L’équipe

La Direction générale de la concurrence, de la consommation et de la répression des fraudes (DGCCRF) développe des nouvelles méthodes de traitement automatique du langage naturel, d’analyse de données et de comportements pour aider ses enquêteurs à mieux détecter et qualifier des faux avis sur les plateformes de consommation en ligne.

Polygraphe : Détecter les faux avis pour garantir la confiance sur Internet

La problématique

Les informations disponibles sur Internet orientent considérablement les choix des consommateurs. Selon une étude IFOP, 85% des consommateurs sont influencés par les avis laissés en ligne sur les produits ou les services en vente.

Les faux avis trompent les consommateurs qui tiennent compte des commentaires laissés en ligne pour guider leur acte d’achat. Ils nuisent également aux professionnels vertueux en empêchant une concurrence loyale.

La Direction Générale de la Concurrence, Consommation et Répression des Fraudes (DGCCRF) effectue chaque année des enquêtes sur cette thématique. Afin de lutter plus efficacement contre cette pratique, il est nécessaire d’avoir un outil permettant de détecter les avis suspects sur Internet. Cet outil a vocation à être utilisé par les agents en charge des enquêtes sur ce sujet pour mettre fin à ces pratiques.

Le défi : développer un outil permettant de détecter les avis suspects parmi les commentaires, notes ou autres évaluations disponibles publiquement sur Internet

Le défi se décompose en trois axes principaux :

La récupération des données pertinentes sur des plateformes web proposant des avis de consommateurs : texte du commentaire, informations sur l’entreprise ou produit faisant l’objet de l’avis, note attribuée, informations sur l’utilisateur ayant posté l’avis, etc.

L’analyse des données extraites pour identifier les commentaires suspects à l’aide de différents indicateurs de suspicion définis avec les enquêteurs expérimentés sur ce sujet.

La visualisation des résultats sous forme d’une interface à destination des enquêteurs.

Le défi a été prolongé de deux mois supplémentaires ce qui permettra le développement de nouveaux algorithmes. L’outil est actuellement en phase de beta-testing auprès d’une sélection d’enquêteurs du Service National des Enquêtes avant d’étendre son utilisation aux Directions Départementales.

Rétrospective

Faire des données un outil de régulation, l’exemple du défi Polygraphe