Utilisez l'algorithme Apriori pour de meilleures recommandations de produits
Publié: 2018-10-05Dans cet article, vous apprendrez la méthode efficace des recommandations de produits (la soi-disant analyse du panier). En utilisant un algorithme spécial (algorithme Apriori), vous apprendrez quels produits vendre par lots. Vous obtiendrez des informations sur le produit à recommander sur le site Web d'un autre produit. De cette façon, vous augmenterez la valeur moyenne du panier dans votre magasin.
Recommandations de produits intelligentes - vente croisée
L'une des méthodes d'augmentation des ventes dans la boutique en ligne est la recommandation de produits connexes.
Malheureusement, la mise en œuvre la plus courante de ces recommandations consiste à afficher des produits de la même catégorie. Sous le produit que nous visualisons, nous voyons d'autres produits de ce type - par exemple, d'autres offres de chaussures.
Cependant, la relation entre les produits ne résulte pas de la catégorie commune dans laquelle ils ont été ajoutés dans le magasin. Recommander d'autres chaussures alors que le client a déjà mis une paire dans le panier n'a aucun sens. De cette façon, nous devinons à l'aveugle si cela fonctionne. Peut-être que le client ajoutera autre chose au panier.
L'essence des recommandations de produits est de donner aux clients un produit qui les intéressera clairement. Comment savons-nous quels sont ces produits ? Merci aux statistiques ! Avec son aide, nous pouvons découvrir que la majorité des clients qui achètent le produit A achètent également B et C. Dans ce cas, nous recommandons B et C au client qui met A dans le panier. Ce type de recommandation de produits fonctionne mieux sur la page du panier.
De cette façon, les clients qui effectuent l'achat sont informés qu'ils peuvent acheter d'autres articles. Nous percevons une certaine tendance d'achat et nous facilitons sa mise en œuvre auprès des clients ultérieurs.
Grâce à une interface pratique, les clients suivants ajouteront des produits supplémentaires à leur commande. La valeur du panier augmentera. Le magasin gagnera plus. Tout le monde est content :)
Dans le cas d'une telle vente incitative, vous pouvez appliquer une remise sur le produit vendu incitative. De cette façon, la satisfaction du client avec l'achat augmentera.
Algorithme apriori en bref
Qu'est-ce que l'analyse du panier ?
Question - comment extraire des données utiles des commandes de produits pour des recommandations de produits ? La réponse est la soi-disant analyse du panier. C'est une méthode de fouille de données.
Un algorithme efficace et populaire pour l'analyse des paniers est l'algorithme Apriori. Cet algorithme définit la manière dont nous exploitons les données et comment nous évaluons leur utilité.
Toutes les corrélations de produits dans le panier du client ne seront pas utilisées pour les recommandations. Si un cas se produit 1 fois sur 1000, il est inutile de mettre en œuvre une telle recommandation au niveau du magasin. Ce n'est pas une tendance, mais un cas isolé.
Exemples de mise en œuvre efficace
En ligne, nous pouvons trouver des informations selon lesquelles l'analyse du panier a été utilisée par Wal-Mart dans les années 1990. C'est l'une des plus grandes chaînes d'hypermarchés aux États-Unis. Grâce à l'analyse du panier, une forte relation entre la bière et les couches a été découverte. Vous ne trouveriez pas quelque chose comme ça par vous-même, de telles corrélations étranges résultent de l'exploration de données.
Venons-en au fait : la bière et les couches pour bébés étaient souvent achetées le vendredi soir par les jeunes hommes. Grâce à cette connaissance, les analystes ont introduit des changements dans le magasin. Premièrement, ils ont rapproché ces produits. Deuxièmement, ils ont modifié les activités de marketing. Un grand hypermarché applique toutes les promotions et réductions sur les produits. Le vendredi, il a été décidé qu'un seul des deux produits serait en promotion. Dans la plupart des cas, les deux seront achetés de toute façon. De cette façon, le magasin a réalisé des ventes supplémentaires et économisé sur les activités de marketing.
De nombreux principes et méthodes utilisés dans l'analyse des magasins traditionnels peuvent également être appliqués au commerce électronique. Certains d'entre eux sont plus faciles à mettre en œuvre. Nos boutiques en ligne peuvent être facilement surveillées - clics, trafic, temps passé sur le site. Il vaut également la peine d'utiliser les données sur les produits du panier pour améliorer le système de recommandation.
Un bon exemple ici est Amazon. Plus de 20% des commandes sont générées à l'aide de différents types de systèmes de recommandation.
Concepts de base
L'algorithme Apriori ne montre pas seulement les relations entre les produits, mais grâce à sa conception, il vous permet de rejeter les données insignifiantes. A cet effet, il introduit deux notions importantes :
- soutien - fréquence d'occurrence
- confiance - certitude de la règle
L'algorithme permet de déterminer les valeurs minimales pour ces deux indicateurs. Ainsi, nous rejetons les transactions qui ne répondent pas aux hypothèses de qualité de la recommandation.
Le fonctionnement de cet algorithme est itératif. Nous ne traitons pas toutes les données en même temps. Grâce à cela, l'algorithme limite le nombre de calculs sur la base de données.
Je vais vous montrer le fonctionnement de l'algorithme en pratique. J'expliquerai l'utilisation du support et de la confiance comme éléments clés de l'algorithme Apriori.
Le principe de fonctionnement de l'algorithme Apriori
Hypothèses initiales par exemple
Prenons un exemple simplifié. Supposons que nous ayons quatre produits dans notre magasin : A, B, C, D. Les clients ont effectué 7 transactions, qui ressemblent à ceci :
- A B C D
- UN B
- B, C, D
- A, B, D
- AVANT JC
- C, D
- B, D
Nous utiliserons Apriori pour déterminer les relations entre les produits. En tant que support , nous définissons la valeur sur 3. Cela signifie que la règle doit se produire 3 fois dans l'itération donnée.
La première itération
Commençons la première itération. Nous déterminons à quelle fréquence le produit est apparu dans les commandes :
- A - 3 fois
- B - 6 fois
- C-4 fois
- J - 5 fois
Chacun de ces produits est apparu dans les commandes plus de 3 fois. Tous les produits répondent aux exigences de support. Nous utiliserons chacun d'eux dans la prochaine itération.
La deuxième itération
Nous recherchons maintenant des connexions dans des produits basés sur un ensemble de deux produits. Nous recherchons la fréquence à laquelle les clients assemblent deux produits sélectionnés dans une seule commande.
- A, B - 3 fois
- A, C - 1 fois
- A, D - 2 fois
- B, C - 3 fois
- B, D - 4 fois
- C, D - 3 fois
Comme vous pouvez le voir, les ensembles {A, C} et {A, D} ne répondent pas aux hypothèses de support . Ils se produisent moins de trois fois. Par conséquent, nous les excluons de la prochaine itération.
Troisième itération
Nous recherchons des ensembles composés de trois produits, qui :
- survenu dans les commandes des clients
- ne contiennent pas les ensembles {A, C} et {A, D} en eux-mêmes
C'est donc un ensemble de : {B, C, D}. Il ne se produit que deux fois dans les commandes, il ne répond donc pas à nos hypothèses de support .
Résultat
Nos hypothèses répondent aux ensembles suivants :
- A, B - s'est produit trois fois dans les commandes
- B, C - 3 fois aussi
- B, D - 4 fois
Cet exemple était uniquement destiné à illustrer le fonctionnement de l'algorithme. Pour la plupart des magasins en ligne, les calculs sur les données seront beaucoup plus compliqués, car ils seront plus nombreux.
Soutien exprimé en pourcentage
Il convient d'ajouter que le support définit la part globale de la règle dans toutes les transactions. Nous avons convenu d' étayer nos exigences minimales par une valeur numérique : 3. Cependant, nous pourrions fixer un pourcentage. Dans ce cas:
- A, B ont un support égal à environ 42,9% - ils se produisent 3 fois pour 7 transactions
- B, C ont le même support
- B, D ont un support égal à environ 57,14% - ils se produisent 4 fois pour 7 transactions
Des pourcentages élevés du facteur de support résultent d'un petit nombre de produits dans notre exemple. Nous n'avons que 4 produits : A, B, C, D.
Il est très peu probable que dans un magasin avec, par exemple, 1000 produits, il y ait toujours deux produits identiques dans la moitié des commandes.
Cet exemple est volontairement simplifié. Vous devez en tenir compte lorsque vous utilisez l'algorithme dans votre magasin. Vous devez définir la valeur minimale de prise en charge individuellement pour le magasin, l'industrie, etc.
Conclusions finales
La question de la confiance demeure. Il spécifie l'occurrence d'une règle donnée à toutes celles où l'ensemble initial s'est produit.
Comment le calculer ?
{A, B} - est apparu trois fois dans les commandes L'ensemble initial est A. Ce produit est également apparu trois fois dans les commandes. La confiance est donc de 100 %.
Inversons l'image de cette paire. {B, A} s'est produit 3 fois dans les commandes. Rien n'a changé ici - la paire est la même. Cependant, l'ensemble initial change. C'est B. Ce produit est survenu dans 6 transactions. Cela nous donne confiance au niveau de 50%. Le produit A n'est intervenu que dans la moitié des transactions dans lesquelles le produit B a eu lieu.
- A et B ont 100 % de confiance
- B et A ont 50 % de confiance
- B et C ont 50 % de confiance
- C et B ont 75 % de confiance
- B et D ont une confiance de 66,7 %
- D et B ont 80 % de confiance
Notre exemple simplifié (4 produits, 7 transactions) donne naissance aux recommandations suivantes :
- A -> B
- B -> D
- C -> B
- D -> B
où le premier produit est celui qu'un utilisateur ajoute au panier. Le deuxième est celui que nous recommandons.
Conclusion
L'analyse du panier est une méthode très efficace pour le système de recommandation de produits. Cependant, je ne peux pas imaginer un traitement manuel des données selon l'algorithme ci-dessus. Surtout avec les grands magasins.
Une analyse de panier efficace nécessite une mise en œuvre pratique. L'algorithme Apriori doit fonctionner sur le principe d'un programme, et non sur le traitement manuel des données.
Il existe une implémentation de l'algorithme Apriori en Python sur le réseau.
Cependant, comme vous pouvez le voir sur la capture d'écran, son utilisation nécessite des compétences en programmation.
Consultez également nos conseils de commerce électronique →