Utilizzare l'algoritmo Apriori per consigli sui prodotti migliori
Pubblicato: 2018-10-05In questo articolo imparerai il metodo efficace dei consigli sui prodotti (la cosiddetta analisi del carrello). Utilizzando un algoritmo speciale (algoritmo Apriri), imparerai quali prodotti vendere in set. Otterrai informazioni su quale prodotto consigliare sul sito Web di un altro prodotto. In questo modo, aumenterai il valore medio del carrello nel tuo negozio.
Consigli intelligenti sui prodotti - vendita incrociata
Uno dei metodi per aumentare le vendite nel negozio online è la raccomandazione di prodotti correlati.
Sfortunatamente, l'implementazione più comune di tali consigli è la visualizzazione di prodotti della stessa categoria. Sotto il prodotto che stiamo visualizzando, vediamo altri prodotti di questo tipo, ad es. altre offerte di calzature.
Tuttavia, la relazione tra i prodotti non risulta dalla categoria congiunta in cui sono stati inseriti nel negozio. Consigliare altre scarpe quando il cliente ne ha già messo un paio nel carrello non ha alcun senso. In questo modo, facciamo ipotesi alla cieca se funziona. Forse il cliente aggiungerà qualcos'altro al carrello.
L'essenza delle raccomandazioni sui prodotti è offrire ai clienti un prodotto che li interessi chiaramente. Come facciamo a sapere quali sono questi prodotti? Grazie alle statistiche! Con il suo aiuto, possiamo scoprire che la maggior parte dei clienti che acquistano il prodotto A, acquista anche B e C. In questo caso, consigliamo B e C al cliente che inserisce A nel carrello. Questo tipo di raccomandazione sui prodotti funziona meglio nella pagina del carrello.
In questo modo, i clienti che effettuano l'acquisto ottengono informazioni che possono acquistare altri articoli. Percepiamo una certa tendenza all'acquisto e ne facilitiamo l'attuazione ai clienti successivi.
Grazie a una comoda interfaccia, i clienti successivi aggiungeranno prodotti aggiuntivi al loro ordine. Il valore del carrello aumenterà. Il negozio guadagnerà di più. Sono tutti felici :)
In caso di tale upselling, puoi applicare uno sconto sul prodotto venduto. In questo modo, la soddisfazione del cliente per l'acquisto aumenterà.
Algoritmo Apriori in breve
Che cos'è l'analisi del carrello?
Domanda: come prendere dati utili dagli ordini di prodotti per consigli sui prodotti? La risposta è la cosiddetta analisi del carrello. È un metodo di data mining.
Un algoritmo efficiente e popolare per l'analisi del carrello è l'algoritmo Apriori. Questo algoritmo definisce il modo in cui estraiamo i dati e come ne valutiamo l'utilità.
Non tutte le correlazioni di prodotti nel carrello del cliente verranno utilizzate per i consigli. Se un caso si è verificato 1 volta su 1000, non ha senso implementare tale raccomandazione a livello di negozio. Questa non è una tendenza, ma un singolo caso.
Esempi di attuazione efficace
Online possiamo trovare informazioni che l'analisi del carrello è stata utilizzata da Wal-Mart negli anni '90. È una delle più grandi catene di ipermercati negli Stati Uniti. Grazie all'analisi del carrello è stata scoperta una forte relazione tra birra e pannolini. Non ti verrebbe in mente qualcosa del genere da solo, queste strane correlazioni derivano dal data mining.
Veniamo al dunque: birra e pannolini per bambini venivano comprati spesso il venerdì sera da giovani uomini. Grazie a questa conoscenza, gli analisti hanno introdotto modifiche nel negozio. In primo luogo, hanno messo insieme questi prodotti. In secondo luogo, hanno modificato le attività di marketing. Un grande ipermercato applica tutte le promozioni e gli sconti sui prodotti. Il venerdì è stato deciso che solo uno dei due prodotti sarà scontato. Nella maggior parte dei casi verranno comunque acquistati entrambi. In questo modo, il negozio ha guadagnato vendite aggiuntive e risparmiato sulle attività di marketing.
Molti dei principi e dei metodi utilizzati nell'analisi dei negozi tradizionali possono essere applicati anche nell'e-commerce. Alcuni di loro sono più facili da implementare. I nostri negozi online possono essere facilmente monitorati: clic, traffico, tempo trascorso sul sito. Vale anche la pena utilizzare i dati sui prodotti nel carrello per migliorare il sistema di raccomandazione.
Un buon esempio qui è Amazon. Oltre il 20% degli ordini viene generato con l'ausilio di vari tipi di sistemi di raccomandazione.
Concetti basilari
L'algoritmo Apriori non mostra solo le relazioni tra i prodotti, ma grazie al suo design permette di rifiutare dati insignificanti. A tal fine, introduce due concetti importanti:
- supporto - frequenza di occorrenza
- fiducia - certezza della regola
L'algoritmo consente di determinare i valori minimi per questi due indicatori. Pertanto, rifiutiamo le transazioni che non soddisfano le ipotesi di qualità per la raccomandazione.
Il funzionamento di questo algoritmo è iterativo. Non elaboriamo tutti i dati in una volta. Grazie a ciò, l'algoritmo limita il numero di calcoli sul database.
Ti mostrerò in pratica il funzionamento dell'algoritmo. Spiegherò l'uso del supporto e della fiducia come elementi chiave dell'algoritmo Apriori.
Il principio di funzionamento dell'algoritmo Apriori
Presupposti iniziali per esempio
Usiamo un esempio semplificato. Supponiamo di avere quattro prodotti nel nostro negozio: A, B, C, D. I clienti hanno effettuato 7 transazioni, che assomigliano a questa:
- A, B, C, D
- A, B
- B, C, D
- A, B, D
- AVANTI CRISTO
- CD
- B, D
Useremo Apriori per determinare le relazioni tra i prodotti. Come supporto , impostiamo il valore su 3. Ciò significa che la regola deve verificarsi 3 volte nell'iterazione data.
La prima iterazione
Iniziamo la prima iterazione. Determiniamo la frequenza con cui il prodotto è apparso negli ordini:
- R - 3 volte
- B - 6 volte
- C - 4 volte
- D - 5 volte
Ciascuno di questi prodotti è apparso negli ordini più di 3 volte. Tutti i prodotti soddisfano i requisiti di supporto. Useremo ciascuno di essi nella prossima iterazione.
La seconda iterazione
Ora cerchiamo le connessioni nei prodotti basati su un insieme di due prodotti. Cerchiamo con quale frequenza i clienti mettono insieme due prodotti selezionati in un ordine.
- A, B - 3 volte
- A, C - 1 volte
- A, D - 2 volte
- B, C - 3 volte
- B, D - 4 volte
- C, D - 3 volte
Come puoi vedere, gli insiemi {A, C} e {A, D} non soddisfano le ipotesi di supporto . Si verificano meno di tre volte. Pertanto, li escludiamo dalla prossima iterazione.
Terza iterazione
Cerchiamo set composti da tre prodotti, che:
- avvenuta negli ordini dei clienti
- non contengono gli insiemi {A, C} e {A, D} in se stessi
È quindi un insieme di: {B, C, D}. Si verifica negli ordini solo due volte, quindi non soddisfa le nostre ipotesi di supporto .
Risultato
Le nostre ipotesi soddisfano i seguenti insiemi:
- A, B - si è verificato tre volte negli ordini
- B, C - anche 3 volte
- B, D - 4 volte
Questo esempio aveva solo lo scopo di illustrare il funzionamento dell'algoritmo. Per la maggior parte dei negozi online, i calcoli sui dati saranno molto più complicati, poiché ce ne saranno di più.
Supporto espresso in percentuale
Vale la pena aggiungere che il supporto definisce la quota globale della regola in tutte le transazioni. Abbiamo deciso di supportare i nostri requisiti minimi come valore numerico: 3. Tuttavia, potremmo fissare una percentuale. In questo caso:
- A, B hanno un supporto pari a circa il 42,9% - si verificano 3 volte per 7 transazioni
- B, C hanno lo stesso supporto
- B, D hanno un supporto pari a circa il 57,14% - si verificano 4 volte per 7 transazioni
Percentuali elevate del fattore di supporto derivano da un numero ridotto di prodotti nel nostro esempio. Abbiamo solo 4 prodotti: A, B, C, D.
È molto improbabile che in un negozio con, ad esempio, 1000 prodotti, nella metà degli ordini ci fossero sempre due prodotti identici.
Questo esempio è volutamente semplificato. Dovresti tenerne conto quando usi l'algoritmo nel tuo negozio. È necessario impostare il valore minimo del supporto individualmente per il negozio, l'industria, ecc.
Conclusioni finali
Resta la questione della fiducia . Specifica l'occorrenza di una determinata regola a tutti quelli in cui si è verificato il set iniziale.
Come calcolarlo?
{A, B} - si è verificato tre volte negli ordini Il set iniziale è A. Questo prodotto è apparso anche tre volte negli ordini. La fiducia è quindi del 100%.
Immaginiamo speculare questa coppia. {B, A} si è verificato negli ordini 3 volte. Non è cambiato nulla qui: la coppia è la stessa. Tuttavia, il set iniziale cambia. Questo è B. Questo prodotto si è verificato in 6 transazioni. Questo ci dà fiducia al livello del 50%. Il prodotto A si è verificato solo nella metà delle transazioni in cui si è verificato il prodotto B.
- A e B hanno il 100% di confidenza
- B e A hanno una confidenza del 50%.
- B e C hanno una confidenza del 50%.
- C e B hanno una confidenza del 75%.
- B e D hanno una confidenza del 66,7%.
- D e B hanno l'80% di confidenza
Il nostro esempio semplificato (4 prodotti, 7 transazioni) dà vita alle seguenti raccomandazioni:
- A -> B
- B -> D
- C -> B
- D -> B
dove il primo prodotto è quello che un utente aggiunge al carrello. Il secondo è questo che ti consigliamo.
Conclusione
L'analisi del carrello è un metodo molto efficace per il sistema di raccomandazione del prodotto. Tuttavia, non riesco a immaginare l'elaborazione manuale dei dati secondo l'algoritmo di cui sopra. Soprattutto con i negozi più grandi.
Un'analisi efficace del carrello richiede un'implementazione conveniente. L'algoritmo Apriori dovrebbe funzionare sul principio di un programma, non sull'elaborazione manuale dei dati.
Esiste un'implementazione dell'algoritmo Apriori in Python sulla rete.
Tuttavia, come puoi vedere nello screenshot, richiede abilità di programmazione per usarlo.
Inoltre, dai un'occhiata ai nostri Suggerimenti per l'e-commerce →