Utilizați algoritmul Apriori pentru recomandări mai bune de produse
Publicat: 2018-10-05În acest articol, veți afla metoda eficientă de recomandare a produselor (așa-numita analiză a coșului). Folosind un algoritm special (algoritmul Apriori), veți afla ce produse să vindeți în seturi. Veți obține informații despre ce produs să recomandați pe site-ul altui produs. În acest fel, vei crește valoarea medie a coșului din magazinul tău.
Recomandări inteligente de produse - vânzare încrucișată
Una dintre metodele de creștere a vânzărilor în magazinul online este recomandarea de produse aferente.
Din păcate, cea mai comună implementare a unor astfel de recomandări este afișarea produselor din aceeași categorie. Sub produsul pe care îl vizionam, vedem și alte produse de acest tip - ex. alte oferte de încălțăminte.
Relatia dintre produse nu rezulta insa din categoria comuna in care acestea au fost adaugate in magazin. A recomanda alți pantofi atunci când clientul a pus deja o pereche în cărucior nu are niciun sens. În acest fel, facem ghici oarbe dacă acest lucru funcționează. Poate clientul va adăuga altceva în coș.
Esența recomandărilor de produse este de a oferi clienților un astfel de produs de care să fie clar interesați. De unde știm care sunt aceste produse? Multumesc statisticilor! Cu ajutorul lui, putem afla că majoritatea clienților care cumpără produsul A, cumpără și B și C. În acest caz, recomandăm B și C clientului care pune A în coș. Acest tip de recomandare de produse funcționează cel mai bine pe pagina coșului.
În acest fel, clienții care efectuează achiziția primesc informații că pot cumpăra alte articole. Percepem o anumită tendință de cumpărare și facilităm implementarea acesteia către clienții ulterioare.
Datorită unei interfețe convenabile, clienții următori vor adăuga produse suplimentare la comanda lor. Valoarea căruciorului va crește. Magazinul va câștiga mai mult. Toată lumea este fericită :)
În cazul unei astfel de vânzări suplimentare, puteți aplica o reducere la produsul vândut. În acest fel, satisfacția clienților față de achiziție va crește.
Algoritmul apriori pe scurt
Ce este analiza căruciorului?
Întrebare - cum se preia date utile din comenzile de produse pentru recomandări de produse? Răspunsul este așa-numita analiză a cărucioarelor. Este o metodă de extragere a datelor.
Un algoritm eficient și popular pentru analiza coșului este algoritmul Apriori. Acest algoritm definește modul în care extragem datele și cum le evaluăm utilitatea.
Nu orice corelare de produse din coșul clientului va fi folosită pentru recomandări. Dacă un caz s-a întâmplat o dată la 1000, atunci nu are rost să implementezi o astfel de recomandare la nivel de magazin. Acesta nu este o tendință, ci un singur caz.
Exemple de implementare eficientă
Online putem găsi informații că analiza coșului a fost folosită de Wal-Mart în anii 1990. Este unul dintre cele mai mari lanțuri de hipermarketuri din Statele Unite. Datorită analizei cărucioarelor, s-a descoperit o relație puternică între bere și scutece. Nu ai veni cu așa ceva de unul singur, astfel de corelații ciudate rezultă din data mining.
Să trecem la subiect: berea și scutecele pentru copii erau adesea cumpărate vineri seara de tineri. Datorită acestor cunoștințe, analiștii au introdus schimbări în magazin. În primul rând, au pus aceste produse mai aproape între ele. În al doilea rând, au modificat activitățile de marketing. Un hipermarket mare aplică toate promoțiile și reducerile la produse. Vineri s-a decis ca doar unul dintre cele două produse să fie redus. În cele mai multe cazuri, ambele vor fi achiziționate oricum. Astfel, magazinul a câștigat vânzări suplimentare și a făcut economii în activități de marketing.
Multe dintre principiile și metodele folosite în analiza magazinelor tradiționale pot fi aplicate și în comerțul electronic. Unele dintre ele sunt mai ușor de implementat. Magazinele noastre online pot fi monitorizate cu ușurință - clicuri, trafic, timpul petrecut pe site. De asemenea, merită să folosiți datele despre produsele din coș pentru a îmbunătăți sistemul de recomandare.
Un bun exemplu aici este Amazon. Peste 20% din comenzi sunt generate cu ajutorul diferitelor tipuri de sisteme de recomandare.
Noțiuni de bază
Algoritmul Apriori nu arată doar relațiile dintre produse, dar datorită designului său vă permite să respingeți datele nesemnificative. În acest scop, introduce două concepte importante:
- suport – frecvența de apariție
- încredere – certitudinea regulii
Algoritmul face posibilă determinarea valorilor minime pentru acești doi indicatori. Astfel, respingem tranzacțiile care nu îndeplinesc ipotezele de calitate pentru recomandare.
Funcționarea acestui algoritm este iterativă. Nu procesăm toate datele simultan. Datorită acestui fapt, algoritmul limitează numărul de calcule din baza de date.
Vă voi arăta funcționarea algoritmului în practică. Voi explica utilizarea suportului și a încrederii ca elemente cheie ale algoritmului Apriori.
Principiul de funcționare al algoritmului Apriori
Ipotezele inițiale, de exemplu
Să folosim un exemplu simplificat. Să presupunem că avem patru produse în magazinul nostru: A, B, C, D. Clienții au făcut 7 tranzacții, care arată astfel:
- A, B, C, D
- A, B
- B, C, D
- A, B, D
- B, C
- C, D
- B, D
Vom folosi Apriori pentru a determina relațiile dintre produse. Ca suport , setăm valoarea la 3. Aceasta înseamnă că regula trebuie să apară de 3 ori în iterația dată.
Prima iterație
Să începem prima iterație. Determinăm cât de des a apărut produsul în comenzi:
- A - de 3 ori
- B - de 6 ori
- C - de 4 ori
- D - de 5 ori
Fiecare dintre aceste produse a apărut în comenzi de mai mult de 3 ori. Toate produsele îndeplinesc cerințele de asistență. Vom folosi fiecare dintre ele în următoarea iterație.
A doua iterație
Acum căutăm conexiuni în produse bazate pe un set de două produse. Căutăm cât de des clienții pun împreună două produse selectate într-o singură comandă.
- A, B - de 3 ori
- A, C - de 1 ori
- A, D - de 2 ori
- B, C - de 3 ori
- B, D - de 4 ori
- C, D - de 3 ori
După cum puteți vedea, seturile {A, C} și {A, D} nu îndeplinesc ipotezele de sprijin . Ele apar de mai puțin de trei ori. Prin urmare, îi excludem din următoarea iterație.
A treia iterație
Căutăm seturi formate din trei produse, care:
- apărute în comenzile clienților
- nu conțin mulțimi {A, C} și {A, D} în sine
Este deci un set de: {B, C, D}. Apare în comenzi doar de două ori, așa că nu îndeplinește ipotezele noastre de suport .
Rezultat
Ipotezele noastre îndeplinesc următoarele seturi:
- A, B - a apărut de trei ori în ordine
- B, C - de 3 ori, de asemenea
- B, D - de 4 ori
Acest exemplu a fost menit doar să ilustreze funcționarea algoritmului. Pentru majoritatea magazinelor online, calculele pe date vor fi mult mai complicate, deoarece vor fi mai multe.
Sprijin exprimat în procente
Merită adăugat că suportul definește ponderea globală a regulii în toate tranzacțiile. Am fost de acord să sprijinim cerințele noastre minime ca valoare numerică: 3. Cu toate acestea, am putea stabili un procent. În acest caz:
- A, B au suport egal cu aproximativ 42,9% - apar de 3 ori pentru 7 tranzacții
- B, C au același suport
- B, D au suport egal cu aproximativ 57,14% - apar de 4 ori pentru 7 tranzacții
Procente mari ale factorului de suport rezultă dintr-un număr mic de produse din exemplul nostru. Avem doar 4 produse: A, B, C, D.
Este foarte puțin probabil ca într-un magazin cu, de exemplu, 1000 de produse, să fie întotdeauna două produse identice în jumătate din comenzi.
Acest exemplu este simplificat în mod deliberat. Ar trebui să țineți cont de acest lucru atunci când utilizați algoritmul în magazinul dvs. Ar trebui să setați individual valoarea minimă a suportului pentru magazin, industrie etc.
Concluzii finale
Rămâne problema încrederii . Specifică apariția unei anumite reguli tuturor celor în care a avut loc setul inițial.
Cum se calculează?
{A, B} - a apărut de trei ori în comenzi Setul inițial este A. Acest produs a apărut și în comenzi de trei ori. Încrederea este deci de 100%.
Să ne oglindim această pereche. {B, A} a apărut în ordine de 3 ori. Nimic nu s-a schimbat aici - perechea este aceeași. Cu toate acestea, setul inițial se modifică. Acesta este B. Acest produs a avut loc în 6 tranzacții. Acest lucru ne oferă încredere la nivelul de 50%. Produsul A a apărut doar în jumătate din tranzacțiile în care a avut loc produsul B.
- A și B au încredere 100%.
- B și A au 50% încredere
- B și C au încredere de 50%.
- C și B au 75% încredere
- B și D au 66,7% încredere
- D și B au 80% încredere
Exemplul nostru simplificat (4 produse, 7 tranzacții) dă naștere următoarelor recomandări:
- A -> B
- B -> D
- C -> B
- D -> B
unde primul produs este cel pe care un utilizator îl adaugă în coș. Al doilea este acesta pe care îl recomandăm.
Concluzie
Analiza coșului este o metodă foarte eficientă pentru sistemul de recomandare a produselor. Cu toate acestea, nu îmi pot imagina prelucrarea manuală a datelor conform algoritmului de mai sus. Mai ales cu magazinele mai mari.
O analiză eficientă a cărucioarelor necesită o implementare convenabilă. Algoritmul Apriori ar trebui să funcționeze pe principiul unui program, nu pe o prelucrare manuală a datelor.
Există o implementare a algoritmului Apriori în Python în rețea.
Cu toate acestea, după cum puteți vedea în captură de ecran, este nevoie de abilități de programare pentru a-l folosi.
De asemenea, consultați Sfaturile noastre de comerț electronic →