Użyj algorytmu Apriori, aby uzyskać lepsze rekomendacje produktów
Opublikowany: 2018-10-05W tym artykule poznasz skuteczną metodę rekomendacji produktów (tzw. analizę koszyka). Korzystając ze specjalnego algorytmu (algorytmu Apriori) dowiesz się, jakie produkty sprzedawać w zestawach. Otrzymasz informację, który produkt polecić na stronie innego produktu. W ten sposób zwiększysz średnią wartość koszyka w swoim sklepie.
Inteligentne rekomendacje produktów - cross-selling
Jedną z metod zwiększania sprzedaży w sklepie internetowym jest rekomendacja powiązanych produktów.
Niestety najczęstszą realizacją takich rekomendacji jest wyświetlanie produktów z tej samej kategorii. Pod oglądanym produktem widzimy inne produkty tego typu – np. inne oferty obuwnicze.
Relacja między produktami nie wynika jednak ze wspólnej kategorii, w której zostały dodane w sklepie. Polecanie innych butów, gdy klient włożył już jedną parę do koszyka, nie ma żadnego sensu. W ten sposób domyślamy się na ślepo, czy to działa. Może klient doda do koszyka coś jeszcze.
Istotą rekomendacji produktowych jest dostarczenie klientom takiego produktu, którym będą wyraźnie zainteresowani. Skąd wiemy, co to za produkty? Dzięki statystykom! Z jego pomocą możemy dowiedzieć się, że większość klientów kupujących produkt A, kupuje również B i C. W takim przypadku polecamy B i C klientowi, który wkłada A do koszyka. Tego rodzaju rekomendacje produktów najlepiej sprawdzają się na stronie koszyka.
W ten sposób klienci dokonujący zakupu otrzymują informację, że mogą kupić inne przedmioty. Dostrzegamy pewien trend zakupowy i ułatwiamy jego realizację kolejnym klientom.
Dzięki wygodnemu interfejsowi kolejni klienci będą dodawać kolejne produkty do swojego zamówienia. Wartość koszyka wzrośnie. Sklep zarobi więcej. Wszyscy są szczęśliwi :)
W przypadku takiej dosprzedaży możesz zastosować zniżkę na sprzedawany produkt. W ten sposób wzrośnie satysfakcja klienta z zakupu.
Algorytm apriori w pigułce
Na czym polega analiza koszyka?
Pytanie - jak pobrać przydatne dane z zamówień produktów do rekomendacji produktów? Odpowiedzią jest tzw. analiza koszyka. Jest to metoda eksploracji danych.
Wydajnym i popularnym algorytmem analizy koszyka jest algorytm Apriori. Algorytm ten definiuje sposób, w jaki wydobywamy dane i jak oceniamy ich przydatność.
Nie każda korelacja produktów w koszyku klienta zostanie wykorzystana do rekomendacji. Jeśli sprawa zdarzyła się 1 raz na 1000, to nie ma sensu wdrażać takiej rekomendacji na poziomie sklepu. To nie trend, ale pojedynczy przypadek.
Przykłady skutecznego wdrożenia
W sieci możemy znaleźć informację, że analiza koszyka została wykorzystana przez Wal-Mart w latach 90-tych. Jest to jedna z największych sieci hipermarketów w Stanach Zjednoczonych. Dzięki analizie koszykowej odkryto silny związek piwa z pieluchami. Sam nie wymyśliłbyś czegoś takiego, takie dziwne korelacje wynikają z eksploracji danych.
Przejdźmy do rzeczy: piwo i pieluchy dla dzieci często kupowali w piątkowe wieczory młodzi mężczyźni. Dzięki tej wiedzy analitycy wprowadzili zmiany w sklepie. Najpierw zbliżyli te produkty do siebie. Po drugie, zmodyfikowali działania marketingowe. Duży hipermarket stosuje wszelkie promocje i rabaty na produkty. W piątki zdecydowano, że tylko jeden z dwóch produktów zostanie przeceniony. W większości przypadków oba i tak zostaną wykupione. W ten sposób sklep zyskał dodatkową sprzedaż i zaoszczędził na działaniach marketingowych.
Wiele zasad i metod stosowanych w analizie sklepów tradycyjnych można zastosować również w e-commerce. Niektóre z nich są łatwiejsze do wdrożenia. Nasze sklepy internetowe można łatwo monitorować - kliknięcia, ruch, czas spędzony na stronie. Warto również wykorzystać dane o produktach w koszyku do usprawnienia systemu rekomendacji.
Dobrym przykładem jest tutaj Amazon. Ponad 20% zamówień generowanych jest za pomocą różnego rodzaju systemów rekomendacji.
Podstawowe koncepcje
Algorytm Apriori nie tylko pokazuje relacje między produktami, ale dzięki swojej konstrukcji pozwala odrzucić nieistotne dane. W tym celu wprowadza dwa ważne pojęcia:
- wsparcie - częstotliwość występowania
- zaufanie - pewność reguły
Algorytm umożliwia wyznaczenie wartości minimalnych dla tych dwóch wskaźników. Tym samym odrzucamy transakcje, które nie spełniają założeń jakościowych rekomendacji.
Działanie tego algorytmu jest iteracyjne. Nie przetwarzamy wszystkich danych jednocześnie. Dzięki temu algorytm ogranicza liczbę obliczeń na bazie danych.
Pokażę Ci działanie algorytmu w praktyce. Wyjaśnię wykorzystanie wsparcia i pewności jako kluczowych elementów algorytmu Apriori.
Zasada działania algorytmu Apriori
Na przykład wstępne założenia
Użyjmy uproszczonego przykładu. Załóżmy, że w naszym sklepie mamy cztery produkty: A, B, C, D. Klienci dokonali 7 transakcji, które wyglądają tak:
- A, B, C, D
- A, B
- B, C, D
- A, B, D
- PNE
- PŁYTA CD
- B, D
Użyjemy Apriori do określenia relacji między produktami. Jako wsparcie ustawiamy wartość 3. Oznacza to, że reguła musi wystąpić 3 razy w danej iteracji.
Pierwsza iteracja
Zacznijmy pierwszą iterację. Określamy, jak często produkt pojawiał się w zamówieniach:
- A - 3 razy
- B - 6 razy
- C - 4 razy
- D - 5 razy
Każdy z tych produktów pojawił się w zamówieniach ponad 3 razy. Wszystkie produkty spełniają wymagania wsparcia. Użyjemy każdego z nich w następnej iteracji.
Druga iteracja
Poszukujemy teraz połączeń w produktach opartych na zestawie dwóch produktów. Sprawdzamy, jak często klienci składają dwa wybrane produkty w jednym zamówieniu.
- A, B - 3 razy
- A, C - 1 razy
- A, D - 2 razy
- B, C - 3 razy
- B, D - 4 razy
- C, D - 3 razy
Jak widać, zbiory {A,C} i {A,D} nie spełniają założeń wsparcia . Występują mniej niż trzy razy. Dlatego wykluczamy je z następnej iteracji.
Trzecia iteracja
Poszukujemy zestawów składających się z trzech produktów, które:
- wystąpiły w zamówieniach klientów
- nie zawierają w sobie zbiorów {A, C} i {A, D}
Jest to zatem zbiór: {B, C, D}. Występuje w zamówieniach tylko dwa razy, więc nie spełnia naszych założeń wsparcia .
Wynik
Nasze założenia spełniają następujące zestawy:
- A, B - wystąpiły trzykrotnie w zamówieniach
- B, C - również 3 razy
- B, D - 4 razy
Ten przykład miał jedynie zilustrować działanie algorytmu. W przypadku większości sklepów internetowych obliczenia na danych będą znacznie bardziej skomplikowane, ponieważ będzie ich więcej.
Wsparcie wyrażone w procentach
Warto dodać, że wsparcie określa globalny udział reguły we wszystkich transakcjach. Zgodziliśmy się poprzeć nasze minimalne wymagania jako wartość liczbową: 3. Możemy jednak ustalić procent. W tym przypadku:
- A, B mają wsparcie równe około 42,9% - występują 3 razy dla 7 transakcji
- B, C mają takie samo wsparcie
- B, D mają wsparcie równe około 57,14% - występują 4 razy na 7 transakcji
Wysokie procenty współczynnika wsparcia wynikają z małej liczby produktów w naszym przykładzie. Mamy tylko 4 produkty: A, B, C, D.
Jest bardzo mało prawdopodobne, aby w sklepie z np. 1000 produktów w połowie zamówień były zawsze dwa identyczne produkty.
Ten przykład jest celowo uproszczony. Powinieneś wziąć to pod uwagę używając algorytmu w swoim sklepie. Minimalną wartość wsparcia należy ustawić indywidualnie dla sklepu, branży itp.
Wnioski końcowe
Pozostaje kwestia zaufania . Określa wystąpienie danej reguły wszystkim tym, w których wystąpił początkowy zestaw.
Jak to obliczyć?
{A, B} - trzykrotnie występował w zamówieniach Początkowy zestaw to A. Ten produkt również pojawił się w zamówieniach trzykrotnie. Zaufanie wynosi zatem 100%.
Zróbmy odbicie lustrzane tej pary. {B, A} wystąpiło w zamówieniach 3 razy. Tutaj nic się nie zmieniło - para jest taka sama. Jednak początkowy zestaw się zmienia. To jest B. Ten produkt wystąpił w 6 transakcjach. Daje nam to pewność na poziomie 50%. Produkt A wystąpił tylko w połowie transakcji, w których wystąpił produkt B.
- A i B mają 100% pewności
- B i A mają 50% pewności
- B i C mają 50% pewności
- C i B mają 75% pewności
- B i D mają 66,7% pewności
- D i B mają 80% pewności
Nasz uproszczony przykład (4 produkty, 7 transakcji) rodzi następujące zalecenia:
- A -> B
- B -> D
- C -> B
- D -> B
gdzie pierwszy produkt to ten, który użytkownik dodaje do koszyka. Drugi to ten, który polecamy.
Wniosek
Analiza koszyka to bardzo skuteczna metoda systemu rekomendacji produktów. Nie wyobrażam sobie jednak ręcznego przetwarzania danych według powyższego algorytmu. Zwłaszcza przy większych sklepach.
Skuteczna analiza koszyka wymaga wygodnego wdrożenia. Algorytm Apriori powinien działać na zasadzie programu, a nie ręcznego przetwarzania danych.
W sieci istnieje implementacja algorytmu Apriori w Pythonie.
Jednak, jak widać na zrzucie ekranu, jego użycie wymaga umiejętności programistycznych.
Sprawdź także nasze porady dotyczące e-commerce →