Gunakan Algoritma Apriori untuk Rekomendasi Produk yang Lebih Baik

Diterbitkan: 2018-10-05

Dalam artikel ini, Anda akan mempelajari metode rekomendasi produk yang efektif (yang disebut analisis keranjang). Dengan menggunakan algoritma khusus (algoritma Apriori), Anda akan mempelajari produk mana yang akan dijual dalam set. Anda akan mendapatkan informasi tentang produk mana yang akan direkomendasikan di situs web produk lain. Dengan cara ini, Anda akan meningkatkan nilai rata-rata keranjang di toko Anda.

Rekomendasi produk cerdas - penjualan silang

Salah satu cara meningkatkan penjualan di toko online adalah dengan rekomendasi produk terkait.

Sayangnya, implementasi paling umum dari rekomendasi tersebut adalah menampilkan produk dari kategori yang sama. Di bawah produk yang kami lihat, kami melihat produk lain dari jenis ini - misalnya penawaran alas kaki lainnya.

Produk terkait - rekomendasi produk

Namun, hubungan antara produk tidak dihasilkan dari kategori bersama di mana mereka ditambahkan di toko. Merekomendasikan sepatu lain ketika pelanggan telah memasukkan satu pasang ke dalam troli tidak masuk akal, apa pun. Dengan cara ini, kami membuat tebakan buta apakah ini berhasil. Mungkin pelanggan akan menambahkan sesuatu yang lain ke keranjang.

Inti dari rekomendasi produk adalah untuk memberikan produk kepada pelanggan sehingga mereka akan tertarik dengan jelas. Bagaimana kita tahu produk apa itu? Berkat statistik! Dengan bantuannya, kita dapat mengetahui bahwa mayoritas pelanggan membeli produk A, juga membeli B dan C. Dalam hal ini, kami merekomendasikan B dan C kepada pelanggan yang memasukkan A ke dalam troli. Rekomendasi produk semacam ini berfungsi paling baik di halaman keranjang.

Rekomendasi produk di Checkout - Amazon

Dengan cara ini, pelanggan yang melakukan pembelian mendapatkan informasi bahwa mereka dapat membeli barang lain. Kami melihat tren pembelian tertentu dan kami memfasilitasi penerapannya kepada pelanggan berikutnya.

Berkat antarmuka yang nyaman, pelanggan berikutnya akan menambahkan produk tambahan ke pesanan mereka. Nilai gerobak akan meningkat. Toko akan mendapatkan lebih banyak. Semua orang bahagia :)

Dalam kasus upselling tersebut, Anda dapat menerapkan diskon pada produk upsold. Dengan cara ini, kepuasan pelanggan terhadap pembelian akan meningkat.

Diskon di Halaman Produk

Singkatnya, algoritma Apriori

Apa analisis gerobak?

Pertanyaan - bagaimana cara mengambil data yang berguna dari pesanan produk untuk rekomendasi produk? Jawabannya adalah apa yang disebut analisis keranjang. Ini adalah metode penambangan data.

Algoritma yang efisien dan populer untuk analisis keranjang adalah algoritma Apriori. Algoritma ini mendefinisikan cara kita menambang data dan bagaimana kita mengevaluasi kegunaannya.

Tidak setiap korelasi produk di keranjang pelanggan akan digunakan untuk rekomendasi. Jika kasus terjadi 1 kali dalam 1000, maka tidak ada gunanya menerapkan rekomendasi seperti itu di tingkat toko. Ini bukan tren, tetapi kasus tunggal.

Contoh implementasi yang efektif

Online kita dapat menemukan informasi bahwa analisis gerobak digunakan oleh Wal-Mart pada tahun 1990-an. Ini adalah salah satu rantai hypermarket terbesar di Amerika Serikat. Berkat analisis gerobak, hubungan yang kuat antara bir dan popok ditemukan. Anda tidak akan menemukan sesuatu seperti ini sendiri, korelasi aneh seperti itu dihasilkan dari penambangan data.

Mari kita langsung ke intinya: bir dan popok bayi sering dibeli pada Jumat malam oleh pria muda. Berkat pengetahuan ini, analis telah memperkenalkan perubahan di toko. Pertama, mereka menempatkan produk ini lebih dekat. Kedua, mereka memodifikasi kegiatan pemasaran. Sebuah hypermarket besar menerapkan semua promosi dan diskon pada produk. Pada hari Jumat, diputuskan bahwa hanya satu dari dua produk yang akan didiskon. Dalam kebanyakan kasus keduanya akan dibeli bagaimanapun juga. Dengan cara ini, toko memperoleh penjualan tambahan dan menghemat kegiatan pemasaran.

Banyak prinsip dan metode yang digunakan dalam analisis toko tradisional juga dapat diterapkan dalam e-commerce. Beberapa di antaranya lebih mudah diterapkan. Toko online kami dapat dengan mudah dipantau - klik, lalu lintas, waktu yang dihabiskan di situs. Perlu juga menggunakan data produk di troli untuk meningkatkan sistem rekomendasi.

Contoh yang bagus di sini adalah Amazon. Lebih dari 20% pesanan dihasilkan dengan bantuan berbagai jenis sistem rekomendasi.

Konsep dasar

Algoritme Apriori tidak hanya menunjukkan hubungan antar produk, tetapi berkat desainnya memungkinkan Anda untuk menolak data yang tidak signifikan. Untuk tujuan ini, ia memperkenalkan dua konsep penting:

dukungan - frekuensi kejadian
keyakinan - kepastian aturan

Algoritme memungkinkan untuk menentukan nilai minimum untuk kedua indikator ini. Dengan demikian, kami menolak transaksi yang tidak memenuhi asumsi kualitas untuk rekomendasi.

Operasi algoritma ini adalah iteratif. Kami tidak memproses semua data sekaligus. Berkat ini, algoritme membatasi jumlah perhitungan pada database.

Saya akan menunjukkan kepada Anda pengoperasian algoritma dalam praktik. Saya akan menjelaskan penggunaan dukungan dan kepercayaan sebagai elemen kunci dari algoritma Apriori.

Prinsip operasi Algoritma Apriori

Asumsi awal misalnya

Mari kita gunakan contoh yang disederhanakan. Mari kita asumsikan bahwa kita memiliki empat produk di toko kita: A, B, C, D. Pelanggan telah melakukan 7 transaksi, yang terlihat seperti ini:

A, B, C, D
A, B
B, C, D
A, B, D
B, C
C, D
B, D

Kami akan menggunakan Apriori untuk menentukan hubungan antara produk. Sebagai dukungan , kami menetapkan nilai ke 3. Ini berarti bahwa aturan harus muncul 3 kali dalam iterasi yang diberikan.

Iterasi pertama

Mari kita mulai iterasi pertama. Kami menentukan seberapa sering produk muncul dalam pesanan:

A - 3 kali
B - 6 kali
C - 4 kali
D - 5 kali

Masing-masing produk ini muncul dalam pesanan lebih dari 3 kali. Semua produk memenuhi persyaratan dukungan. Kami akan menggunakan masing-masing dari mereka dalam iterasi berikutnya.

Iterasi kedua

Kami sekarang mencari koneksi dalam produk berdasarkan satu set dua produk. Kami mencari seberapa sering pelanggan mengumpulkan dua produk pilihan dalam satu pesanan.

A, B - 3 kali
A, C - 1 kali
A, D - 2 kali
B, C - 3 kali
B, D - 4 kali
C, D - 3 kali

Seperti yang Anda lihat, himpunan {A, C} dan {A, D} tidak memenuhi asumsi support . Mereka terjadi kurang dari tiga kali. Oleh karena itu, kami mengecualikan mereka dari iterasi berikutnya.

Iterasi ketiga

Kami mencari set yang terdiri dari tiga produk, yaitu:

terjadi pada pesanan pelanggan
tidak mengandung himpunan {A, C} dan {A, D} dalam dirinya sendiri

Oleh karena itu adalah himpunan: {B, C, D}. Itu terjadi dalam pesanan hanya dua kali, sehingga tidak memenuhi asumsi dukungan kami.

Hasil

Asumsi kami memenuhi set berikut:

A, B - terjadi tiga kali dalam pesanan
B, C - 3 kali juga
B, D - 4 kali

Contoh ini hanya dimaksudkan untuk menggambarkan operasi algoritma. Untuk sebagian besar toko online, perhitungan data akan jauh lebih rumit, karena jumlahnya akan lebih banyak.

Dukungan dinyatakan dalam persen

Perlu ditambahkan bahwa dukungan mendefinisikan pangsa global aturan dalam semua transaksi. Kami setuju untuk mendukung persyaratan minimum kami sebagai nilai numerik: 3. Namun, kami dapat menetapkan persentase. Pada kasus ini:

A, B memiliki dukungan yang setara dengan sekitar 42,9% - terjadi 3 kali untuk 7 transaksi
B, C memiliki dukungan yang sama
B, D memiliki dukungan yang setara dengan sekitar 57,14% - terjadi 4 kali untuk 7 transaksi

Persentase yang tinggi dari faktor pendukung dihasilkan dari sejumlah kecil produk dalam contoh kita. Kami hanya memiliki 4 produk: A, B, C, D.

Sangat tidak mungkin bahwa di toko dengan, misalnya, 1000 produk, selalu ada dua produk identik di setengah dari pesanan.

Contoh ini sengaja disederhanakan. Anda harus mempertimbangkannya saat menggunakan algoritme di toko Anda. Anda harus menetapkan nilai dukungan minimum satu per satu untuk toko, industri, dll.

Kesimpulan akhir

Pertanyaan tentang kepercayaan tetap ada. Ini menentukan terjadinya aturan yang diberikan untuk semua orang di mana set awal terjadi.

Bagaimana cara menghitungnya?

{A, B} - terjadi tiga kali dalam pesanan Set awal adalah A. Produk ini juga muncul dalam pesanan tiga kali. Oleh karena itu kepercayaan diri adalah 100%.

Mari kita cerminkan pasangan ini. {B, A} terjadi dalam pesanan 3 kali. Tidak ada yang berubah di sini - pasangannya sama. Namun, set awal berubah. Ini adalah B. Produk ini telah terjadi dalam 6 transaksi. Ini memberi kami kepercayaan diri pada level 50%. Produk A hanya terjadi pada setengah dari transaksi di mana produk B terjadi.

A dan B memiliki kepercayaan 100%
B dan A memiliki kepercayaan 50%
B dan C memiliki kepercayaan 50%
C dan B memiliki kepercayaan 75%
B dan D memiliki keyakinan 66,7%
D dan B memiliki kepercayaan 80%

Contoh sederhana kami (4 produk, 7 transaksi) melahirkan rekomendasi berikut:

A -> B
B -> D
C -> B
D -> B

di mana produk pertama adalah produk yang ditambahkan pengguna ke keranjang. Yang kedua adalah ini yang kami rekomendasikan.

Kesimpulan

Analisis keranjang adalah metode yang sangat efektif untuk sistem rekomendasi produk. Namun, saya tidak bisa membayangkan pemrosesan data manual sesuai dengan algoritma di atas. Apalagi dengan toko yang lebih besar.

Analisis keranjang yang efektif membutuhkan implementasi yang mudah. Algoritma Apriori harus bekerja berdasarkan prinsip program, bukan pemrosesan data manual.

Ada implementasi Algoritma Apriori dengan Python di jaringan.

Algoritma Apriori - implementacja dengan jezyku Python

Namun, seperti yang Anda lihat di tangkapan layar, itu membutuhkan keterampilan pemrograman untuk menggunakannya.

Apakah implementasi Algoritma Apriori yang mudah di WooCommerce menarik minat Anda? Beri tahu saya di bagian komentar di bawah.

Lihat juga Tips E-niaga kami →