Gunakan Algoritma Apriori untuk Rekomendasi Produk yang Lebih Baik
Diterbitkan: 2018-10-05Dalam artikel ini, Anda akan mempelajari metode rekomendasi produk yang efektif (yang disebut analisis keranjang). Dengan menggunakan algoritma khusus (algoritma Apriori), Anda akan mempelajari produk mana yang akan dijual dalam set. Anda akan mendapatkan informasi tentang produk mana yang akan direkomendasikan di situs web produk lain. Dengan cara ini, Anda akan meningkatkan nilai rata-rata keranjang di toko Anda.
Rekomendasi produk cerdas - penjualan silang
Salah satu cara meningkatkan penjualan di toko online adalah dengan rekomendasi produk terkait.
Sayangnya, implementasi paling umum dari rekomendasi tersebut adalah menampilkan produk dari kategori yang sama. Di bawah produk yang kami lihat, kami melihat produk lain dari jenis ini - misalnya penawaran alas kaki lainnya.
Namun, hubungan antara produk tidak dihasilkan dari kategori bersama di mana mereka ditambahkan di toko. Merekomendasikan sepatu lain ketika pelanggan telah memasukkan satu pasang ke dalam troli tidak masuk akal, apa pun. Dengan cara ini, kami membuat tebakan buta apakah ini berhasil. Mungkin pelanggan akan menambahkan sesuatu yang lain ke keranjang.
Inti dari rekomendasi produk adalah untuk memberikan produk kepada pelanggan sehingga mereka akan tertarik dengan jelas. Bagaimana kita tahu produk apa itu? Berkat statistik! Dengan bantuannya, kita dapat mengetahui bahwa mayoritas pelanggan membeli produk A, juga membeli B dan C. Dalam hal ini, kami merekomendasikan B dan C kepada pelanggan yang memasukkan A ke dalam troli. Rekomendasi produk semacam ini berfungsi paling baik di halaman keranjang.
Dengan cara ini, pelanggan yang melakukan pembelian mendapatkan informasi bahwa mereka dapat membeli barang lain. Kami melihat tren pembelian tertentu dan kami memfasilitasi penerapannya kepada pelanggan berikutnya.
Berkat antarmuka yang nyaman, pelanggan berikutnya akan menambahkan produk tambahan ke pesanan mereka. Nilai gerobak akan meningkat. Toko akan mendapatkan lebih banyak. Semua orang bahagia :)
Dalam kasus upselling tersebut, Anda dapat menerapkan diskon pada produk upsold. Dengan cara ini, kepuasan pelanggan terhadap pembelian akan meningkat.
Singkatnya, algoritma Apriori
Apa analisis gerobak?
Pertanyaan - bagaimana cara mengambil data yang berguna dari pesanan produk untuk rekomendasi produk? Jawabannya adalah apa yang disebut analisis keranjang. Ini adalah metode penambangan data.
Algoritma yang efisien dan populer untuk analisis keranjang adalah algoritma Apriori. Algoritma ini mendefinisikan cara kita menambang data dan bagaimana kita mengevaluasi kegunaannya.
Tidak setiap korelasi produk di keranjang pelanggan akan digunakan untuk rekomendasi. Jika kasus terjadi 1 kali dalam 1000, maka tidak ada gunanya menerapkan rekomendasi seperti itu di tingkat toko. Ini bukan tren, tetapi kasus tunggal.
Contoh implementasi yang efektif
Online kita dapat menemukan informasi bahwa analisis gerobak digunakan oleh Wal-Mart pada tahun 1990-an. Ini adalah salah satu rantai hypermarket terbesar di Amerika Serikat. Berkat analisis gerobak, hubungan yang kuat antara bir dan popok ditemukan. Anda tidak akan menemukan sesuatu seperti ini sendiri, korelasi aneh seperti itu dihasilkan dari penambangan data.
Mari kita langsung ke intinya: bir dan popok bayi sering dibeli pada Jumat malam oleh pria muda. Berkat pengetahuan ini, analis telah memperkenalkan perubahan di toko. Pertama, mereka menempatkan produk ini lebih dekat. Kedua, mereka memodifikasi kegiatan pemasaran. Sebuah hypermarket besar menerapkan semua promosi dan diskon pada produk. Pada hari Jumat, diputuskan bahwa hanya satu dari dua produk yang akan didiskon. Dalam kebanyakan kasus keduanya akan dibeli bagaimanapun juga. Dengan cara ini, toko memperoleh penjualan tambahan dan menghemat kegiatan pemasaran.
Banyak prinsip dan metode yang digunakan dalam analisis toko tradisional juga dapat diterapkan dalam e-commerce. Beberapa di antaranya lebih mudah diterapkan. Toko online kami dapat dengan mudah dipantau - klik, lalu lintas, waktu yang dihabiskan di situs. Perlu juga menggunakan data produk di troli untuk meningkatkan sistem rekomendasi.
Contoh yang bagus di sini adalah Amazon. Lebih dari 20% pesanan dihasilkan dengan bantuan berbagai jenis sistem rekomendasi.
Konsep dasar
Algoritme Apriori tidak hanya menunjukkan hubungan antar produk, tetapi berkat desainnya memungkinkan Anda untuk menolak data yang tidak signifikan. Untuk tujuan ini, ia memperkenalkan dua konsep penting:
- dukungan - frekuensi kejadian
- keyakinan - kepastian aturan
Algoritme memungkinkan untuk menentukan nilai minimum untuk kedua indikator ini. Dengan demikian, kami menolak transaksi yang tidak memenuhi asumsi kualitas untuk rekomendasi.
Operasi algoritma ini adalah iteratif. Kami tidak memproses semua data sekaligus. Berkat ini, algoritme membatasi jumlah perhitungan pada database.
Saya akan menunjukkan kepada Anda pengoperasian algoritma dalam praktik. Saya akan menjelaskan penggunaan dukungan dan kepercayaan sebagai elemen kunci dari algoritma Apriori.
Prinsip operasi Algoritma Apriori
Asumsi awal misalnya
Mari kita gunakan contoh yang disederhanakan. Mari kita asumsikan bahwa kita memiliki empat produk di toko kita: A, B, C, D. Pelanggan telah melakukan 7 transaksi, yang terlihat seperti ini:
- A, B, C, D
- A, B
- B, C, D
- A, B, D
- B, C
- C, D
- B, D
Kami akan menggunakan Apriori untuk menentukan hubungan antara produk. Sebagai dukungan , kami menetapkan nilai ke 3. Ini berarti bahwa aturan harus muncul 3 kali dalam iterasi yang diberikan.
Iterasi pertama
Mari kita mulai iterasi pertama. Kami menentukan seberapa sering produk muncul dalam pesanan:
- A - 3 kali
- B - 6 kali
- C - 4 kali
- D - 5 kali
Masing-masing produk ini muncul dalam pesanan lebih dari 3 kali. Semua produk memenuhi persyaratan dukungan. Kami akan menggunakan masing-masing dari mereka dalam iterasi berikutnya.
Iterasi kedua
Kami sekarang mencari koneksi dalam produk berdasarkan satu set dua produk. Kami mencari seberapa sering pelanggan mengumpulkan dua produk pilihan dalam satu pesanan.
- A, B - 3 kali
- A, C - 1 kali
- A, D - 2 kali
- B, C - 3 kali
- B, D - 4 kali
- C, D - 3 kali
Seperti yang Anda lihat, himpunan {A, C} dan {A, D} tidak memenuhi asumsi support . Mereka terjadi kurang dari tiga kali. Oleh karena itu, kami mengecualikan mereka dari iterasi berikutnya.
Iterasi ketiga
Kami mencari set yang terdiri dari tiga produk, yaitu:
- terjadi pada pesanan pelanggan
- tidak mengandung himpunan {A, C} dan {A, D} dalam dirinya sendiri
Oleh karena itu adalah himpunan: {B, C, D}. Itu terjadi dalam pesanan hanya dua kali, sehingga tidak memenuhi asumsi dukungan kami.
Hasil
Asumsi kami memenuhi set berikut:
- A, B - terjadi tiga kali dalam pesanan
- B, C - 3 kali juga
- B, D - 4 kali
Contoh ini hanya dimaksudkan untuk menggambarkan operasi algoritma. Untuk sebagian besar toko online, perhitungan data akan jauh lebih rumit, karena jumlahnya akan lebih banyak.
Dukungan dinyatakan dalam persen
Perlu ditambahkan bahwa dukungan mendefinisikan pangsa global aturan dalam semua transaksi. Kami setuju untuk mendukung persyaratan minimum kami sebagai nilai numerik: 3. Namun, kami dapat menetapkan persentase. Pada kasus ini:
- A, B memiliki dukungan yang setara dengan sekitar 42,9% - terjadi 3 kali untuk 7 transaksi
- B, C memiliki dukungan yang sama
- B, D memiliki dukungan yang setara dengan sekitar 57,14% - terjadi 4 kali untuk 7 transaksi
Persentase yang tinggi dari faktor pendukung dihasilkan dari sejumlah kecil produk dalam contoh kita. Kami hanya memiliki 4 produk: A, B, C, D.
Sangat tidak mungkin bahwa di toko dengan, misalnya, 1000 produk, selalu ada dua produk identik di setengah dari pesanan.
Contoh ini sengaja disederhanakan. Anda harus mempertimbangkannya saat menggunakan algoritme di toko Anda. Anda harus menetapkan nilai dukungan minimum satu per satu untuk toko, industri, dll.
Kesimpulan akhir
Pertanyaan tentang kepercayaan tetap ada. Ini menentukan terjadinya aturan yang diberikan untuk semua orang di mana set awal terjadi.
Bagaimana cara menghitungnya?
{A, B} - terjadi tiga kali dalam pesanan Set awal adalah A. Produk ini juga muncul dalam pesanan tiga kali. Oleh karena itu kepercayaan diri adalah 100%.
Mari kita cerminkan pasangan ini. {B, A} terjadi dalam pesanan 3 kali. Tidak ada yang berubah di sini - pasangannya sama. Namun, set awal berubah. Ini adalah B. Produk ini telah terjadi dalam 6 transaksi. Ini memberi kami kepercayaan diri pada level 50%. Produk A hanya terjadi pada setengah dari transaksi di mana produk B terjadi.
- A dan B memiliki kepercayaan 100%
- B dan A memiliki kepercayaan 50%
- B dan C memiliki kepercayaan 50%
- C dan B memiliki kepercayaan 75%
- B dan D memiliki keyakinan 66,7%
- D dan B memiliki kepercayaan 80%
Contoh sederhana kami (4 produk, 7 transaksi) melahirkan rekomendasi berikut:
- A -> B
- B -> D
- C -> B
- D -> B
di mana produk pertama adalah produk yang ditambahkan pengguna ke keranjang. Yang kedua adalah ini yang kami rekomendasikan.
Kesimpulan
Analisis keranjang adalah metode yang sangat efektif untuk sistem rekomendasi produk. Namun, saya tidak bisa membayangkan pemrosesan data manual sesuai dengan algoritma di atas. Apalagi dengan toko yang lebih besar.
Analisis keranjang yang efektif membutuhkan implementasi yang mudah. Algoritma Apriori harus bekerja berdasarkan prinsip program, bukan pemrosesan data manual.
Ada implementasi Algoritma Apriori dengan Python di jaringan.
Namun, seperti yang Anda lihat di tangkapan layar, itu membutuhkan keterampilan pemrograman untuk menggunakannya.
Lihat juga Tips E-niaga kami →