ใช้อัลกอริทึม Apriori เพื่อการแนะนำผลิตภัณฑ์ที่ดีขึ้น
เผยแพร่แล้ว: 2018-10-05ในบทความนี้ คุณจะได้เรียนรู้วิธีแนะนำผลิตภัณฑ์ที่มีประสิทธิภาพ (การวิเคราะห์ตะกร้าสินค้าที่เรียกว่า) โดยใช้อัลกอริธึมพิเศษ (อัลกอริธึม Aprori) คุณจะได้เรียนรู้ว่าผลิตภัณฑ์ใดที่จะขายเป็นชุด คุณจะได้รับข้อมูลเกี่ยวกับผลิตภัณฑ์ที่จะแนะนำบนเว็บไซต์ของผลิตภัณฑ์อื่น ด้วยวิธีนี้ คุณจะเพิ่มมูลค่ารถเข็นโดยเฉลี่ยในร้านค้าของคุณ
คำแนะนำผลิตภัณฑ์อัจฉริยะ - การขายต่อเนื่อง
วิธีหนึ่งในการเพิ่มยอดขายในร้านค้าออนไลน์คือการแนะนำผลิตภัณฑ์ที่เกี่ยวข้อง
น่าเสียดาย การนำคำแนะนำดังกล่าวไปใช้บ่อยที่สุดคือการแสดงผลิตภัณฑ์จากหมวดหมู่เดียวกัน ใต้ผลิตภัณฑ์ที่เรากำลังดูอยู่ เราเห็นผลิตภัณฑ์ประเภทนี้อื่นๆ เช่น ข้อเสนอรองเท้าอื่นๆ
อย่างไรก็ตาม ความสัมพันธ์ระหว่างผลิตภัณฑ์ไม่ได้เกิดจากหมวดหมู่ร่วมที่เพิ่มลงในร้านค้า การแนะนำรองเท้าอื่น ๆ เมื่อลูกค้าใส่คู่หนึ่งลงในรถเข็นแล้วไม่มีความรู้สึกใด ๆ ด้วยวิธีนี้ เราจึงเดาได้ว่าวิธีนี้ได้ผลหรือไม่ บางทีลูกค้าจะเพิ่มอย่างอื่นในรถเข็น
สาระสำคัญของการแนะนำผลิตภัณฑ์คือการให้ลูกค้ามีผลิตภัณฑ์ดังกล่าวที่พวกเขาจะสนใจอย่างชัดเจน เราจะทราบได้อย่างไรว่าผลิตภัณฑ์เหล่านี้คืออะไร ขอบคุณสถิติ! ด้วยความช่วยเหลือ เราจะพบว่าลูกค้าส่วนใหญ่ที่ซื้อผลิตภัณฑ์ A ซื้อ B และ C ด้วย ในกรณีนี้ เราแนะนำ B และ C ให้กับลูกค้าที่ใส่ A ลงในรถเข็น คำแนะนำผลิตภัณฑ์ประเภทนี้ทำงานได้ดีที่สุดที่หน้าตะกร้าสินค้า
ด้วยวิธีนี้ ลูกค้าที่ทำการซื้อจะได้รับข้อมูลที่สามารถซื้อสินค้าอื่นๆ ได้ เรารับรู้ถึงแนวโน้มการซื้อบางอย่างและเราอำนวยความสะดวกในการใช้งานให้กับลูกค้ารายต่อไป
ด้วยอินเทอร์เฟซที่สะดวก ลูกค้ารายต่อไปจะเพิ่มผลิตภัณฑ์เพิ่มเติมในคำสั่งซื้อของตน มูลค่าของรถเข็นจะเพิ่มขึ้น ร้านค้าจะได้รับมากขึ้น มีความสุขกันทุกคน :)
ในกรณีของการขายต่อยอดดังกล่าว คุณสามารถใช้ส่วนลดสำหรับสินค้าที่เพิ่มขึ้นได้ วิธีนี้จะทำให้ความพึงพอใจของลูกค้าในการซื้อเพิ่มขึ้น
อัลกอริทึม Apriori โดยสังเขป
การวิเคราะห์รถเข็นคืออะไร?
คำถาม - จะนำข้อมูลที่เป็นประโยชน์จากการสั่งสินค้ามาแนะนำสินค้าได้อย่างไร? คำตอบคือสิ่งที่เรียกว่าการวิเคราะห์รถเข็น เป็นวิธีการขุดข้อมูล
อัลกอริทึมที่มีประสิทธิภาพและเป็นที่นิยมสำหรับการวิเคราะห์รถเข็นคืออัลกอริทึม Apriori อัลกอริทึมนี้กำหนดวิธีที่เราขุดข้อมูลและวิธีที่เราประเมินประโยชน์ของข้อมูล
ไม่ใช่ทุกความสัมพันธ์ของผลิตภัณฑ์ในรถเข็นของลูกค้าที่จะถูกนำมาใช้เป็นคำแนะนำ หากมีกรณีเกิดขึ้น 1 ครั้งใน 1,000 ครั้ง ก็ไม่มีประโยชน์ที่จะใช้คำแนะนำดังกล่าวในระดับร้านค้า นี่ไม่ใช่เทรนด์ แต่เป็นกรณีเดียว
ตัวอย่างการใช้งานที่มีประสิทธิภาพ
ทางออนไลน์ เราสามารถหาข้อมูลที่การวิเคราะห์รถเข็นถูกใช้โดย Wal-Mart ในปี 1990 เป็นเครือข่ายไฮเปอร์มาร์เก็ตที่ใหญ่ที่สุดแห่งหนึ่งในสหรัฐอเมริกา ด้วยการวิเคราะห์รถเข็นทำให้ค้นพบความสัมพันธ์ที่แน่นแฟ้นของเบียร์และผ้าอ้อม คุณจะไม่คิดแบบนี้ด้วยตัวเอง ความสัมพันธ์ที่แปลกประหลาดดังกล่าวเป็นผลมาจากการขุดข้อมูล
เรามาเข้าเรื่องกันดีกว่า: ชายหนุ่มมักซื้อเบียร์และผ้าอ้อมเด็กในคืนวันศุกร์ ด้วยความรู้นี้ นักวิเคราะห์ได้แนะนำการเปลี่ยนแปลงในร้านค้า ประการแรก พวกเขานำผลิตภัณฑ์เหล่านี้มาใกล้กันมากขึ้น ประการที่สอง พวกเขาปรับเปลี่ยนกิจกรรมทางการตลาด ไฮเปอร์มาร์เก็ตขนาดใหญ่ใช้โปรโมชั่นและส่วนลดทั้งหมดสำหรับผลิตภัณฑ์ ในวันศุกร์ มีการตัดสินใจว่าจะลดราคาเพียงหนึ่งในสองผลิตภัณฑ์เท่านั้น โดยส่วนใหญ่แล้วจะซื้อทั้งสองอย่างเลย วิธีนี้ทำให้ร้านค้ามียอดขายเพิ่มขึ้นและประหยัดจากกิจกรรมทางการตลาด
หลักการและวิธีการหลายอย่างที่ใช้ในการวิเคราะห์ร้านค้าแบบดั้งเดิมสามารถนำไปใช้ในอีคอมเมิร์ซได้เช่นกัน บางส่วนง่ายต่อการนำไปใช้ ร้านค้าออนไลน์ของเราสามารถตรวจสอบได้ง่าย - การคลิก ปริมาณการใช้ เวลาที่ใช้บนไซต์ นอกจากนี้ยังควรใช้ข้อมูลผลิตภัณฑ์ในรถเข็นเพื่อปรับปรุงระบบการแนะนำ
ตัวอย่างที่ดีที่นี่คืออเมซอน คำสั่งซื้อมากกว่า 20% สร้างขึ้นโดยใช้ระบบแนะนำประเภทต่างๆ
แนวคิดพื้นฐาน
อัลกอริธึม Apriori ไม่เพียงแสดงความสัมพันธ์ระหว่างผลิตภัณฑ์เท่านั้น แต่ด้วยการออกแบบที่ช่วยให้คุณปฏิเสธข้อมูลที่ไม่มีนัยสำคัญได้ เพื่อจุดประสงค์นี้จะแนะนำแนวคิดที่สำคัญสองประการ:
- สนับสนุน - ความถี่ของการเกิด
- ความมั่นใจ - ความแน่นอนของกฎ
อัลกอริทึมทำให้สามารถกำหนดค่าต่ำสุดสำหรับตัวบ่งชี้ทั้งสองนี้ได้ ดังนั้นเราจึงปฏิเสธธุรกรรมที่ไม่เป็นไปตามสมมติฐานด้านคุณภาพสำหรับคำแนะนำ
การทำงานของอัลกอริทึมนี้เป็นแบบวนซ้ำ เราไม่ได้ประมวลผลข้อมูลทั้งหมดพร้อมกัน ด้วยเหตุนี้อัลกอริทึมจึงจำกัดจำนวนการคำนวณในฐานข้อมูล
ฉันจะแสดงให้คุณเห็นการทำงานของอัลกอริทึมในทางปฏิบัติ ฉันจะอธิบายการใช้ การสนับสนุน และ ความมั่นใจ เป็นองค์ประกอบหลักของอัลกอริทึม Apriori
หลักการทำงานของอัลกอริทึม Apriori
สมมติฐานเบื้องต้นเช่น
ให้เราใช้ตัวอย่างแบบง่าย สมมติว่าเรามีผลิตภัณฑ์สี่รายการในร้านของเรา: A, B, C, D ลูกค้าทำธุรกรรม 7 รายการซึ่งมีลักษณะดังนี้:
- เอบีซีดี
- A, B
- B, C, D
- A, B, D
- B, C
- ซีดี
- B, D
เราจะใช้ Apriori เพื่อกำหนดความสัมพันธ์ระหว่างผลิตภัณฑ์ ในฐานะที่เป็น support เราตั้งค่าเป็น 3 ซึ่งหมายความว่ากฎจะต้องเกิดขึ้น 3 ครั้งในการทำซ้ำที่กำหนด
การทำซ้ำครั้งแรก
เรามาเริ่มการทำซ้ำครั้งแรก เรากำหนดความถี่ที่ผลิตภัณฑ์ปรากฏในคำสั่งซื้อ:
- A - 3 ครั้ง
- ข - 6 ครั้ง
- C - 4 ครั้ง
- D - 5 ครั้ง
แต่ละผลิตภัณฑ์เหล่านี้ปรากฏในคำสั่งซื้อมากกว่า 3 ครั้ง ผลิตภัณฑ์ทั้งหมดเป็นไปตามข้อกำหนดการสนับสนุน เราจะใช้แต่ละรายการในการทำซ้ำครั้งต่อไป
การทำซ้ำครั้งที่สอง
ตอนนี้เรามองหาการเชื่อมต่อในผลิตภัณฑ์ตามชุดผลิตภัณฑ์สองรายการ เรามองหาความถี่ที่ลูกค้ารวบรวมผลิตภัณฑ์ที่เลือกไว้สองรายการในคำสั่งซื้อเดียว
- A, B - 3 ครั้ง
- A, C - 1 ครั้ง
- A, D - 2 ครั้ง
- B, C - 3 ครั้ง
- B, D - 4 ครั้ง
- C, D - 3 ครั้ง
อย่างที่คุณเห็น ชุด {A, C} และ {A, D} ไม่เป็นไปตามสมมติฐานของ การสนับสนุน เกิดขึ้นน้อยกว่าสามครั้ง ดังนั้นเราจึงแยกพวกเขาออกจากการทำซ้ำครั้งต่อไป
การทำซ้ำครั้งที่สาม
เรามองหาชุดที่ประกอบด้วยสามผลิตภัณฑ์ซึ่ง:
- เกิดขึ้นในคำสั่งซื้อของลูกค้า
- ไม่มีเซต {A, C} และ {A, D} ในตัวเอง
จึงเป็นเซตของ: {B, C, D} มันเกิดขึ้นในคำสั่งซื้อเพียงสองครั้ง ดังนั้นจึงไม่เป็นไปตามสมมติฐาน การสนับสนุน ของเรา
ผลลัพธ์
สมมติฐานของเราเป็นไปตามชุดต่อไปนี้:
- A, B - เกิดขึ้นสามครั้งในคำสั่ง
- B, C - 3 ครั้งเช่นกัน
- B, D - 4 ครั้ง
ตัวอย่างนี้มีขึ้นเพื่อแสดงการทำงานของอัลกอริทึมเท่านั้น สำหรับร้านค้าออนไลน์ส่วนใหญ่ การคำนวณข้อมูลจะซับซ้อนกว่ามาก เนื่องจากจะมีมากกว่านั้น
การสนับสนุนแสดงเป็นเปอร์เซ็นต์
เป็นมูลค่าเพิ่มที่ ฝ่ายสนับสนุน กำหนดส่วนแบ่งทั่วโลกของกฎในธุรกรรมทั้งหมด เราตกลงที่จะ สนับสนุน ข้อกำหนดขั้นต่ำของเราเป็นค่าตัวเลข: 3. อย่างไรก็ตาม เราสามารถกำหนดเปอร์เซ็นต์ได้ ในกรณีนี้:
- A, B ได้รับการสนับสนุนเท่ากับประมาณ 42.9% - เกิดขึ้น 3 ครั้งสำหรับ 7 ธุรกรรม
- B, C มีแนวรับเหมือนกัน
- B, D มีการสนับสนุนประมาณ 57.14% - เกิดขึ้น 4 ครั้งสำหรับ 7 ธุรกรรม
เปอร์เซ็นต์ที่สูงของปัจจัย สนับสนุน เป็นผลมาจากผลิตภัณฑ์จำนวนน้อยในตัวอย่างของเรา เรามีสินค้าเพียง 4 ชิ้นเท่านั้น: A, B, C, D.
ไม่น่าเป็นไปได้มากที่ในร้านค้าที่มีสินค้า เช่น 1,000 รายการ จะมีสินค้าที่เหมือนกันสองรายการเสมอในครึ่งหนึ่งของคำสั่งซื้อ
ตัวอย่างนี้ทำให้ง่ายขึ้นโดยจงใจ คุณควรคำนึงถึงเมื่อใช้อัลกอริทึมในร้านค้าของคุณ คุณควรตั้งค่าขั้นต่ำของการสนับสนุนแต่ละรายการสำหรับร้านค้า อุตสาหกรรม ฯลฯ
บทสรุปสุดท้าย
คำถามเกี่ยวกับ ความมั่นใจ ยังคงอยู่ ระบุการเกิดขึ้นของกฎที่กำหนดให้กับผู้ที่ชุดเริ่มต้นเกิดขึ้นทั้งหมด
วิธีการคำนวณ?
{A, B} - เกิดขึ้นสามครั้งในการสั่งซื้อ ชุดเริ่มต้นคือ A. สินค้านี้มีการสั่งซื้อสามครั้งเช่นกัน ความมั่นใจจึงเต็ม 100%
ให้เราสะท้อนภาพคู่นี้ {B, A} เกิดขึ้นในคำสั่งซื้อ 3 ครั้ง ไม่มีอะไรเปลี่ยนแปลงที่นี่ - ทั้งคู่ก็เหมือนเดิม อย่างไรก็ตาม ชุดเริ่มต้นจะเปลี่ยนไป นี่คือ B. ผลิตภัณฑ์นี้เกิดขึ้นใน 6 ธุรกรรม ทำให้เรามั่นใจได้ถึงระดับ 50% ผลิตภัณฑ์ A เกิดขึ้นเพียงครึ่งหนึ่งของธุรกรรมที่เกิดผลิตภัณฑ์ B
- A และ B มีความมั่นใจ 100%
- B และ A มีความมั่นใจ 50%
- B และ C มีความมั่นใจ 50%
- C และ B มีความมั่นใจ 75%
- B และ D มีความมั่นใจ 66.7%
- D และ B มีความมั่นใจ 80%
ตัวอย่างที่เข้าใจง่ายของเรา (4 ผลิตภัณฑ์ 7 รายการ) ให้กำเนิดคำแนะนำต่อไปนี้:
- A -> B
- ข -> ด
- C -> B
- D -> B
โดยที่สินค้าชิ้นแรกเป็นสินค้าที่ผู้ใช้เพิ่มลงในรถเข็น อันที่ 2 คือตัวนี้ที่เราแนะนำ
บทสรุป
การวิเคราะห์รถเข็นเป็นวิธีที่มีประสิทธิภาพมากสำหรับระบบแนะนำผลิตภัณฑ์ อย่างไรก็ตาม ฉันไม่สามารถจินตนาการถึงการประมวลผลข้อมูลด้วยตนเองตามอัลกอริธึมข้างต้น โดยเฉพาะกับร้านค้าขนาดใหญ่
การวิเคราะห์รถเข็นที่มีประสิทธิภาพจำเป็นต้องมีการใช้งานที่สะดวก อัลกอริทึม Apriori ควรทำงานบนหลักการของโปรแกรม ไม่ใช่การประมวลผลข้อมูลด้วยตนเอง
มีการนำ Apriori Algorithm ไปใช้งานใน Python บนเครือข่าย
อย่างไรก็ตาม ดังที่คุณเห็นในภาพหน้าจอ มันต้องใช้ทักษะการเขียนโปรแกรมเพื่อใช้งาน
ตรวจสอบเคล็ดลับอีคอมเมิร์ซของเรา →