استخدم خوارزمية Apriori للحصول على توصيات أفضل للمنتج
نشرت: 2018-10-05في هذه المقالة ، ستتعرف على طريقة توصيات المنتج الفعالة (ما يسمى بتحليل عربة التسوق). باستخدام خوارزمية خاصة (خوارزمية Apriori) ، ستتعرف على المنتجات المراد بيعها في مجموعات. ستحصل على معلومات حول المنتج الذي ستوصي به على موقع الويب الخاص بمنتج آخر. بهذه الطريقة ، ستزيد من متوسط قيمة سلة التسوق في متجرك.
توصيات المنتجات الذكية - البيع العابر
إحدى طرق زيادة المبيعات في المتجر عبر الإنترنت هي التوصية بالمنتجات ذات الصلة.
لسوء الحظ ، فإن التنفيذ الأكثر شيوعًا لمثل هذه التوصيات هو عرض منتجات من نفس الفئة. تحت المنتج الذي نعرضه ، نرى منتجات أخرى من هذا النوع - مثل عروض الأحذية الأخرى.
ومع ذلك ، فإن العلاقة بين المنتجات لا تنتج عن الفئة المشتركة التي تمت إضافتها في المتجر. إن التوصية بأحذية أخرى عندما يكون العميل قد وضع بالفعل زوجًا واحدًا في العربة لا معنى له على الإطلاق. بهذه الطريقة ، نقوم بتخمينات عمياء ما إذا كان هذا يعمل. ربما يضيف العميل شيئًا آخر إلى عربة التسوق.
جوهر توصيات المنتج هو إعطاء العملاء مثل هذا المنتج الذي سيكونون مهتمين به بوضوح. كيف نعرف ما هي هذه المنتجات؟ بفضل الإحصائيات! بمساعدتها ، يمكننا معرفة أن غالبية العملاء يشترون المنتج A ، ويشترون أيضًا B و C. في هذه الحالة ، نوصي B و C للعميل الذي يضع A في عربة التسوق. يعمل هذا النوع من المنتجات الموصى بها بشكل أفضل في صفحة عربة التسوق.
بهذه الطريقة ، يحصل العملاء الذين يجرون عملية الشراء على معلومات أنه يمكنهم شراء عناصر أخرى. نحن ندرك اتجاه شراء معين ونعمل على تسهيل تنفيذه للعملاء اللاحقين.
بفضل الواجهة المريحة ، سيضيف العملاء اللاحقون منتجات إضافية إلى طلباتهم. ستزيد قيمة العربة. سيكسب المتجر المزيد. الجميع سعداء :)
في حالة حدوث مثل هذا البيع ، يمكنك تطبيق خصم على المنتج المبيع. بهذه الطريقة ، سيزداد رضا العملاء عن الشراء.
خوارزمية Apriori باختصار
ما هو تحليل العربة؟
سؤال - كيف تأخذ بيانات مفيدة من طلبات المنتجات لتوصيات المنتج؟ الجواب هو ما يسمى تحليل العربة. إنها طريقة لاستخراج البيانات.
خوارزمية Apriori هي خوارزمية فعالة وشائعة لتحليل العربة. تحدد هذه الخوارزمية الطريقة التي نستخرج بها البيانات وكيف نقيم فائدتها.
لن يتم استخدام كل ارتباط للمنتجات في عربة العميل للتوصيات. إذا حدثت حالة مرة واحدة في 1000 ، فلا فائدة من تنفيذ مثل هذه التوصية على مستوى المتجر. هذا ليس اتجاهًا ، ولكنه حالة فردية.
أمثلة على التنفيذ الفعال
على الإنترنت ، يمكننا العثور على معلومات تفيد باستخدام تحليل العربة بواسطة Wal-Mart في التسعينيات. إنها واحدة من أكبر سلاسل الهايبر ماركت في الولايات المتحدة. بفضل تحليل العربة ، تم اكتشاف علاقة قوية بين البيرة وحفاضات الأطفال. لن تتوصل إلى شيء مثل هذا بمفردك ، فهذه الارتباطات الغريبة ناتجة عن التنقيب في البيانات.
دعونا نصل إلى هذه النقطة: غالبًا ما كان الشباب يشترون البيرة وحفاضات الأطفال في ليالي الجمعة. بفضل هذه المعرفة ، أدخل المحللون تغييرات في المتجر. أولاً ، وضعوا هذه المنتجات بالقرب من بعضها البعض. ثانيًا ، قاموا بتعديل أنشطة التسويق. يطبق هايبر ماركت كبير جميع العروض الترويجية والخصومات على المنتجات. في أيام الجمعة ، تقرر خصم واحد فقط من المنتجين. في معظم الحالات ، سيتم شراء كلاهما على أي حال. بهذه الطريقة ، اكتسب المتجر مبيعات إضافية وحفظًا في أنشطة التسويق.
يمكن أيضًا تطبيق العديد من المبادئ والأساليب المستخدمة في تحليل المتاجر التقليدية في التجارة الإلكترونية. بعضها أسهل في التنفيذ. يمكن مراقبة متاجرنا عبر الإنترنت بسهولة - النقرات وحركة المرور والوقت الذي نقضيه على الموقع. من المفيد أيضًا استخدام البيانات الموجودة على المنتجات في سلة التسوق لتحسين نظام التوصية.
وخير مثال هنا هو أمازون. يتم إنشاء أكثر من 20٪ من الطلبات بمساعدة أنواع مختلفة من أنظمة التوصية.
مفاهيم أساسية
لا تعرض خوارزمية Apriori فقط العلاقات بين المنتجات ، ولكن بفضل تصميمها تسمح لك برفض البيانات غير المهمة. لهذا الغرض ، فإنه يقدم مفهومين مهمين:
- الدعم - تكرار الحدوث
- الثقة - يقين القاعدة
تتيح الخوارزمية تحديد القيم الدنيا لهذين المؤشرين. وبالتالي ، فإننا نرفض المعاملات التي لا تفي بافتراضات الجودة للتوصية.
تشغيل هذه الخوارزمية تكراري. لا نقوم بمعالجة جميع البيانات دفعة واحدة. بفضل هذا ، تحد الخوارزمية من عدد العمليات الحسابية في قاعدة البيانات.
سأوضح لك تشغيل الخوارزمية في الممارسة العملية. سأشرح استخدام الدعم والثقة كعناصر أساسية لخوارزمية Apriori.
مبدأ تشغيل خوارزمية Apriori
الافتراضات الأولية على سبيل المثال
دعونا نستخدم مثالا مبسطا. لنفترض أن لدينا أربعة منتجات في متجرنا: أ ، ب ، ج ، د. أجرى العملاء 7 معاملات ، والتي تبدو كالتالي:
- ا ب ت ث
- أ ، ب
- ب ، ج ، د
- أ ، ب ، د
- ب ، ج
- ج ، د
- ب ، د
سوف نستخدم Apriori لتحديد العلاقات بين المنتجات. كدعم ، قمنا بتعيين القيمة على 3. وهذا يعني أن القاعدة يجب أن تحدث 3 مرات في التكرار المحدد.
التكرار الأول
دعونا نبدأ التكرار الأول. نحدد عدد مرات ظهور المنتج في الطلبات:
- أ - 3 مرات
- ب - 6 مرات
- ج - 4 مرات
- د - 5 مرات
ظهر كل من هذه المنتجات في الطلبات أكثر من 3 مرات. جميع المنتجات تلبي متطلبات الدعم. سوف نستخدم كل منهم في التكرار التالي.
التكرار الثاني
نحن نبحث الآن عن اتصالات في المنتجات بناءً على مجموعة من منتجين. نحن نبحث عن عدد المرات التي قام فيها العملاء بتجميع منتجين محددين في طلب واحد.
- أ ، ب - 3 مرات
- أ ، ج - مرة واحدة
- أ ، د - مرتين
- ب ، ج - 3 مرات
- ب ، د - 4 مرات
- ج ، د - 3 مرات
كما ترى ، لا تتوافق المجموعات {A و C} و {A و D} مع افتراضات الدعم . تحدث أقل من ثلاث مرات. لذلك ، فإننا نستبعدهم من التكرار التالي.
التكرار الثالث
نبحث عن مجموعات تتكون من ثلاثة منتجات وهي:
- حدثت في طلبات العملاء
- لا تحتوي على مجموعات {A، C} و {A، D} في حد ذاتها
لذلك فهي مجموعة من: {B، C، D}. يحدث في أوامر مرتين فقط ، لذا فهو لا يلبي افتراضات الدعم الخاصة بنا.
نتيجة
تلبي افتراضاتنا المجموعات التالية:
- أ ، ب - حدثت ثلاث مرات في الأوامر
- ب ، ج - 3 مرات أيضًا
- ب ، د - 4 مرات
كان هذا المثال يهدف فقط إلى توضيح عملية الخوارزمية. بالنسبة لمعظم المتاجر عبر الإنترنت ، ستكون العمليات الحسابية على البيانات أكثر تعقيدًا ، حيث سيكون هناك المزيد منها.
وأعرب عن التأييد في المئة
يجدر إضافة أن الدعم يحدد الحصة العالمية للقاعدة في جميع المعاملات. اتفقنا على دعم الحد الأدنى من متطلباتنا كقيمة عددية: 3. ومع ذلك ، يمكننا تحديد نسبة مئوية. في هذه الحالة:
- تتمتع A ، B بدعم يساوي 42.9٪ تقريبًا - تحدث 3 مرات لـ 7 معاملات
- ب ، ج لهما نفس الدعم
- B ، D لديهما دعم يساوي حوالي 57.14٪ - تحدث 4 مرات لـ 7 معاملات
تنتج النسب المئوية العالية لعامل الدعم عن عدد صغير من المنتجات في مثالنا. لدينا 4 منتجات فقط: أ ، ب ، ج ، د.
من غير المحتمل جدًا أنه في متجر به ، على سبيل المثال ، 1000 منتج ، كان هناك دائمًا منتجان متطابقان في نصف الطلبات.
تم تبسيط هذا المثال عمدا. يجب أن تأخذها في الاعتبار عند استخدام الخوارزمية في متجرك. يجب عليك تعيين الحد الأدنى لقيمة الدعم بشكل فردي للمخزن والصناعة وما إلى ذلك.
الاستنتاجات النهائية
يبقى سؤال الثقة . وهي تحدد حدوث قاعدة معينة لجميع أولئك الذين حدثت فيها المجموعة الأولية.
كيف تحسبها؟
{A، B} - حدثت ثلاث مرات في الطلبات المجموعة الأولية هي A. ظهر هذا المنتج أيضًا في الطلبات ثلاث مرات. وبالتالي فإن الثقة 100٪.
دعونا نعكس صورة هذا الزوج. حدث {B، A} في الطلبات 3 مرات. لم يتغير شيء هنا - الزوج هو نفسه. ومع ذلك ، فإن المجموعة الأولية تتغير. هذا هو B. حدث هذا المنتج في 6 معاملات. وهذا يعطينا ثقة عند مستوى 50٪. حدث المنتج "أ" فقط في نصف المعاملات التي حدث فيها المنتج "ب".
- يتمتع "أ" و "ب" بثقة 100٪
- يتمتع كل من "ب" و "أ" بثقة بنسبة 50٪
- يتمتع كل من "ب" و "ج" بثقة بنسبة 50٪
- يتمتع كل من C و B بثقة 75٪
- يتمتع كل من B و D بثقة 66.7٪
- يتمتع D و B بثقة 80٪
يعطي مثالنا المبسط (4 منتجات ، 7 معاملات) التوصيات التالية:
- أ -> ب
- ب -> د
- ج -> ب
- د -> ب
حيث يكون المنتج الأول هو المنتج الذي يضيفه المستخدم إلى سلة التسوق. والثاني هو هذا الذي نوصي به.
استنتاج
يعد تحليل سلة التسوق طريقة فعالة جدًا لنظام توصية المنتج. ومع ذلك ، لا يمكنني تخيل المعالجة اليدوية للبيانات وفقًا للخوارزمية المذكورة أعلاه. خاصة مع المتاجر الكبيرة.
يتطلب تحليل عربة التسوق الفعال تنفيذًا مناسبًا. يجب أن تعمل خوارزمية Apriori على مبدأ البرنامج ، وليس المعالجة اليدوية للبيانات.
هناك تطبيق لخوارزمية Apriori في Python على الشبكة.
ومع ذلك ، كما ترى في لقطة الشاشة ، فإنها تتطلب مهارات برمجية لاستخدامها.
تحقق أيضًا من نصائح التجارة الإلكترونية →