Используйте априорный алгоритм для лучших рекомендаций по продуктам
Опубликовано: 2018-10-05В этой статье вы познакомитесь с эффективным методом товарных рекомендаций (так называемый анализ корзины). С помощью специального алгоритма (алгоритма Априори) вы узнаете, какие товары продавать наборами. Вы получите информацию о том, какой продукт рекомендовать на веб-сайте другого продукта. Таким образом, вы увеличите среднюю стоимость корзины в вашем магазине.
Интеллектуальные рекомендации по продуктам — перекрестные продажи
Одним из методов увеличения продаж в интернет-магазине является рекомендация сопутствующих товаров.
К сожалению, наиболее распространенная реализация таких рекомендаций — это показ товаров из одной категории. Под продуктом, который мы просматриваем, мы видим другие продукты этого типа - например, другие предложения обуви.
Однако связь между продуктами не является результатом совместной категории, в которую они были добавлены в магазине. Рекомендовать другую обувь, когда клиент уже положил одну пару в корзину, не имеет никакого смысла. Таким образом, мы делаем слепые предположения, работает ли это. Возможно, клиент добавит что-то еще в корзину.
Суть товарных рекомендаций заключается в том, чтобы дать покупателям такой товар, который их явно заинтересует. Откуда мы знаем, что это за товары? Спасибо статистике! С его помощью мы можем узнать, что большинство покупателей, покупающих товар А, также покупают Б и В. В этом случае мы рекомендуем Б и В покупателю, который кладет А в корзину. Этот тип рекомендации продуктов лучше всего работает на странице корзины.
Таким образом, клиенты, совершающие покупку, получают информацию о том, что они могут купить другие товары. Мы улавливаем определенный покупательский тренд и облегчаем его реализацию последующим клиентам.
Благодаря удобному интерфейсу последующие покупатели будут добавлять в свой заказ дополнительные товары. Стоимость корзины увеличится. Магазин заработает больше. Все довольны :)
В случае такой допродажи вы можете применить скидку на проданный товар. Таким образом, удовлетворенность клиентов покупкой увеличится.
Коротко об априорном алгоритме
Что такое анализ корзины?
Вопрос - как взять полезные данные из товарных заказов для товарных рекомендаций? Ответ заключается в так называемом анализе корзины. Это метод интеллектуального анализа данных.
Эффективным и популярным алгоритмом анализа корзины является алгоритм Априори. Этот алгоритм определяет, как мы извлекаем данные и как мы оцениваем их полезность.
Не каждая корреляция товаров в корзине покупателя будет использоваться для рекомендаций. Если случай случился 1 раз из 1000, то реализовывать такую рекомендацию на уровне магазина нет смысла. Это не тенденция, а единичный случай.
Примеры эффективной реализации
В Интернете мы можем найти информацию о том, что анализ корзины использовался Wal-Mart в 1990-х годах. Это одна из крупнейших сетей гипермаркетов в США. Благодаря анализу корзины была обнаружена тесная взаимосвязь пива и подгузников. Вы бы сами ничего подобного не придумали, такие странные корреляции получаются в результате интеллектуального анализа данных.
Перейдем к делу: пиво и детские подгузники часто покупали в пятницу вечером молодые люди. Благодаря этим знаниям аналитики внесли изменения в магазин. Во-первых, они помещают эти продукты ближе друг к другу. Во-вторых, они изменили маркетинговую деятельность. В большом гипермаркете действуют все акции и скидки на товары. По пятницам было решено, что скидка будет только на один из двух товаров. В большинстве случаев оба они будут куплены так или иначе. Таким образом, магазин получил дополнительные продажи и сэкономил на маркетинговых мероприятиях.
Многие принципы и методы, используемые при анализе традиционных магазинов, также могут быть применены в электронной коммерции. Некоторые из них легче реализовать. Наши интернет-магазины легко отслеживать — клики, посещаемость, время, проведенное на сайте. Также стоит использовать данные о товарах в корзине для улучшения системы рекомендаций.
Хорошим примером здесь является Amazon. Более 20% заказов формируются с помощью различных типов рекомендательных систем.
Основные понятия
Алгоритм Apriori не только показывает отношения между продуктами, но и благодаря своей конструкции позволяет отбрасывать малозначительные данные. Для этого вводятся два важных понятия:
- поддержка - частота появления
- доверие - уверенность в правиле
Алгоритм позволяет определить минимальные значения этих двух показателей. Таким образом, мы отклоняем транзакции, которые не соответствуют предположениям о качестве для рекомендации.
Работа этого алгоритма является итеративной. Мы не обрабатываем все данные сразу. Благодаря этому алгоритм ограничивает количество вычислений в базе данных.
Я покажу вам работу алгоритма на практике. Я объясню использование поддержки и уверенности в качестве ключевых элементов априорного алгоритма.
Принцип работы априорного алгоритма
Например, исходные предположения
Воспользуемся упрощенным примером. Предположим, что у нас в магазине есть четыре товара: A, B, C, D. Покупатели совершили 7 транзакций, которые выглядят так:
- А, Б, В, Г
- А, Б
- Б, В, Г
- А, Б, Д
- ДО Н.Э
- CD
- Б, Д
Мы будем использовать Apriori для определения отношений между продуктами. В качестве поддержки устанавливаем значение 3. Это означает, что правило должно встречаться 3 раза в данной итерации.
Первая итерация
Начнем первую итерацию. Определяем, как часто товар появлялся в заказах:
- А - 3 раза
- Б - 6 раз
- С - 4 раза
- Д - 5 раз
Каждый из этих товаров появлялся в заказах более 3-х раз. Все продукты соответствуют требованиям поддержки. Мы будем использовать каждый из них в следующей итерации.
Вторая итерация
Теперь мы ищем связи в продуктах на основе набора из двух продуктов. Мы смотрим, как часто клиенты объединяют два выбранных продукта в одном заказе.
- А, Б - 3 раза
- А, С - 1 раз
- А, Д - 2 раза
- Б, В - 3 раза
- Б, Д - 4 раза
- В, Д - 3 раза
Как видите, множества {A, C} и {A, D} не удовлетворяют предположениям о поддержке . Они встречаются менее трех раз. Поэтому исключаем их из следующей итерации.
Третья итерация
Мы ищем наборы, состоящие из трех продуктов, которые:
- произошло в заказах клиентов
- не содержат наборов {A, C} и {A, D} сами по себе
Следовательно, это набор из: {B, C, D}. Он встречается в заказах только два раза, поэтому не соответствует нашим предположениям о поддержке .
Результат
Наши предположения удовлетворяют следующим множествам:
- А, Б - встречались трижды в ордерах
- В, С - также 3 раза
- Б, Д - 4 раза
Этот пример предназначен только для иллюстрации работы алгоритма. Для большинства интернет-магазинов расчеты по данным будут намного сложнее, так как их будет больше.
Поддержка выражена в процентах
Стоит добавить, что поддержка определяет глобальную долю правила во всех транзакциях. Мы согласились поддерживать наши минимальные требования в виде числового значения: 3. Однако мы могли бы установить процентное значение. В таком случае:
- A, B имеют поддержку равную примерно 42,9% - встречаются 3 раза на 7 транзакций
- B, C имеют одинаковую опору
- B, D имеют поддержку равную примерно 57,14% - встречаются 4 раза на 7 транзакций
В нашем примере высокий процент фактора поддержки является результатом небольшого количества продуктов. У нас всего 4 товара: A, B, C, D.
Очень маловероятно, чтобы в магазине с, например, 1000 товаров в половине заказов всегда было два одинаковых товара.
Этот пример намеренно упрощен. Это следует учитывать при использовании алгоритма в вашем магазине. Вы должны установить минимальное значение поддержки индивидуально для магазина, отрасли и т. д.
Окончательные выводы
Остается вопрос доверия . Он определяет вхождение данного правила во все те, где имело место исходное множество.
Как его рассчитать?
{A, B} - встречается в заказах трижды. Исходным набором является A. Этот товар также фигурировал в заказах трижды. Таким образом, уверенность составляет 100%.
Давайте зеркально отобразим эту пару. {B, A} встречается в заказах 3 раза. Здесь ничего не изменилось - пара та же. Однако первоначальный набор меняется. Это B. Этот продукт появился в 6 транзакциях. Это дает нам уверенность на уровне 50%. Продукт А встречается только в половине транзакций, в которых встречается продукт Б.
- A и B имеют 100% уверенность
- B и A имеют 50% достоверность
- B и C имеют 50% достоверность
- C и B имеют 75% уверенности
- B и D имеют достоверность 66,7%.
- D и B имеют 80% достоверность
Наш упрощенный пример (4 продукта, 7 транзакций) дает следующие рекомендации:
- А -> Б
- Б -> Г
- С -> Б
- Д -> Б
где первым товаром является тот, который пользователь добавляет в корзину. Второй — это то, что мы рекомендуем.
Вывод
Анализ корзины — очень эффективный метод для системы рекомендаций по продуктам. Однако я не могу себе представить ручную обработку данных по вышеописанному алгоритму. Особенно в крупных магазинах.
Эффективный анализ корзины требует удобной реализации. Алгоритм Априори должен работать по принципу программы, а не ручной обработки данных.
В сети есть реализация Алгоритма Априори на Python.
Однако, как вы можете видеть на скриншоте, для его использования требуются навыки программирования.
Также ознакомьтесь с нашими советами по электронной торговле →