Use o algoritmo a priori para melhores recomendações de produtos
Publicados: 2018-10-05Neste artigo, você aprenderá o método eficaz de recomendações de produtos (a chamada análise de carrinho). Usando um algoritmo especial (algoritmo Apriori), você aprenderá quais produtos vender em conjuntos. Você obterá informações sobre qual produto recomendar no site de outro produto. Dessa forma, você aumentará o valor médio do carrinho em sua loja.
Recomendações inteligentes de produtos - venda cruzada
Um dos métodos para aumentar as vendas na loja online é a recomendação de produtos relacionados.
Infelizmente, a implementação mais comum de tais recomendações é exibir produtos da mesma categoria. Sob o produto que estamos visualizando, vemos outros produtos desse tipo - por exemplo, outras ofertas de calçados.
No entanto, a relação entre os produtos não resulta da categoria conjunta em que foram adicionados na loja. Recomendar outros sapatos quando o cliente já colocou um par no carrinho não tem sentido algum. Dessa forma, fazemos suposições cegas se isso funciona. Talvez o cliente adicione algo mais ao carrinho.
A essência das recomendações de produtos é oferecer aos clientes um produto pelo qual eles estejam claramente interessados. Como sabemos o que são esses produtos? Graças às estatísticas! Com sua ajuda, podemos descobrir que a maioria dos clientes que compram o produto A, também compram B e C. Nesse caso, recomendamos B e C ao cliente que coloca A no carrinho. Esse tipo de recomendação de produtos funciona melhor na página do carrinho.
Dessa forma, o cliente que realiza a compra recebe a informação de que pode comprar outros itens. Percebemos uma certa tendência de compra e facilitamos sua implementação para os clientes subsequentes.
Graças a uma interface conveniente, os clientes subsequentes adicionarão produtos adicionais ao seu pedido. O valor do carrinho aumentará. A loja vai ganhar mais. Todos estão felizes :)
No caso de tal upselling, você pode aplicar um desconto no produto vendido. Dessa forma, a satisfação do cliente com a compra aumentará.
Algoritmo a priori em poucas palavras
O que é a análise do carrinho?
Pergunta - como obter dados úteis de pedidos de produtos para recomendações de produtos? A resposta é a chamada análise de carrinho. É um método de mineração de dados.
Um algoritmo eficiente e popular para análise de carrinho é o algoritmo Apriori. Este algoritmo define a forma como extraímos os dados e como avaliamos a sua utilidade.
Nem toda correlação de produtos no carrinho do cliente será usada para recomendações. Se um caso aconteceu 1 vez em 1000, então não faz sentido implementar tal recomendação no nível da loja. Esta não é uma tendência, mas um caso único.
Exemplos de implementação eficaz
Online podemos encontrar informações de que a análise de carrinho foi usada pelo Wal-Mart na década de 1990. É uma das maiores redes de hipermercados dos Estados Unidos. Graças à análise do carrinho, descobriu-se uma forte relação entre cerveja e fraldas. Você não criaria algo assim por conta própria, essas correlações estranhas resultam da mineração de dados.
Vamos direto ao ponto: cerveja e fraldas de bebê eram muitas vezes compradas nas noites de sexta-feira pelos jovens. Graças a esse conhecimento, os analistas introduziram mudanças na loja. Primeiro, eles aproximam esses produtos. Em segundo lugar, eles modificaram as atividades de marketing. Um grande hipermercado aplica todas as promoções e descontos nos produtos. Às sextas-feiras, foi decidido que apenas um dos dois produtos terá desconto. Na maioria dos casos, ambos serão comprados de qualquer maneira. Dessa forma, a loja ganhou vendas adicionais e economizou em atividades de marketing.
Muitos dos princípios e métodos utilizados na análise de lojas tradicionais também podem ser aplicados no comércio eletrônico. Alguns deles são mais fáceis de implementar. Nossas lojas online podem ser facilmente monitoradas - cliques, tráfego, tempo gasto no site. Também vale a pena usar os dados dos produtos no carrinho para melhorar o sistema de recomendação.
Um bom exemplo aqui é a Amazon. Mais de 20% dos pedidos são gerados com a ajuda de vários tipos de sistemas de recomendação.
Conceitos Básicos
O algoritmo Apriori não mostra apenas as relações entre os produtos, mas graças ao seu design permite rejeitar dados insignificantes. Para isso, introduz dois conceitos importantes:
- suporte - frequência de ocorrência
- confiança - certeza da regra
O algoritmo permite determinar os valores mínimos para esses dois indicadores. Assim, rejeitamos as transações que não atendem aos pressupostos de qualidade da recomendação.
A operação deste algoritmo é iterativa. Não processamos todos os dados de uma só vez. Graças a isso, o algoritmo limita o número de cálculos no banco de dados.
Vou mostrar-lhe o funcionamento do algoritmo na prática. Vou explicar o uso de suporte e confiança como elementos-chave do algoritmo Apriori.
O princípio de funcionamento do Algoritmo Apriori
Suposições iniciais, por exemplo
Vamos usar um exemplo simplificado. Vamos supor que temos quatro produtos em nossa loja: A, B, C, D. Os clientes fizeram 7 transações, que se parecem com isso:
- A, B, C, D
- A, B
- B, C, D
- A, B, D
- B, C
- CD
- B, D
Usaremos a priori para determinar as relações entre os produtos. Como suporte , definimos o valor para 3. Isso significa que a regra deve ocorrer 3 vezes na iteração dada.
A primeira iteração
Vamos começar a primeira iteração. Determinamos com que frequência o produto apareceu nos pedidos:
- A - 3 vezes
- B - 6 vezes
- C - 4 vezes
- D - 5 vezes
Cada um desses produtos apareceu nos pedidos mais de 3 vezes. Todos os produtos atendem aos requisitos de suporte. Usaremos cada um deles na próxima iteração.
A segunda iteração
Agora procuramos conexões em produtos com base em um conjunto de dois produtos. Procuramos a frequência com que os clientes juntam dois produtos selecionados em um pedido.
- A, B - 3 vezes
- A, C - 1 vez
- A, D - 2 vezes
- B, C - 3 vezes
- B, D - 4 vezes
- C, D - 3 vezes
Como você pode ver, os conjuntos {A, C} e {A, D} não atendem aos pressupostos de suporte . Ocorrem menos de três vezes. Portanto, nós os excluímos da próxima iteração.
Terceira iteração
Procuramos conjuntos constituídos por três produtos, que:
- ocorreu em pedidos de clientes
- não contêm conjuntos {A, C} e {A, D} em si
É, portanto, um conjunto de: {B, C, D}. Ocorre em pedidos apenas duas vezes, portanto, não atende às nossas premissas de suporte .
Resultado
Nossas premissas atendem aos seguintes conjuntos:
- A, B - ocorreu três vezes em ordens
- B, C - 3 vezes também
- B, D - 4 vezes
Este exemplo foi apenas para ilustrar o funcionamento do algoritmo. Para a maioria das lojas online, os cálculos de dados serão muito mais complicados, pois haverá mais deles.
Suporte expresso em porcentagem
Vale acrescentar que o suporte define a participação global da regra em todas as transações. Concordamos em apoiar nossos requisitos mínimos como um valor numérico: 3. No entanto, poderíamos definir uma porcentagem. Nesse caso:
- A, B têm suporte igual a aproximadamente 42,9% - ocorrem 3 vezes para 7 transações
- B, C têm o mesmo suporte
- B, D têm suporte igual a aproximadamente 57,14% - ocorrem 4 vezes para 7 transações
Altas porcentagens do fator de suporte resultam de um pequeno número de produtos em nosso exemplo. Temos apenas 4 produtos: A, B, C, D.
É muito pouco provável que numa loja com, por exemplo, 1000 produtos, houvesse sempre dois produtos idênticos em metade das encomendas.
Este exemplo é deliberadamente simplificado. Você deve levar isso em consideração ao usar o algoritmo em sua loja. Você deve definir o valor mínimo de suporte individualmente para a loja, indústria, etc.
Conclusões finais
A questão da confiança permanece. Especifica a ocorrência de uma determinada regra para todos aqueles onde ocorreu o conjunto inicial.
Como calculá-lo?
{A, B} - ocorreu três vezes em pedidos O conjunto inicial é A. Este produto também apareceu em pedidos três vezes. A confiança é, portanto, 100%.
Vamos espelhar este par. {B, A} ocorreu em pedidos 3 vezes. Nada mudou aqui - o par é o mesmo. No entanto, o conjunto inicial muda. Este é B. Este produto ocorreu em 6 transações. Isso nos dá confiança no nível de 50%. O produto A ocorreu apenas em metade das transações em que o produto B ocorreu.
- A e B têm 100% de confiança
- B e A têm 50% de confiança
- B e C têm 50% de confiança
- C e B têm 75% de confiança
- B e D têm 66,7% de confiança
- D e B têm 80% de confiança
Nosso exemplo simplificado (4 produtos, 7 transações) dá origem às seguintes recomendações:
- A -> B
- B -> D
- C -> B
- D -> B
onde o primeiro produto é aquele que um usuário adiciona ao carrinho. A segunda é esta que recomendamos.
Conclusão
A análise de carrinho é um método muito eficaz para o sistema de recomendação de produtos. No entanto, não consigo imaginar o processamento manual de dados de acordo com o algoritmo acima. Principalmente com lojas maiores.
Uma análise de carrinho eficaz requer uma implementação conveniente. O algoritmo Apriori deve funcionar no princípio de um programa, não de processamento manual de dados.
Existe uma implementação do Algoritmo Apriori em Python na rede.
No entanto, como você pode ver na captura de tela, requer habilidades de programação para usá-lo.
Além disso, confira nossas Dicas de comércio eletrônico →