8 de jun. de 2023

Como a aplicação do algoritmo Naive Bayes pode impactar positivamente no dia a dia de um restaurante?

 Por Juliana Tourrucoo Alves


Disciplina: INTELIGÊNCIA ANALÍTICA


O clima, a temperatura, a umidade e a presença ou não de vento podem influenciar a decisão de um cliente escolher um determinado prato? Graças ao cálculo do algoritmo de Naive Bayes e critérios de análise preditiva, você terá provas de que sim. Pode! E o dono de restaurante ao documentar essas quatro variáveis em uma planilha digital pode, com a ajuda de um analista de dados, prever qual prato terá mais saída em um determinado dia. Uma informação valiosa para planejar a compra dos ingredientes, organizar o fluxo de trabalho da cozinha e também orquestrar ações de comunicação e marketing nas redes sociais, app de pedidos de comida bem como disparos de mensagens em WhatsApp. 


Preconizar ações assertivas com base em dados é um dos pontos chaves da inteligência analítica.  Desse modo, conforme os conceitos sobre análise de dados, a N1 concentra-se no desafio de prever o prato a ser mais vendido no 15º dia em um restaurante que oferece feijoada e parmegiana, levando em conta as condições climáticas.


O primeiro passo foi documentar e captar os dados dos 14 dias anteriores (uma simples amostragem, conforme imagem abaixo) e em seguida iniciou-se um processo de mineração de dados. 


Imagem 1: amostragem (fonte: material de estudo FMU)


Cabe ressaltar que o termo mineração de dados (MD) foi criado em analogia ao processo de mineração em minas, uma vez que o analista de dados explora uma base de dados (mina) usando algoritmos (ferramentas), adequados para obter conhecimento (minerais preciosos)” . (Castro e Ferrari) 

 

Ferrari e Castro também ressaltam em suas obras que os dados são símbolos ou signos não estruturados e sem significado. Contudo, ao serem organizados sobretudo em tabelas que permitem sua organização, eles ganham valor e podem ser analisados. 

 

Com a etapa da mineração finalizada,  aplicou-se o algoritmo “Naive Bayes”, que é um classificador probabilístico baseado no “Teorema de Bayes”, o qual foi criado por Thomas Bayes (1701 - 1761). 


“O objetivo dos algoritmos de classificação é bastante simples: você prevê a classe de destino, analisando o conjunto de dados de treinamento. Esse é um dos conceitos mais importantes – se não o mais essencial – que você estuda quando aprende ciência de dados e inteligência analítica” .(Dias)


No caso, os classificadores naïve Bayes assumem que o efeito do valor de um atributo em uma dada classe é independente dos valores dos outros atributos. Essa premissa, denominada independência condicional da classe (class conditional independence), tem como objetivo simplificar os cálculos e, por causa dela, o algoritmo é denominado naïve (ingênuo). (Castro e Ferrari) 


Na prática, como detalham Castro e Ferrari, seja x um objeto cuja classe é desconhecida e H uma hipótese tal que o objeto x pertença à classe C. Em problemas de classificação, o objetivo é determinar a probabilidade P(H|x), ou seja, a probabilidade de que a hipótese H seja satisfeita dada o objeto observado x. P(H|x) é a probabilidade a posteriori de H dado x e P(H), a probabilidade a priori de H. (Castro e Ferrari) 



Ou seja, Bayer sugeriu que podemos ter Hipóteses (h), Observações (o) e Probabilidade (p) de uma hipótese acontecer.


Imagem 2: equação de Naive Bayes. Fonte: scienceprog


P(h/o) é a probabilidade da hipótese "h" dado a observação "o".

(probabilidade posterior)


P(h)é a probabilidade de hipótese "h" ser verdadeira 

(independentemente das variáveis observáveis ou a partir

 de um histórico). Ou simplesmente: probabilidade anterior

de "h"


P(o) é a probabilidade da observação "o" (probabilidade

de cada "coluna" ou fenômeno observado)


Diante disso, para identificar qual é o prato que provavelmente será o mais vendido realizei o seguinte cálculo:





P (dia de Sol | feijoada) = 0,22% ou  2/9 (coluna 1)

P (dia de Frio | feijoada) = 0,33%  ou 3/9 (coluna 2)

P (com umidade normal  |feijoada= 0,66%  ou 6/9   (coluna 3)

P (com vento | feijoada) = 0,33%  ou  3/9  (coluna 4)


P (feijoada | 14) = 0,64% ou  9/14 

P (feijoada no 15º dia) = X


Logo:


(0,22% * 0,33% * 0,66% * 0,33%) * 0,64% = 0,0102  (feijoada) 


Em seguida, foi feita a mesma análise para a parmegiana:

P (dia de sol | parmegiana) = 3/5 ou 0,6 (coluna 1)

P (dia de Frio | parmegiana) = 1/5 ou 0,2 (coluna 2)

P (com umidade normal | parmegiana) = 1/5 ou 0,2  (coluna 3 )

P (com vento | parmegiana) = 3/5 ou 0,6  (coluna 4)


P (parmegiana 14) = 5/14 ou 0,35

P (parmegiana no 15º dia) = X

Logo: 

(0,60 * 0,20 * 0,20 * 0,60) * 0,35 = 0,00504
(3/5 * 1/5 * 1/5 * 3/5) * (5/14) = 0,0051 (parmegiana)




Conforme a aplicação do algoritmo Naive Bayes, a probabilidade de o prato mais vendido no 15º dia de ser feijoada é maior do que a probabilidade de o prato ser parmegiana. Isso porque o resultado do cálculo da feijoada  é 0,0101 e ele está mais próximo do referencial 1. 


Gomes recomenda que ao finalizar o cálculo inicial, é preciso normalizar os dados, para que a soma das duas probabilidades resulte 100% ou 1. Para gerar os dados normalizados dividimos o resultado pela soma das duas probabilidades. (Gomes)



Cabe ressaltar que classificadores bayesianos são indicadores estatísticos fundamentados no Teorema de Bayes. Eles também apresentam alta acurácia e velocidade sobretudo quando usados para predizer a probabilidade de pertinência de um objeto a determinada classe.

Estudos ainda indicam que ele é um algoritmo simples de classificação e possui desempenho comparável às redes neurais artificiais e às árvores de decisão para alguns problemas de processamento quando aplicados a grandes bases de dados.


Por isso, recomenda-se que o dono do restaurante continue a documentar esse fluxo de vendas atrelados às condições climáticas. O empresário também pode fazer outras análises, como as regras de associação com relação às bebidas que os clientes pedem junto com a Feijoada. Ou seja, ele pode analisar que o (“Se a feijoada teve mais saída, a caipirinha também será comprada pelo cliente”).


Outra questão pertinente a ser pontuada: os analistas de dados também podem desenvolver um APP para atender aos donos de restaurantes, que tenham esse objetivo detalhado no cálculo acima. No APP haveria os campos das variáveis a serem preenchidos, bem como a programação da regra de Naive Bayes, que seria aplicada de forma automática, conforme a consistência da amostra e o acionamento (o clique) do cliente.


 apropriado aos donos de restaurante preencherem as informações; 

implica em analisar soluções Com isso, terá como princípio a análise prévia dos dados antes das tomadas de decisões, evitando com isso achismos ou ações aleatórios, que podem gerar queda no faturamento do restaurante. 



Referências Bibliográficas



https://www.datageeks.com.br/naive-bayes/


https://www.organicadigital.com/blog/algoritmo-de-classificacao-naive-bayes/


https://scienceprog.com/simple-explanation-of-naive-bayes-classifier/