Escolha envolvendo risco: o caso da Mega-Sena

February 27, 2023

Introdução

Quando o consumidor faz uma escolha em um ambiente de risco, suas decisões são baseadas em uma utilidade esperada $V$ para uma dada loteria. Supondo, por exemplo, uma loteria com três prêmios $X = \{x_1, x_2, x_3\}$ e seja $p_i$ com $i = 1,2,3$ as probabilidades de obtenção destes prêmios, a utilidade esperada desta loteria pode ser medida como:

\[V = p_1 u(x_1) + p_2u(x_2) + p_3u(x_3)\]

Em que $u$ é uma função que expressa a utilidade do prêmio em valores financeiros. Ao fazer uma escolha sobre loterias, o consumidor conhece o valor esperado de cada loteria $(\mathcal{V})$, o qual expressa a riqueza esperada com a aquisição da loteria e é dado por:

\[\mathcal{V} = p_1x_1 + p_2x_2 + p_3x_3\]

O caso da Mega-Sena

No caso da Mega-sena, o valor esperado do prêmio pode ser escrito como a diferença entre os produtos da probabilidade de acerto das seis dezenas com o valor do prêmio e do valor da aposta com a probabilidade complementar do acerto. No caso de uma aposta simples de seis dezenas, que custa R$ 4,50, este valor esperado pode ser escrito como:

\[\mathcal{V}_6 = p_{a,6}*x + (1-p_{a,6})(-P_6)\]

Em que $\mathcal{V}_6$ reflete o valor esperado da aposta de seis dezenas, $p_{a,6}$ é a probabilidade de acerto das seis dezenas com a aposta simples, e $P_6$ é o preço da aposta simples (4,50). Como as apostas podem ter entre 6 e 20 números, a equação do valor esperado pode ser reescrita como:

\[\mathcal{V}_i = p_{a,i}*x + (1-p_{a,i})(-P_i) \quad \text{ Com } \quad i = {6, 7,...,20}\]

Para mensurar este valor esperado, considere usar a linguagem R e especificar os preços e as probabilidades referentes a cada aposta disponíveis no site da caixa [https://loterias.caixa.gov.br/Paginas/Mega-Sena.aspx]:

# probabilidades de acerto das
p6 = 1/50063860
p7 = 1/7151980
p8 = 1/1787995
p9 = 1/595998
p10 = 1/238399
p11 = 1/108363
p12 = 1/54182
p13 = 1/29175
p14 = 1/16671
p15 = 1/10003
p20 = 1/1292
# Valor das apostas
v6 = 4.5
v7 = 31.5
v8 = 126
v9 = 378
v10 = 945
v11 = 2079
v12 = 4158
v13 = 7722
v14 = 13513.5
v15 = 22522.5
v20 = 174420

Considere instalar e liberar as bibliotecas necessárias para a análise:

lapply(list("dplyr", "tidyr", "ggplot2", "stringr", "rjson"), function(x){
  if(x %in% installed.packages() == F){
    install.packages(x)
    library(x, character.only = TRUE)
  }else{
    library(x, character.only = TRUE)
  }
})
FALSE 
FALSE Attaching package: 'dplyr'
FALSE The following objects are masked from 'package:stats':
FALSE 
FALSE     filter, lag
FALSE The following objects are masked from 'package:base':
FALSE 
FALSE     intersect, setdiff, setequal, union
FALSE [[1]]
FALSE [1] "dplyr"     "stats"     "graphics"  "grDevices" "utils"     "datasets" 
FALSE [7] "methods"   "base"     
FALSE 
FALSE [[2]]
FALSE [1] "tidyr"     "dplyr"     "stats"     "graphics"  "grDevices" "utils"    
FALSE [7] "datasets"  "methods"   "base"     
FALSE 
FALSE [[3]]
FALSE  [1] "ggplot2"   "tidyr"     "dplyr"     "stats"     "graphics"  "grDevices"
FALSE  [7] "utils"     "datasets"  "methods"   "base"     
FALSE 
FALSE [[4]]
FALSE  [1] "stringr"   "ggplot2"   "tidyr"     "dplyr"     "stats"     "graphics" 
FALSE  [7] "grDevices" "utils"     "datasets"  "methods"   "base"     
FALSE 
FALSE [[5]]
FALSE  [1] "rjson"     "stringr"   "ggplot2"   "tidyr"     "dplyr"     "stats"    
FALSE  [7] "graphics"  "grDevices" "utils"     "datasets"  "methods"   "base"

Agora considere extrair os valores dos prêmios da Mega-Sena a partir de uma api de dados disponibilizada gratuitamente. Para os devidos fins, considere obter os dados disponíveis na api desde o sorteio de número 1500 até o sorteio de número 2500, conforme o código abaixo:

# premios = data.frame()
# 
# for(i in 1500:2565){
#   link = sprintf("https://loteriascaixa-api.herokuapp.com/api/mega-sena/%i", i)
#   df = fromJSON(file = link)
#   df1 = as.data.frame(df$premiacoes[[1]])
#   while (str_detect(df1$premio, "\\.") == T) {
#     df1$premio = str_replace(df1$premio,'\\.', "")
#   }
#   df1$premio = str_replace(df1$premio,',', ".")
#   df2 = data.frame(sorteio = df$concurso, premio = as.numeric(df1$premio))
#   premios = rbind(premios, df2)
#   rm(link, df, df1, df2)
# }

Agora considere calcular o valor esperado para cada possibilidade de dezenas na aposta conforme o código a seguir:

premios = premios |>
  na.omit()|>
  mutate(
    ve6 = p6*premio + (1-p6)*(-v6),
    ve7 = p7*premio + (1-p7)*(-v7),
    ve8 = p8*premio + (1-p8)*(-v8),
    ve9 = p9*premio + (1-p9)*(-v9),
    ve10 = p10*premio + (1-p10)*(-v10),
    ve11 = p11*premio + (1-p11)*(-v11), 
    ve12 = p12*premio + (1-p12)*(-v12),
    ve13 = p13*premio + (1-p13)*(-v13),
    ve14 = p14*premio + (1-p14)*(-v14),
    ve15 = p15*premio + (1-p15)*(-v15),
    ve20 = p20*premio + (1-p20)*(-v20))

O próximo passo é plotar os valores esperados e comparar os resultados para cada aposta. Para facilitar a visualização e reduzir os prejuízos visuais da escala, o código abaixo considera os valores esperados das apostas com 6, 7, 8 e 10 dezenas para cada sorteio contido no banco de dados.

Repare que o valor esperado é tão menor quanto maior for o número de dezenas que compõem a aposta. Repare também que na grande maioria das vezes o valor esperado da aposta é negativo, isto é, a expectativa predominante é de perder o valor gasto para realizar a aposta. Isto acontece porque o valor necessário para realizar uma aposta com mais números é grande o suficiente para contrabalancear os ganhos de probabilidade de acertar as dezenas sorteadas.

Note que a aposta mínima de seis dezenas é aquela em que o valor esperado torna-se positivo em uma maior frequência. Estes casos ocorrem quando o valor do prêmio é suficientemente grande para conpensar a elevada probabilidade de não acertar as dezenas sorteadas. Com isso, desconsiderando a utilidade dos prêmios, se você é um consumidor fracamente propenso ao risco, então o ideal seria realizar a aposta simples de seis números.

 ggplot(data = premios) +
   geom_line(aes(x = sorteio, y = ve6, color = "6 dezenas"), size = 0.8)+
   geom_line(aes(x = sorteio, y = ve7, color = "7 dezenas"), size = 0.8)+
   geom_line(aes(x = sorteio, y = ve8, color = "8 dezenas"), size = 0.8)+
   geom_line(aes(x = sorteio, y = ve10, color = "10 dezenas"), size = 0.8) +
   theme_bw() +
   theme(legend.position = "bottom", legend.title = element_blank(), legend.text = element_text(size = 17)) +
   xlab("Número do sorteio") + ylab("Valor esperado") +
   scale_fill_discrete(breaks=c('6 dezenas', '7 dezenas', '8 dezenas', "10 dezenas"))

É importante destacar que do ponto de vista de um consumidor racional, a aposta torna-se atrativa apenas quando o valor esperado é superior ao montante gasto para realizar a aposta. Com isso, a Mega-Sena é racionalmente atrativa caso ocorra:

\[ p_{a,i}*x + (1-p_{a,i})(-P_i) > 0\] \[ p_{a,i}*x > P_i(1-p_{a,i})\] \[ x >P_i \left(\frac{1-p_{a,i}}{p_{a,i}} \right)\]

Calculando estes valores obtém-se que:

dt = data.frame(
  Dezenas = c(6:15, 20),
  probabilidade = c(1/5006860, 1/7151980, 1/1787995,
                    1/595998, 1/238399, 1/108363, 1/54182,
                    1/29175, 1/16671, 1/10003,  1/1292),
  preco = c(
    4.5, 31.5, 126, 378, 945, 2079, 
    4158, 7722, 13513.5, 22522.5, 174420
  )
)

dt = dt|>
  mutate(premio = preco*((1-probabilidade)/probabilidade))

print(dt[,c(1,4)])
FALSE    Dezenas    premio
FALSE 1        6  22530866
FALSE 2        7 225287339
FALSE 3        8 225287244
FALSE 4        9 225286866
FALSE 5       10 225286110
FALSE 6       11 225284598
FALSE 7       12 225284598
FALSE 8       13 225281628
FALSE 9       14 225270045
FALSE 10      15 225270045
FALSE 11      20 225176220

Em que a terceira coluna mostra o prêmio mínimo necessário para tornar a aposta racionalmente atrativa. Entretanto, é válido ressaltar que estas análises são baseadas apenas no valor esperado do prêmio, e que uma análise mais confiável deve levar em consideração a utilidade esperada dos jogadores.

A teoria da escolha envolvendo risco postula que um consumidor averso ao risco possui uma função de utilidade convexa para os prêmios, enquanto o consumidor propenso ao risco possui funções de utilidade côncavas. Suponha, portanto, que o apostador mediano da Mega-Sena possui uma função de utilidade equivalente a $u(x) = x^{x/a}$, em que $a$ é um fator de desconto. Por simplicidade, considere $a = 200.000.000$, o que torna $u(x)$ uma função convexa que representa um consumidor propenso ao risco. Assim, a utilidade esperada da aposta é:

\[V_i = p_{a,i}*x^{x/a} + (1-p_{a,i})*(-P_i)^{-P_i/a} \quad \text{ Com } \quad i = {6, 7,...,20}\]

Calculando a utilidade média esperada para cada prêmio, obtém-se:

a = 200000000
premios |>
  group_by()|>
  summarise(
    ue6dezenas = mean(p6*(premio^(premio/a)) + (1-p6)*(-v6^(-v6/a))),
    ue7dezenas = mean(p7*(premio^(premio/a)) + (1-p7)*(-v7^(-v7/a))),
    ue8dezenas = mean(p8*(premio^(premio/a)) + (1-p8)*(-v8^(-v8/a))),
    ue9dezenas = mean(p9*(premio^(premio/a)) + (1-p9)*(-v9^(-v9/a))),
    ue10dezenas = mean(p10*(premio^(premio/a)) + (1-p10)*(-v10^(-v10/a)))
      )
FALSE # A tibble: 1 x 5
FALSE   ue6dezenas ue7dezenas ue8dezenas ue9dezenas ue10dezenas
FALSE        <dbl>      <dbl>      <dbl>      <dbl>       <dbl>
FALSE 1       143.      1010.      4043.     12132.      30332.

Note que conforme o número de dezenas na aposta aumenta a utilidade esperada do apostador mediano cresce, o que se verifica para quaisquer funções de utilidade convexas bem comportadas. Este resultado decorre do fato de que embora o valor da aposta aumente, o ganho de utilidade para a expectativa de acertar a aposta supera o ganho de desutilidade de não acertar as dezenas e consequentemente perder o valor gasto na aposta. O contrário é válido para um consumidor averso ao risco com função de utilidade côncava.

Conclusão

Caso o consumidor tome suas decisões com base apenasno valor esperado da Mega-Sena, então o ideal é realizar uma aposta simples de 6 dezenas. Se o consumidor é averso ao risco, mas mesmo assim deseja realizar uma aposta, então é esperado que ele também opte pela aposta simples. No entanto, um consumidor propenso ao risco que toma as suas decisões com base na utilidade esperada do prêmio sempre estará disposto a realizar uma aposta com mais dezenas.