{{ block title }} 實驗說明(三):報酬決定(最佳選擇策略) {{ endblock }} {{ block content }}

提示:在您看到抽球結果之後,您應該選擇最接近您信念的選項,這樣能夠最大化您的期望報酬。

舉例:

假設您認為這 100 次當中使用紅罐次數為 40 次,並且選擇第 5 行(紅框標示)。

此時,在您的信念中,第 5 行的期望報酬為: 40/100 x 128 + 60/100 x 168 = 152

類似的,第 4 行的期望報酬為: 40/100 x 102 + 60/100 x 182 = 150

且第 6 行的期望報酬為: 40/100 x 150 + 60/100 x 150 = 150

因此,低報或者高報您的信念,都對於您的期望報酬沒有好處



{{ endblock }}