{{ block title }} 實驗說明(三):報酬決定(最佳選擇策略) {{ endblock }} {{ block content }}
提示:在您看到抽球結果之後,您應該選擇最接近您信念的選項,這樣能夠最大化您的期望報酬。
舉例:
假設您認為這 100 次當中使用紅罐次數為 40 次,並且選擇第 5 行(紅框標示)。
此時,在您的信念中,第 5 行的期望報酬為: 40/100 x 128 + 60/100 x 168 = 152
類似的,第 4 行的期望報酬為: 40/100 x 102 + 60/100 x 182 = 150
且第 6 行的期望報酬為: 40/100 x 150 + 60/100 x 150 = 150
因此,低報或者高報您的信念,都對於您的期望報酬沒有好處