“敲詐”還是“慷慨” 囚徒困境博弈實驗研究再獲進展

2016-05-24 13:40:44|來源：中新網|編輯：趙妍

　　原標題：“敲詐”還是“慷慨” 囚徒困境博弈實驗研究再獲進展

　　中新網杭州5月24日電 (見習記者方堃通訊員王汝菲)還記得此前經歷跨年戲劇性轉折的“石頭剪子布”實驗嗎？這項研究在2014年被吐槽為“吃飽了撐的”，然而在2015年初被評為《麻省理工學院科技評論》“2014年度最優成果”，成為中國首次入選的社科領域成果。

　　近日，“石頭剪刀布”研究中的兩位研究者——浙江大學實驗社會科學實驗室王志堅研究員和浙江工商大學經濟學院許彬教授，聯合三位新的研究者——浙江大學經濟學院周嫣然、清華大學與香港中文大學的鄭捷和Jaimie，在囚徒困境博弈實驗研究中再獲進展，相關成果以《重復囚徒困境博弈中敲詐策略可以比慷慨策略有更好的表現》為題，正式發表于影響因子高達11.47的國際頂級期刊《自然通訊》。

　　人類合作演化是極具挑戰性的基本科學問題，囚徒困境是研究該問題的基本模型。敲詐策略是指在重復囚徒困境博弈中，使自我收益總是高於或等於對方收益的某種條件合作策略。相反，慷慨策略則是指使對方收益總是高於或等於自己的收益的某種條件合作策略。

　　2012年，美國德克薩斯大學WilliamH.Press等人提出，在重復囚徒困境博弈中，單方面控制兩個博弈者的收益關係，尤其是其中存在一種敲詐策略，理論上可以獲得比慷慨策略更高的收益。

　　2014年，美國馬克斯普朗克進化生物學研究所、哈佛大學進化動力學項目的ChristianHilbe等人首次用實驗室實驗的方式檢驗上述理論。但實驗表明，當與“真人”對弈時，敲詐策略不一定能對慷慨策略或簡單善良的行為形成真正的挑戰。儘管使用敲詐策略比對手獲得的多，但慷慨策略下人更加合作，而敲詐策略下人更加不合作。

　　這一實驗結果與理論的不完全一致，激勵這個研究團隊對其重新進行檢驗。

　　“考慮到策略的概率形式及其中包含的社會關係性質，我們在兩個維度上改進了Hilbe等人的實驗。”浙江工商大學經濟學院許彬教授介紹，Hilbe等人的實驗是在不告知情況下，人和電腦程式的博弈。“從參與者聯想的角度，更像是個體與個體的博弈。”改進後的實驗，在實驗長度上採取60輪和新增的500輪兩種，在信息方式上分別採用不告知和告知對手是計算機程式兩種處理。

　　因此，實驗研究在四種情況下比較敲詐策略和慷慨策略的表現，即長輪次告知參與者對手是電腦程式、長輪次不告知對手是電腦程式、短輪次告知對手是電腦程式以及短輪次不告知對手是電腦程式，每種情況均實施了敲詐策略和慷慨策略，這樣總共有8種實驗設置。

　　研究者們分別於2014年底和2015年底利用實驗室控制性實驗方法進行研究。共招募256名大學生被試分別與計算機化的敲詐策略與慷慨策略對弈，每種設置下各有32名參與者，男女各半。每名學生匹配一個電腦程式，在合作與背叛兩個選項中做出選擇，並由此得到實驗得分。實驗累計得分按照固定比例換算成現金在實驗結束時支付給參與者。

　　結果，參與者的收益有高有低。例如，在500輪的情況下，高的超過60元，低的不到30元，平均每人獲得50元收益。實驗發現，在互動時間足夠長並且計算機對手的特徵被真人被試知道的情況下，敲詐策略取得了比慷慨策略更高的收益，同時兩種策略使真人對手達到了相同的合作水準。

　　“我們做這個實驗，不是因為覺得‘敲詐’是一個可以運用的策略，而是相反，覺得敲詐策略一旦比慷慨策略收益更高，從演化優勢的角度看，會導致不良社會後果。”許彬説，人們有時會覺得某些不好的東西卻有很強的生命力和擴展性，但又無可奈何。“作為研究者，首先想弄清楚，為什麼不喜歡的東西卻一直存在，為什麼善良的願望和做法並不一定導致好的結果。進一步，如果希望得到好的社會結果，需要具備什麼條件，這是研究的根本動機。”

　　“今後我們還會研究這一策略在具體的社會環境下的表現以及可能的後果，比如雇傭與被雇傭、壟斷競爭、採用人工智能為企業牟利的情景等等。”許彬表示。(完)