協力呼びかけのシミュレーション:

安心は信頼を低下させる

 

                                                                                                  高木英至

                                                                                    (埼玉大学 教養学部)

 

キーワード:協力、社会的ディレンマ、選択的受け容れ、信頼感

 

【要約】この研究は協力関係への選択的受け容れ(selective inclusion)メカニズムが進化的な均衡として成り立つか否かをコンピュータシミュレーションによって検討する。100のエージェントの各々が順番にN人協力関係への呼びかけを行い、胴元(呼びかけ者)と協力者に利得が生じるようなシミュレーションモデルを構成した。協力関係ができれば胴元と協力者には利得が生じる。しかし胴元・協力者は違反をすれば、違反者は他の参加者の犠牲の下に受益できる。シミュレーション結果は、大勢では選択的受け容れがエージェントの戦略として進化し、協力関係が生じやすくなることを示した。さらに、社会全体の協力水準は一定であっても、違反への誘因が高い方が未知の他者への信頼(trust)が高まる、という効果が観測された。後者の結果は「安心が信頼を壊す」という議論を論理的に支持する結果であるかも知れない。

 

 

はじめに − 選択的な受入れと排除

 

 社会的ディレンマ研究において、ディレンマを解決すること、すなわち非効率的なナッシュ均衡解(非協力状態)への潜在的傾向を克服することは、一貫して課題であり続けた(e.g., Foddy, Smithson, Hogg, & Schneider, 1999)。その解決法についていろんな議論が積み上げられてきたことはいうまでもない。

 協力状態を実現するために実際に人々が行っている方法の1つは、協力しそうな人だけを受入れ、非協力的な人を排除して協力関係を作ることだろう。こうした選択的な受入れ/排除(selective inclusion/exclusion)には少なくとも次の2つの意味がある。第1は、人はその動機づけ志向に応じて、一貫して協力的、あるいは非協力的な傾向を示すことがあることである(e.g., Kramer, McClintock, & Messick, 1986; Liebrand, & van Run, 1985)。多くの人がそうした一貫性を持つと見込めるのなら、協力することが見込める人だけを予め受入れ、しからざる人を排除した方が、協力性の出現という点では合理的であるに決まっている。第2の意味は、協力関係に入れることがエージェントの利得達成に寄与する限り、選択的な受入れ/排除が協力に向けての誘因システムとして機能し、結果としてエージェントの協力を促せることである。

 しかし次の点はまだ不明と言わなければならない。すなわち、選択的な受入れ/排除が戦略として進化できるのか、言い方を変えると、選択的な戦略にもとに協力が生じやすくなるという状態が(進化的な)均衡として達成可能なのか、という問題である。この研究では、以上の問題関心の下に「協力呼びかけゲーム」を前提とした計算実験を行おうとする。

 

シミュレーションモデル

 

協力呼びかけゲームの構造の概要

 シミュレーションの背景となるゲーム構造は次のような状況である。

(1) エージェント数が100の社会を仮定する。この社会では空間を仮定せず、エージェント間の距離も定義しない。

(2) エージェントの1人が交互に胴元(manager)になって協力を呼びかける。胴元と協力者への利得は協力者数に依存する。利得は胴元の方が協力者より高い。以下に示すように、ゲームではN(胴元+協力者)=9で胴元・協力者の利得は最大となるように設定する。胴元1人でも利得になるが、N=1では利得は低い。

(3) 協力者も胴元も協力関係において「違反」できると仮定する。違反したとき、違反者には追加的利益が生じ、他の参加者には損害が出る。

(4) 上記の(2)(3)から、この協力呼びかけゲームは利得が非対称的な、N人ディレンマ構造になっていることが分かる。

 

利得構造

(1) 胴元が呼びかけた協力関係の当事者総数をNとするとき、胴元の利益はa・N1/2で定義する。ただし、(自分を含めて)当事者を1人増やすごとに、胴元にはbの経費が生じると仮定する。従って胴元の利益Uは次の式で表せる。

  Um = a・N1/2 − b・N                                                    [1]

ここでa=3、b=1/2とおく。[1]を微分すれば分かるように、a=3、b=1/2であるなら、U は =9 のときに最大になる。従って合理的なエージェントは、自分が胴元になったときには8人の協力者を集めようとするはずである。

(2) 協力者の利益Ucはa・N1/2/10とおく。胴元にはコスト関数がかかっているので最適なNを持つけれども、協力者にとっては協力関係の当事者は多ければ多いほどよいことになる。

(3) 協力関係の中で違反者が1人生じるごとに、違反者を含めてすべての協力関係当事者には −a・N1/2/5の損害が生じると仮定する。違反者総数がNであれば、各参加者が蒙る被害は−N・a・N1/2/5である。もし1人の違反者が出れば、協力者の利得はマイナスになる。つまり違反者が出るような関係には入らない方が得をする。ただし違反者は、自分以外の当事者のそれぞれから w・a・N1/2/10の利得を得ることができる。wは違反誘因の強さを表す。また、協力関係が胴元1人であるときは、自分で違反しても違反は成立しない(単にUm = a・N1/2 − b・N=a−bを得る)。

 

エージェントの戦略

(1) エージェントの戦略は、胴元になったときの「呼びかけ戦略」(7次元)、胴元からの呼びかけへの「受諾戦略」(5次元)、「違反戦略」(3次元)、「賄賂戦略」(2次元)、「信頼(trust)」(2次元)からなる。戦略は計19次元の2値変数のヴェクトルとして定義する。

(2) 呼びかけ戦略は次のごとく構成する。

 (a) 呼びかける人数(0〜15人)、4次元。

 (b) スイッチ次元(呼びかける相手をランダムに選ぶか、違反率依存的に選ぶか?)、1次元。

 (c) 許容する違反水準(過去の違反率がその水準以下なら呼びかける相手に含める)、2次元で、0.0/0.33/0.67/1.0 の4水準の値をとり得る。 上記スイッチ次元が1のときだけ、その値がエージェントの行動を規定する。

(3) 胴元から呼びかけられたエージェントはその呼びかけを受けるか否かを、自己の受諾戦略に従って判断する。受諾戦略は次のごとく定義する。

 (a) スイッチ次元(呼びかけに、確率的に応じるか、違反率依存的に応じるか?)、1次元。

 (b) 確率的に応じる場合の受諾確率、2次元。0.0/0.33/0.67/1.0 の4水準の値をとり、上記スイッチ次元が0のときに適用される。

 (c) 許容する違反水準(同時に呼びかけられた顔ぶれの過去の違反率から推定される、その関係で違反が生じる確率が、その水準以下なら呼びかけに応じる)、2次元。同様に0.0/0.33/0.67/1.0 の4水準の値をとり、上記スイッチ次元が1のときに適用される。なお、「その関係で違反が生じる確率」とは、胴元および他の呼びかけられたエージェントの各々の「違反しない確率」の積をpとしたとき(pは1人も違反しない確率を表す)、1−pで定義する。

(4) 違反戦略は協力関係に入ったときの違反確率を表す。3次元からなり、1/7刻みで[0.0, 1.0]の値をとる。

(5) 賄賂戦略は2次元の戦略要素である。第1次元の値が1のときには胴元に「賄賂」(贈賄)の申し出をする。第2次元の値が1のときには、自分が胴元になって賄賂の申し出を受けたときには賄賂を受け取る。賄賂の意味は後述する。

(6) trust=過去の違反率が分からない相手に推定する非違反率、2次元。0.0/0.33/0.67/1.0 の4水準の値をとる。

 

賄賂オプション

 このシミュレーションモデルでは条件によって、エージェントは「賄賂」の授受をすることができる。賄賂の意味は次のごとくである。あるエージェントが次に胴元になるという情報がランダムに選んだ20のエージェントに事前に漏れると仮定する。その情報を知ったエージェントのうち、次に違反をするつもりのエージェントは、もし賄賂戦略の第1次元が1なら、次期胴元に賄賂を送ることを申し出る。また、次期胴元の賄賂戦略第2次元の値が1なら、その申し出を受ける。賄賂が生じるとき、贈賄エージェントは違反をし、同時に胴元に成功報酬として 1.5・w・a・N1/2/5 の利得を移転する。つまり賄賂を受けた胴元は、贈賄エージェントが違反をしたとしても損をすることはない。贈賄エージェントもカモにする相手が多ければ、胴元に贈賄しても多くの利益を得ることができる。この賄賂オプションは違反を促進する方向で作用すると見込める。

 

エージェントの記憶

このシミュレーションのエージェントは他エージェントの過去の違反率から、そのエージェントの将来の違反率を判断する。ここではreputation は生じないと仮定し、エージェントは自分が関与した協力関係の当事者の行動だけを観測して記憶し、その当事者の違反率を推定すると考える。推定した違反率には(エージェント[A]が過去に観測したそのエージェント[B]の違反度数/AがBを観測した度数)を当てる。もし「AがBを観測した度数」がゼロなら、AはBの違反率に「1.0−Aの信頼」を当てる。また、エージェントの記憶は世代を超えて継承されることはない。

 

シミュレーションの流れ

 シミュレーションの1つのRunは多数の世代から構成される。以下の分析では200世代までを観測した。1世代は200のラウンドからなり、各ラウンドでは100のエージェントの各々が順番に胴元になる。胴元になる順番はラウンドごとにランダムに決める。従って1世代の間に2万の協力関係の成立機会が生じる。エージェントの利得は2万回の機会で得た利得の単純な総和である。世代の終了時には次の手順で戦略の変化が生じる。

 

戦略変化

 世代の終了時に戦略の変化(進化)が生じる。戦略変化は交叉(Crossover)と突然変異からなる。

(1) 交叉は次の手順で定義する。世代の終了時に、エージェントを世代での利得の順番に並べ、上位10%(10エージェント)と下位10%を指定する。同順位があればランダムに10エージェントまでを選ぶ。次いで、上位10エージェントの中から重複を許して、利得の大きさに比例して2エージェント(AとB)を選ぶ。さらに交叉位置(1〜18)をランダムに選び、AとBの戦略を交叉させ、重複を許さずランダムに選んだ下位2エージェントにそれぞれの戦略を代入する。すべての下位エージェントの戦略は上位エージェントの交叉を施した戦略に置き換わる。

(2) 突然変異は、交叉の操作後のすべてのエージェントの各戦略次元を確率 0.015 で別の値に変化させることで実施する。

 

シミュレーションの構造

 概略すればこのシミュレーションは次のような構造を持っている。各エージェントは胴元になる等しい機会を持つ。胴元は最適数(N=9)までは協力関係を拡大するのが有利であり、胴元にならないエージェントはなるべく多くの協力関係に含まれること、しかもなるべく規模の大きい協力関係に参加することが有利になる。しかしこの状況では違反への誘因が存在する。違反への誘因の強さを決めるのは2つの要因である。第1の要因は、違反したときの誘因を規定するwである。wの値が高い方が違反への誘因は強い。第2の要因は賄賂オプションの存在であり、賄賂オプションが導入された場合の方が全般に違反への誘因は高いはずである。そうした違反への誘因の存在にもかかわらず、呼びかけ・受諾における受入れ/排除の戦略要素の存在が協力関係の成立に貢献するかどうかが、このシミュレーションの焦点になる。

 

実験計画

 今回のシミュレーションでは2×4の要因計画でRunを実施した。第1の要因は賄賂オプションの有無である(2水準)。第2の要因は誘因の強さ(w)の4水準(小[w=0.1]/中[2/3]/大[1.0]/特大[5/3])である。8条件の各々で10のRunを実施した。事前の試行ではエージェント社会の協力状況の体制は50世代くらいで固まるので、各Runとも200世代で打ち切った。各世代の初期状態では、各エージェントの戦略の値は無作為化した。


シミュレーション結果

 

概況


 シミュレーション結果は大勢として、エージェント社会内で協力関係が進化したことを示している。図1は誘因の強さ(w)が大、賄賂ありの条件の第1Runの結果(1−100世代)を例として示している。まず戦略は、初期状態の無作為化された状態から、すぐに選択的受入れ(呼びかけ・受諾)の状態へと変化する。その戦略の変化に伴い、協力率(当事者1人の関係を除く協力率)が上昇し、上限(100%)に近づいて行く。協力者の平均規模(協力人数)は最初低下するものの、協力率が一定の段階に達すると上昇に転じ、最適人数(9)に近い状態で推移している。同時に信頼も上限近くまで達している。

 図1の例は最も協力性が高まる条件の例である。他の条件、特に誘因が特大の条件では、後述するように、協力性は高まらず、協力人数も低い水準に留まるRunも観測された。

 

基礎指標

 観測したエージェント社会の状況は次の3つの「基礎指標」で見ることができる。なお、200世代を40世代ごとに5つの世代ブロックに分け、世代ブロックを繰り返し要因として分散分析を実施した。


 まず協力率に対しては、違反誘因の強さの主効果だけが有意である(F(3,72)=28.9, p< .000)。図2にあるように違反誘因が高いほど協力率は低い。ただし協力率の差が出るのは「特大」とその他の水準との間であり、誘因が小中大の3水準間では有意な差はない(SNK検定)

 協力への平均参加者数を示すのが図3である。同様に誘因の強さの主効果だけが有意な影響を及ぼす(F(3,72)=20.7, p< .000)。差があるのは再び、特大とそれ以外の水準との間である(SNK)。誘因が小〜大の範囲では、平均すれば最適規模より1人少ない数字の協力関係ができたことになる。

 未知の相手に推論する協力率である信頼の平均値は、図2が示している。信頼に対しては、誘因の強さの主効果(F(3,72)=28.0, p< .000)、および賄賂要因の主効果(F(1,72)=34.1, p< .000)が有意となる。図2にその傾向が見られるように、信頼の平均は誘因中と大の間でだけ差がない(SNK)。そして協力率が有意に低かった特大条件を除けば、協力率に差がなかった誘因小〜大の条件において、誘因が強い方が信頼性が高い、という結果が生じている。また、賄賂あり条件は賄賂なし条件の場合よりも、信頼は高くなっている。以上の結果は、誘因が特大であり従って協力自体が危うくなる条件を除けば、協力率は同じであっても、非協力を促す要因がある場合の方が信頼が高まっていることを示している。

 

戦略の変化

 上記の結果は戦略分布の進化とも符合している。受入れと受諾が(ランダムではなく)選択的、つまり相手の違反率依存的である戦略を持つエージェントの比率に対しては、誘因の強さ要因の主効果(F(3,72)=14.5, p< .000)、および賄賂要因の主効果(F(1,72)=6.1, p< .02)が有意となっている。選択的戦略は賄賂あり条件で高く、誘因小の条件だけが他の3水準より低くなっている(SNK)。すなわち、何れの要因によるにせよ、エージェントの非協力を促す条件が高いときに、戦略は選択的になる傾向が見て取れる。

 

考察

 

 このシミュレーション結果の含意は次の2点にまとめることができる。

 第1の含意は、選択的な inclusion(受入れ・受諾)の戦略がこのシミュレーションにおいて進化し、一定の協力性を安定的に確保できることがデモンストレイトされたことである。この観測は、選択的な inclusion に基づく「協力社会」の進化を予測することに論理的な矛盾が無いことを示している。

 むろんこのシミュレーション結果がどの程度頑健であるかについては検討の余地がある。このシミュレーションでは、初期状態で戦略を無作為化したため、選択的な戦略が比較的多い状態から出発している。選択的戦略が初期状態で少ない条件で試行すれば、結果に変更が生じても不思議はない。

 より印象的な結果は次の第2の含意としてまとめることができる。すなわち、違反誘因の強さによるにせよ賄賂オプションによるにせよ、社会の中で違反へのtemptation が高い場合の方が(結果の協力水準では差が無いのに)、信頼(未知の相手に対して推定するデフォールトの協力確率)が高まる、という傾向が生じたことである。

 この結果は次のように解釈することができる。

 temptation が低い場合は協力の発生を困難にする要因が当然ながら少ない。temptation が低い状態とは、山岸(1998, 1999)の表現を借りれば、エージェントが「針千本マシン」を飲んだような状態といえるだろう。つまり他のエージェントは放っておいても協力する傾向が生じる。このとき、戦略が選択的であることにはさして意味がない。要するに相手を(あまり)見ないでも済む(協力が生じると見込むことができる)。従って選択的な戦略の進化は、相対的に阻害されるだろう。

 temptation が高い場合にはエージェントの戦略が選択的になることに意味がある。つまり、相手を見ながら非協力的な他者を関係に含めないようにするエージェントの方が生き残りやすい。シミュレーション結果はtemptationが高い条件で戦略が選択的になり、それに伴って協力率が高まり、信頼も上がることを示した。ではなぜ、temptation が高いと信頼まで向上するのか? 次のように考えるべきだろう。このシミュレーションにおいても同様であるが、戦略が selective inclusion に基づくなら、信頼が高くない限り誰にも協力を呼びかけられず、結果として利得を失うことになる。だから、社会内の協力率がある程度達成されることを条件に、時折違反されるとしても、信頼を上げて協力関係に参与した方が、利益が高くなる(そのような戦略が生き残る)。だから temptation が高い条件で信頼も高くなるのだろう。

 以上の考えからは次のような派生的な予測が可能だろう。

 temptation による、信頼へのこのような効果は、inclusion という戦略状況が社会の中に built-in されてはじめて成り立つ。もし temptation の高い社会のエージェントと低い社会のエージェントを、同一の実験状況(同様の戦略分布が built-in されていない)に置いたら、trust の高い(temptation の高い社会の)エージェントの方がより協力的になって不思議はない。

 同様に、temptation の高い社会のエージェントの方が、相手を見て判断することに慣れるため、相手の協力性を識別する能力を発達(進化)させても不思議はない。

 


引用文献

Foddy,M,, Smithson, M.,  Hogg, M. & Schneider, S. (1999) (Eds.) Resolving Social Dilemmas. NY: Psychology Press.

Kramer, R.M., McClintock, C.G. & Messick, D.M. (1986)  Social values and cooperative response to a simulated resource conservation crisis. Journal of Personality, 54, 576-592.

Liebrand, W.B.G. & van Run, G.J. (1985) The effects of social motives on behavior in social dilemmas.  Journal of Experimental Social Psychology, 21, 86-102.

山岸俊男 (1998) 『信頼の構造』、東京大学出版会.

山岸俊男 (1999) 『安心社会から信頼社会へ』、中央公論社(中公新書).