2.シミュレーションモデル

2.1.モデルの概要
 本稿が報告するシミュレーションモデルはある2次元空間内にエージェントが並んだ社会を考える.
 15×15(=225)のセルからなる空間を考える.各セルには仮想のエージェントがいる.エージェントは近隣の24のエージェントだけと接触できる.エージェントの行動は保持する戦略によって決まる.戦略は交換戦略と科罰戦略の組である.エージェントは各試行で最初に交換局面に入り,次に科罰局面に入る.ある試行でのエージェントの利得とは,交換局面で得た利益と科罰局面で得た負の利得の和である.まず交換局面で,エージェントは他のエージェントに自分の資源(協力)を与えることができる.他者からの資源はエージェントの利益になる.また,資源を与えることは次の科罰局面で相手に協力の約束することを意味する.科罰局面でエージェントは他者に罰を与えることができる.エージェントは「強さ」の値を持ち,科罰できるのは相手が弱い場合だけである.さらに,同じ試行の交換局面で他者から資源をもらったとき,その他者の強さの半分の値がエージェントの強さに加わる.したがって多くの資源を受けたエージェントは強い.罰のコストは科罰エージェントとその協力者で,罰の被害は被科罰エージェントとその協力者で,それぞれ分担する.シミュレーションの1ラウンドはこうした試行の200回からなる.ラウンドの各エージェントの得点は各試行での利得の割引加重和である.次のラウンドに移るときには,利得の高かったエージェントの戦略が低かったエージェントの戦略と入れ替わる(学習).ラウンド終了時に一定の確率で戦略の突然変異をおこす.
 3条件でシミュレーションを行う.科罰なし条件は統制条件であり,エージェントは罰を科することなく交換だけを行う.科罰−平等条件では各エージェントは等しく値2の強さを持つ.科罰−不平等条件では3割のエージェントが強さ3,残りが強さ1の値を持つ.条件ごとに10の Run を行う.各 Run でラウンドは100までである.

2.2.空間特性
 セル空間は上下左右がつながった torus 状の形状をなす.torus であるためどのセルも「中心−周辺」の点では同じである.セル間の距離をブロック距離で定義する.したがって近傍の定義は von Neuman 近傍(最小距離で隣接するのは上下左右の4セルのみ)である.図3で例示すれば,特定のセル(黒いセル)に隣接する8つのセルのうち上下左右の4つのセルが距離1であり,斜めに隣接するセルとの距離は2である.各エージェントは距離3までの計24のエージェント相互作用することができると仮定する.エージェントの移動はないと考える.

2.3.交換と科罰の戦略
 エージェントの戦略は16の2進数(01)の組からなる(図4).最初の10の2進数が交換戦略を,後の6が科罰戦略を表す.


 交換戦略のうち2つの2進数は他者に与える(交換に供する)資源量の上限を表す.10進数に変換したときの0〜3に4をかけた値が交換資源の上限である.1試行で相手に与える資源量を1に固定する.1試行で資源を与え得る相手は24の他者のうち12である.手元に残した資源は自分で保有する.自分の1資源は利得1,他者から得た資源は利得2と換算する.したが
って与えるか否かの判断はPDの性格を帯びる.残りの8つの2進数は資源を与える相手を誰にするかを定義する.エージェントは相互作用できる他者を次の3次元で8分類する:前試行で自分より強かったか否か(2),前試行で自分に資源を与えたか否か(2),前試行で自分に罰を与えたか否か(2).この8分類(2×2×2)に対応する2進数の値が1なら,その分類の相手を与える候補に含める.エージェントは,相互作用が可能な他者の中からこの戦略の基準に合う候補者を選ぶ.そして候補者の中から交換資源の上限まで,実際に与える相手をランダムに選択する.
 科罰戦略の最初の2進数は科罰対象の上限を表す.同様に0〜3に3をかけた数だけ,各エージェントは科罰対象者を選ぶことができる.エージェントは他者を次の2次元で分類する:前試行で自分に資源を与えたか否か(2),前試行で自分に罰を与えたか否か(2).実際の科罰対象者を選ぶ手順は交換戦略と同様である.ただし科罰は弱い相手に対してしか生じない.
 3条件を通してエージェントは同じ16次元の戦略によって動く.ただし科罰なし条件では科罰戦略は値にかかわらず作動せず,相手からの科罰も常に「なし」である.つまり科罰なし条件では,戦略のうち交換戦略の6次元だけが有効となる.

2.4.強さと科罰
 ある試行の交換局面でAがBに資源を与えたとき,その資源は労力だと考え,同試行の科罰局面ではAはBに協力すると仮定する.つまりAの強さの半分がBに加わる.ただしAがCにも資源を与えていれば,Cに対するBの強さの計算ではAの強さは加算しない.つまりエージェントは協力者間の喧嘩には介入しないと仮定する.そのため,エージェントの利用可能な資源は相手によって変わることになる.エージェントの強さはその相手ごとに計算し直して定義する.
 科罰側には科罰コスト(-0.5),被罰側には被害(-3 - 強さの差)が生じる.コスト,被害の半分はそれぞれ,科罰エージェントと被科罰エージェントが負担する.残りの半分はそれぞれの協力者が等しく分担すると仮定する.この仮定は,弱いエージェントに協力すると科罰によるコストを抱え込むことを意味している.

2.5.その他の設定
 各 Run の開始時にエージェントの強さ,戦略の値を乱数で決める.戦略の各値が0か1かは確率 0.5 である.科罰不平等条件では,エージェントは確率 0.3 で「強い」エージェントになる.強さは Run を通して変わらない.
 あるラウンドでのエージェントiの利得をXi,そのラウンドの試行mでのそのエージェントの利得をximとするとき,

    n
Xi = Σximwm-1
    m=1

である.1ラウンドを200試行と仮定したのでn= 200,割引重みづけは w = .975 である.
 各ラウンドの終了時に,利得が下位1/15のエージェントの戦略を,上位1/15の中からランダムに選んだ戦略に取り換える.科罰不平等条件の場合,戦略の入れ替えは強さ集団(2水準)ごとに行う.各ラウンドの終了時に,各エージェントの戦略の2進数の各々は確率 .005 で異なった値に変化する(突然変異).

メール

前へ

Up

次へ