本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 Y0 A0 z- |7 O
& [2 v% d* X9 r0 r! x" d) m5 g严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) O( k z- ?2 Q
以下三个定义:/ E* [$ {' I! I" e: b8 N
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : H/ E! S u, G
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ }" H J; l9 F- o' }& E, [
所谓的双方优势策略则是指双方利益总和最大的策略。
/ S7 A( h( Q, i; I# l[编辑本段]严格优势策略举例分析
7 D# R- h$ d9 |5 f; R 一、经典的囚徒困境 - k2 T7 {* ? [9 ]6 C! h
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ t- M3 F6 g; H' K 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* U9 y$ k$ Q+ F: o, r/ [ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . V/ P: B. q3 U( r2 W# E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' e1 G+ d- B$ q. ]' |& }7 M% O9 I
若二人都互相检举(互相“背叛”),则二人同样判监2年。; {; o7 A3 t, O) w
2 N! U+ S4 ? C Q
用表格概述如下:
% b! V" |' d7 s4 p( T/ {; b
/ ~% E- W1 Y4 a8 k7 Z6 c 甲沉默(合作) 甲认罪(背叛) % I9 ]4 i$ o1 _) i% E' }3 m
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 . D- R: {( P) t1 V o
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
1 P% H# {( D3 m& R: |$ ]
1 X7 M' ^) F0 m+ h- Y* o% V 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 p1 }. @& T: C, ^" I6 u 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 f) G- D) D2 W9 I, E* G
若对方沉默、背叛会让我获释,所以会选择背叛。 : I0 d; V2 b3 H8 S4 B$ E
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" F5 d' L) I5 z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) y. ?$ O/ Q, A# L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( X, i! [. p$ m, j/ D 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: E; r( ]4 I* G) U( e
[编辑本段]二、智猪博弈理论
% { H g! Y% }/ U 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ o4 v: Y$ W: I
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : H! d) t: V! E- f" A
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " M( _3 o% e. z* J% w
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 s& Y+ ?, P2 U3 @) S+ X R5 ?3 E
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 & B1 s8 L3 D/ f* D1 \
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: ?& F) O& l% Z7 i0 D% k 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 D4 K5 `8 k& X5 `2 K9 S8 y
% s; ]# C: u* D9 v! O% m7 P三、关于企业价格策略# s& ?0 O+ Z( U8 E
A* D/ O" ^3 }6 p1 T
9 X! p4 V$ M+ b: B4 A! b* c
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 ]3 x, s2 {, \" K: g' n& V 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 ~ m$ U* E% G 以下三个定义:
9 N5 \3 |/ w9 y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ s9 g3 @2 e8 Q3 r( j; N 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 f# R4 ~4 o# |5 s0 i# C1 w 所谓的双方优势策略则是指双方利益总和最大的策略。 9 g- ^; V& a5 M; u; ~: c) I! y
[编辑本段]严格优势策略举例分析
5 W5 ^9 x2 y0 G1 X5 P8 x) L 一、经典的囚徒困境 2 g+ d: Q/ ^; _! F1 {
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" L( W& i% y* I. x! h 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 V( X2 y O- N4 w5 d) X1 D- E
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # w# ?: X; T: |7 o+ M2 _8 d4 r
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! M( ?# Z" C# P0 Q" {
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 @& p; |4 ~: ?9 }. _' E
! ^/ S' j2 x! h i; c( h用表格概述如下:
5 }# B# f, V3 f5 E [+ S3 Q
* |# {/ v+ |, q( l+ o 甲沉默(合作) 甲认罪(背叛) ! c+ Y' k) Q: [
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 1 `( e- ^$ k F9 b' V2 t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
2 _ J$ `6 _1 P1 p! j5 y5 M) c' W$ J& l/ O* ^6 F
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) Q8 l( b% t5 h9 E 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ `8 w6 u# ~" B# k3 a 若对方沉默、背叛会让我获释,所以会选择背叛。
( _7 I( S6 I ~" l/ m 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ W# j8 p% h" d 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 L% A) ]& q% n# T5 u
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; j% X, q) t/ G1 [) b5 b 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ V. z, Z2 U0 Y ~' b[编辑本段]二、智猪博弈理论
: u# U% A/ T3 J, s% K 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ T- } g1 j$ e5 r 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; [; s1 w/ }7 f
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 G5 `, x; T$ u8 O
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 G4 p- ]3 s5 K “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 @" b" r( ?9 ?& s* ~: {; h 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , s* ^ x3 [* D! i- w% I
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& _& h/ H; X/ m8 W
+ k, @& W9 L; `' y+ N1 w三、关于企业价格策略
, G- \2 H* ~: K$ Y7 L7 l
& C( Q3 c& \/ T3 U0 b% N7 ~
- J6 L$ M. j5 b, f2 | 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 n( H: J1 ~/ Z$ Q( t7 O3 H! w; u 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, I5 h: r2 s3 S/ n% X# N3 |1 G
以下三个定义:- y+ j( J8 a Z" ]! O
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. w& w2 |& e/ F5 H( B 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 E6 M2 V# l9 p 所谓的双方优势策略则是指双方利益总和最大的策略。
. L$ r: t0 U8 u( w[编辑本段]严格优势策略举例分析
* c5 x7 w# Z' y& r$ g 一、经典的囚徒困境
) A4 h* q' W7 F. `5 z) g2 L i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 R% K" r% d5 L, P8 Z# A+ ^
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % Z5 o; }4 K4 E; g
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
, G2 ~9 e$ ]& v" _- a. K 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! I% d% }: g3 X5 W1 y9 K0 c* ]
若二人都互相检举(互相“背叛”),则二人同样判监2年。
. l, f5 }" f* j, ~0 }
" ~+ |2 {: M! J1 i用表格概述如下:
9 o2 Q% H( i# c" e9 ?* i. t. |( f7 E1 r G3 [: P
甲沉默(合作) 甲认罪(背叛)
3 D6 ?& k3 V+ l: A* z; H; i/ k$ K# i, N乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " }" l; M9 D/ f, K- ?& ]* @( l$ P
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! b5 |" ^( ?5 k* f' c, y
# h% j+ E) x, i7 e' e$ e! z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" X$ ?8 ?: d8 S 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * |, u' j* \6 U
若对方沉默、背叛会让我获释,所以会选择背叛。
2 y( d0 P3 E5 H6 X- S) z 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- o; @' m2 ]5 B2 F# U: S8 P+ p 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 Q. T" v7 o, w: a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* O" X6 y3 z0 L! a8 Y# v# h 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# P# b" _8 W+ \( ~8 M3 X6 J
[编辑本段]二、智猪博弈理论* f" }9 [8 h/ e: R* s
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 Y+ H" s% i9 S8 x 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / I, T+ A1 _2 ~2 f$ v
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 P# d( _" S6 @( S) i! L 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / {" ?4 {7 c& V+ k: @# i& P! ]
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - E A5 |' c" q) V& T9 e7 e
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & Z* ^2 _3 [( X9 \
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 T' k- y- r* \* s- R3 G" N7 f 6 ]& x& {+ u0 t* E! R: M6 ]! X
三、关于企业价格策略7 K, Y# ?3 A- D( a: E7 q
3 m) L; _. m; H2 f* [( O " ~ z5 g1 I& o |7 \
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + |+ U$ f( I {; E( i, F h. D) N
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
m9 Y8 _% a o: g" u' ?5 O) B( F 以下三个定义:
; _# X6 k7 n' a, [$ j3 W& y- m 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + K5 r* S" \3 s" m3 \5 f. h
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 W! f4 N" @8 Q2 o/ |: g 所谓的双方优势策略则是指双方利益总和最大的策略。 ! Y+ S: V5 l( Q- z
[编辑本段]严格优势策略举例分析3 r+ S2 C( h# N5 ]+ l5 k9 ]. {
一、经典的囚徒困境 ( p8 r: \; ?/ F
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, K7 R$ E' [5 a+ E( `9 Y" U 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; _+ H3 C' l5 b9 v) m2 \& ^' p- E
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* {! M7 @. e. a J6 p& l/ M+ _ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# |9 h7 V2 i) r( `3 t; J 若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ \+ u' w' D& _$ u
0 k. c' E O' N5 c# t用表格概述如下:
* C6 i5 Y. m" g! P
6 P4 A: M" |$ h- p' {/ v% j 甲沉默(合作) 甲认罪(背叛)
+ D5 G9 I/ V+ g" f( r! |+ |乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 # Y, n/ o" B8 r% a) A4 L6 O
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 r& `' ?6 p5 b" y2 r U9 k# `1 L/ R" E3 ?% @
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + d3 m7 V6 p7 b1 n/ i! \6 n
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ x! R' `/ E# n( z* X* Q 若对方沉默、背叛会让我获释,所以会选择背叛。 S8 l& H! q* Q' T
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! T2 S! q4 r" \. W 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , C! \) X2 z& X( N! C7 I0 m
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* o# F" X0 D, L, B& ?9 ^ g' i/ t 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 G, V, f# f* r
[编辑本段]二、智猪博弈理论 T) L% \" F( s$ X' {1 K
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 _8 {, z2 |' T: X% j/ h
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; Q, r# X U5 x9 Q: u9 m. z 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 C7 z! t1 A; t( k7 t X( o$ p8 a* ^ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ E2 _$ {7 t0 G8 I" ^6 G3 m “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 t- v/ I0 M7 {, D: v- c b$ b
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % F8 @& P2 \* R9 y+ }4 y$ M% x
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 K) w8 A# |. k& K! d
% D2 @2 a$ j/ v' z
三、关于企业价格策略( l$ H$ x: l+ [3 L) d
' ~: b0 L. a9 }* P* V! e, t: w6 \0 I 4 G/ K8 L4 Q: n
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ A5 ^$ R3 N* i1 h$ i. r8 o/ s! y 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |