关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑   Y0 A0 z- |7 O

& [2 v% d* X9 r0 r! x" d) m5 g严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);) O( k  z- ?2 Q
  以下三个定义:/ E* [$ {' I! I" e: b8 N
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 : H/ E! S  u, G
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ }" H  J; l9 F- o' }& E, [
  所谓的双方优势策略则是指双方利益总和最大的策略。  
/ S7 A( h( Q, i; I# l[编辑本段]严格优势策略举例分析
7 D# R- h$ d9 |5 f; R  一、经典的囚徒困境 - k2 T7 {* ?  [9 ]6 C! h
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ t- M3 F6 g; H' K  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* U9 y$ k$ Q+ F: o, r/ [  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . V/ P: B. q3 U( r2 W# E
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' e1 G+ d- B$ q. ]' |& }7 M% O9 I
  若二人都互相检举(互相“背叛”),则二人同样判监2年。; {; o7 A3 t, O) w
  2 N! U+ S4 ?  C  Q
用表格概述如下:
% b! V" |' d7 s4 p( T/ {; b
/ ~% E- W1 Y4 a8 k7 Z6 c    甲沉默(合作)  甲认罪(背叛)  % I9 ]4 i$ o1 _) i% E' }3 m
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  . D- R: {( P) t1 V  o
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
1 P% H# {( D3 m& R: |$ ]
1 X7 M' ^) F0 m+ h- Y* o% V  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
4 p1 }. @& T: C, ^" I6 u  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 f) G- D) D2 W9 I, E* G
  若对方沉默、背叛会让我获释,所以会选择背叛。 : I0 d; V2 b3 H8 S4 B$ E
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" F5 d' L) I5 z  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) y. ?$ O/ Q, A# L
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( X, i! [. p$ m, j/ D  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。: E; r( ]4 I* G) U( e
[编辑本段]二、智猪博弈理论
% {  H  g! Y% }/ U  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ o4 v: Y$ W: I
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : H! d) t: V! E- f" A
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " M( _3 o% e. z* J% w
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 s& Y+ ?, P2 U3 @) S+ X  R5 ?3 E
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 & B1 s8 L3 D/ f* D1 \
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: ?& F) O& l% Z7 i0 D% k  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 D4 K5 `8 k& X5 `2 K9 S8 y
  
% s; ]# C: u* D9 v! O% m7 P三、关于企业价格策略# s& ?0 O+ Z( U8 E
  A* D/ O" ^3 }6 p1 T
  9 X! p4 V$ M+ b: B4 A! b* c
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 ]3 x, s2 {, \" K: g' n& V  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 ~  m$ U* E% G  以下三个定义:
9 N5 \3 |/ w9 y  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ s9 g3 @2 e8 Q3 r( j; N  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
0 f# R4 ~4 o# |5 s0 i# C1 w  所谓的双方优势策略则是指双方利益总和最大的策略。  9 g- ^; V& a5 M; u; ~: c) I! y
[编辑本段]严格优势策略举例分析
5 W5 ^9 x2 y0 G1 X5 P8 x) L  一、经典的囚徒困境 2 g+ d: Q/ ^; _! F1 {
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" L( W& i% y* I. x! h  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 2 V( X2 y  O- N4 w5 d) X1 D- E
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # w# ?: X; T: |7 o+ M2 _8 d4 r
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! M( ?# Z" C# P0 Q" {
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 @& p; |4 ~: ?9 }. _' E  
! ^/ S' j2 x! h  i; c( h用表格概述如下:
5 }# B# f, V3 f5 E  [+ S3 Q
* |# {/ v+ |, q( l+ o    甲沉默(合作)  甲认罪(背叛)  ! c+ Y' k) Q: [
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  1 `( e- ^$ k  F9 b' V2 t
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
2 _  J$ `6 _1 P1 p! j5 y5 M) c' W$ J& l/ O* ^6 F
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) Q8 l( b% t5 h9 E  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ `8 w6 u# ~" B# k3 a  若对方沉默、背叛会让我获释,所以会选择背叛。
( _7 I( S6 I  ~" l/ m  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ W# j8 p% h" d  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 L% A) ]& q% n# T5 u
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; j% X, q) t/ G1 [) b5 b  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
/ V. z, Z2 U0 Y  ~' b[编辑本段]二、智猪博弈理论
: u# U% A/ T3 J, s% K  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
+ T- }  g1 j$ e5 r  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; [; s1 w/ }7 f
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 G5 `, x; T$ u8 O
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
0 G4 p- ]3 s5 K  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 @" b" r( ?9 ?& s* ~: {; h  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , s* ^  x3 [* D! i- w% I
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& _& h/ H; X/ m8 W  
+ k, @& W9 L; `' y+ N1 w三、关于企业价格策略
, G- \2 H* ~: K$ Y7 L7 l
& C( Q3 c& \/ T3 U0 b% N7 ~  
- J6 L$ M. j5 b, f2 |  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 n( H: J1 ~/ Z$ Q( t7 O3 H! w; u  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, I5 h: r2 s3 S/ n% X# N3 |1 G
  以下三个定义:- y+ j( J8 a  Z" ]! O
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. w& w2 |& e/ F5 H( B  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
5 E6 M2 V# l9 p  所谓的双方优势策略则是指双方利益总和最大的策略。  
. L$ r: t0 U8 u( w[编辑本段]严格优势策略举例分析
* c5 x7 w# Z' y& r$ g  一、经典的囚徒困境
) A4 h* q' W7 F. `5 z) g2 L  i  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 0 R% K" r% d5 L, P8 Z# A+ ^
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % Z5 o; }4 K4 E; g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
, G2 ~9 e$ ]& v" _- a. K  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! I% d% }: g3 X5 W1 y9 K0 c* ]
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
. l, f5 }" f* j, ~0 }  
" ~+ |2 {: M! J1 i用表格概述如下:
9 o2 Q% H( i# c" e9 ?* i. t. |( f7 E1 r  G3 [: P
    甲沉默(合作)  甲认罪(背叛)  
3 D6 ?& k3 V+ l: A* z; H; i/ k$ K# i, N乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  " }" l; M9 D/ f, K- ?& ]* @( l$ P
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
! b5 |" ^( ?5 k* f' c, y
# h% j+ E) x, i7 e' e$ e! z  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" X$ ?8 ?: d8 S  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * |, u' j* \6 U
  若对方沉默、背叛会让我获释,所以会选择背叛。
2 y( d0 P3 E5 H6 X- S) z  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- o; @' m2 ]5 B2 F# U: S8 P+ p  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
4 Q. T" v7 o, w: a  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* O" X6 y3 z0 L! a8 Y# v# h  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# P# b" _8 W+ \( ~8 M3 X6 J
[编辑本段]二、智猪博弈理论* f" }9 [8 h/ e: R* s
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 Y+ H" s% i9 S8 x  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / I, T+ A1 _2 ~2 f$ v
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 P# d( _" S6 @( S) i! L  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 / {" ?4 {7 c& V+ k: @# i& P! ]
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - E  A5 |' c" q) V& T9 e7 e
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & Z* ^2 _3 [( X9 \
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 T' k- y- r* \* s- R3 G" N7 f  6 ]& x& {+ u0 t* E! R: M6 ]! X
三、关于企业价格策略7 K, Y# ?3 A- D( a: E7 q

3 m) L; _. m; H2 f* [( O  " ~  z5 g1 I& o  |7 \
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + |+ U$ f( I  {; E( i, F  h. D) N
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
  m9 Y8 _% a  o: g" u' ?5 O) B( F  以下三个定义:
; _# X6 k7 n' a, [$ j3 W& y- m  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + K5 r* S" \3 s" m3 \5 f. h
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 W! f4 N" @8 Q2 o/ |: g  所谓的双方优势策略则是指双方利益总和最大的策略。  ! Y+ S: V5 l( Q- z
[编辑本段]严格优势策略举例分析3 r+ S2 C( h# N5 ]+ l5 k9 ]. {
  一、经典的囚徒困境 ( p8 r: \; ?/ F
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, K7 R$ E' [5 a+ E( `9 Y" U  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; _+ H3 C' l5 b9 v) m2 \& ^' p- E
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
* {! M7 @. e. a  J6 p& l/ M+ _  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
# |9 h7 V2 i) r( `3 t; J  若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ \+ u' w' D& _$ u  
0 k. c' E  O' N5 c# t用表格概述如下:
* C6 i5 Y. m" g! P
6 P4 A: M" |$ h- p' {/ v% j    甲沉默(合作)  甲认罪(背叛)  
+ D5 G9 I/ V+ g" f( r! |+ |乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  # Y, n/ o" B8 r% a) A4 L6 O
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 r& `' ?6 p5 b" y2 r  U9 k# `1 L/ R" E3 ?% @
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + d3 m7 V6 p7 b1 n/ i! \6 n
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ x! R' `/ E# n( z* X* Q  若对方沉默、背叛会让我获释,所以会选择背叛。   S8 l& H! q* Q' T
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! T2 S! q4 r" \. W  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , C! \) X2 z& X( N! C7 I0 m
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* o# F" X0 D, L, B& ?9 ^  g' i/ t  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 G, V, f# f* r
[编辑本段]二、智猪博弈理论  T) L% \" F( s$ X' {1 K
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 7 _8 {, z2 |' T: X% j/ h
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; Q, r# X  U5 x9 Q: u9 m. z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
9 C7 z! t1 A; t( k7 t  X( o$ p8 a* ^  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
/ E2 _$ {7 t0 G8 I" ^6 G3 m  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 0 t- v/ I0 M7 {, D: v- c  b$ b
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % F8 @& P2 \* R9 y+ }4 y$ M% x
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 K) w8 A# |. k& K! d
  % D2 @2 a$ j/ v' z
三、关于企业价格策略( l$ H$ x: l+ [3 L) d

' ~: b0 L. a9 }* P* V! e, t: w6 \0 I  4 G/ K8 L4 Q: n
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ A5 ^$ R3 N* i1 h$ i. r8 o/ s! y  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )