资料详情(天天资源网)

天天资源网 / 小学语文 / 教学同步 / 部编版 / 五年级下册 / 第六单元 / 16 田忌赛马 / “田忌赛马”类博弈的最优策略风险的探讨

“田忌赛马”类博弈的最优策略风险的探讨

2022-03-16
7页
784.5 KB

还剩 2 页未读，点击继续阅读

继续阅读

点击预览全文

点击下载高清阅读全文，WORD格式文档可编辑

立即下载

有任何问题请联系天天官方客服QQ：403074932

资料简介

“田忌赛马”类博弈的最优策略风险的探讨尹向飞陈柳钦（湖南商学院信息系，湖南长沙，410205）（天津社会科学院，天津，300191）内容提要：本文将风险引入n重赛马博弈，建立基于支付的风险模型，证明n重赛马博弈支付风险双重最优混合策略的存在性，并进行了实证分析。关键词：n重赛马博弈；风险；有界闭凸集；支付风险双重最优混合策略[中图分类号]F12[文献标识码]A[文章编号]一、研究背景“田忌赛马”是很经典的以弱胜多的例子，在现实生活中存在许多诸如此类的例子，文[1]对该类博弈进行了详细的描述与研究。在文[1]中首先给出n重赛马博弈、一轮n重赛马博弈、对换等定义以及相关的定理，下面对相关定义与结论予以回顾。定义1博弈中有两个局中人，简称局中人1、局中人2。局中人1有匹“马”，所有的“马”所构成的集合为，，表示“马”跑得比“马”快，则称为局中人1的初始禀赋集；局中人2有匹“马”，所有的“马”所构成的集合为，，则称为局中人2的初始禀赋集；其中和两两不同。共比赛局，在每局比赛中，局中人1和局中人2从各自的初始禀赋集中挑选出一匹马参与比赛，每匹马仅参加一局比赛。在第局比赛中，设局中人1和局中人2从各自的初始禀赋集中挑选出马分别为，如果表示局中人1在第局比赛中所获得的支付；表示局中人2在第局比赛中所获得的支付。局中人1的总支付为，局中人2的总支付为，显然有，则称该博弈为n重赛马博弈，简记为。很显然，完全信息下n重赛马博弈对应一个有限策略式零和博弈，其中，，i=1,2，。设为局中人1的支付矩阵（后同），其中表示局中人1采取策略、局中人2采取策略时局中人1的支付，则每行的和都相等，每列的和也相等，每行的和等于每列的和，而居中人2的支付矩阵为。在文[1]中同样给出n重混合赛马策略的定义，任何一个n重混合赛马策略对应相应有限策略式零和博弈的一个混合策略，因此，我们可以在有限策略式零和博弈的框架下来研究n重混合赛马策略的相关问题。当然在很多n重赛马博弈中，最优策略往往不止一个，那么在存在多个最优策略的情况下，我们能否优中选优？针对这一问题，文[1]没有给出相应的研究，本文将风险这一概念引入n重赛马博弈，对最优策略优中选优进行研究。二、几个定理设分别为对应n重赛马博弈的有限策略式零和博弈5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 局中人1、2的混合策略集（或策略集），其中定义如下：分别称为局中人1、2的混合策略，称为一个混合局势，在该混合局势中，局中人1的支付期望为：；如果n重赛马博弈存在最优纯策略（s1,s2），也可以把它看作局中人1、2分别以概率1选择策略s1、策略s2的一个混合策略。因此，在此n重赛马博弈中，设局中人1、2的最优混合策略集分别为：并且至少存在一个最优混合策略，即，设中的目标函数最大值为，根据对策论的相关理论可以得出中的目标函数最小值也为，其中为常数，则我们可以证明如下两个定理。定理1为有界闭凸集。证明：①显然为一个有界闭集，而的子集，因此为一个有界集合。②如果，则目标函数的最大值，矛盾，因此，为凸集。③设，现在证明为开集。，以下分两种情况讨论。第一种情况，，由于为闭集，因此为开集，故存在，由于所以。5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 第二种情况，，由于且，因此其中（）不全成立，或者对全成立。后一种情况是不可能的，否则，我们可以得出的最大值，矛盾。那么至少存在一个k，使得成立，设为到超平面的最短距离，显然，取，则中任意一点满足，所以。综合第一、二种情况可以得出为闭集。综合①②③知为有界闭凸集。定理2为有界闭凸集。证明方法同定理1。三、模型的建立与求解假设1：局中人1、2是理性的，即局中人1、2只从各自的最优混合策略集中选取混合策略，同时知道对方是理性的以及对方的最优混合策略集。我们知道，在n重赛马博弈中，局中人1、2直接进行博弈时，最终选择的还是纯策略，混合局势只不过定义在各自纯策略集合上的一个概率，就是以不同的概率来选择纯策略，因此局中人1、2每进行一次博弈，得到的支付往往并不等于支付的期望值，局中人1、2各自得到的支付是一个随机变量，该随机变量取相应值的概率直接由混合局势决定，即由概率分布x和y确定，而只不过是满足（3）中所示集合中某一混合策略的支付的期望值。既然局中人1、2各自得到的支付为一个随机变量，我们就可以定义该随机变量的方差。在金融研究中，我们常常用方差作为风险的度量，而n重赛马博弈中局中人的支付的方差由混合局势确定，因此可以用支付的方差来度量混合局势的风险。由于局中人1、2得到的支付互为相反数，因此只要考虑其中一个就可以。定义2对于某一n重赛马博弈，其对应的有限策略式博弈为，该有限策略式博弈局中人1的支付矩阵为，分别为该n重赛马博弈局中人1、2的最优策略集，则当局中人1、2从选择策略构成混合局势时，局中人1的支付的方差称为混合局势的风险，记为。显然有其中，，为局中人1的支付的方差，又是局中人2的支付的方差，因此为局中人1、2共同面临的风险。针对，我们可以得出如下定理：定理3矩阵的各行之和相等，各列之和相等，各行的和与各列的和相等。5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 证明：只要证明B的任意一行之和等于第一行之和，即，其中，。设局中人1采取策略，局中人2采取，则局中人1的支付为，其对应的一轮n重赛马博弈为。则对做一系列的对换可得到，与的对应关系是一一对应的，则的支付和的支付相同（见文[1]性质3.2），为。设一轮n重赛马博弈对应局中人1的策略，局中人2采取策略，其支付为，所以，。由于与是一一对应关系，对于每一个不同的，都存在唯一的与之对应，即B矩阵的第i行的每一元素，第一行都存在唯一的一个元素与之对应且相等，因此与是一一对应关系，成立。同理可以证明各列的和相等。所以各行的和为，各列的和也为，各行的和等于各列的和。假设2：除了每个局中人都是风险厌恶者以及假设1以外，每个局中人不知道其他任何信息。由于局中人1、2都在各自的最优混合策略集中选取策略，因此各自支付的期望值一定，那么两人都应该选择使得混合局势的风险尽可能小的混合策略。但是由于假设2的存在，使混合局势的风险达到最小几乎不可能（除非都只含一个元素）。因此，当局中人1采取混合策略x时，他只能期望获得（在最不利的情况下）的风险为：因此，局中人1应该选择混合策略x，使得（6）取最小值，即局中人1可保证其所面临的风险不高于同理局中人2应该选择混合策略y，使得局中人2可保证其所面临的风险不高于（7）式和（8）式是有意义的，理由如下：记，由于为有界闭凸集，所以St为有界闭凸集，为St的连续函数，因此，对于固定的x，为有界闭凸集上的连续函数，存在，而且也是有界闭凸集上的连续函数，因此存在最优解。同理，也存在最优解。由于并不要求，并且与的求解为两个相互独立的过程，因此最优解总存在。为了将考虑风险的最优混合策略和未考虑风险的最优混合策略区分开来，我们作出如下定义：定义3使（7）达到最优局中人1的最优混合策略称为局中人1的风险最小的最优混合策略，对应的局中人2的相应混合策略称为局中人1的风险最小的最优混合策略的对偶策略。使（8）达到最优局中人2的最优混合策略称为局中人2的风险最小的最优混合策略，对应的局中人1的相应混合策略称为局中人2的风险最小的最优混合策略的对偶策略。5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 设，其中，则为局中人1的风险最小的最优混合策略，为局中人1的风险最小的最优混合策略的对偶策略；设，其中，则为局中人2的风险最小的最优混合策略，为局中人2的风险最小的最优混合策略的对偶策略。并不一定和相同。定义4由于局中人1选择，使得（7）达到最优，局中人2选择，使得（8）达到最优，则称为n重赛马博弈的风险最小的最优混合策略。如果存在局中人1的风险最小的最优混合策略的对偶策略和局中人2的风险最小的最优混合策略的对偶策略，使得=，则称为n重赛马博弈的支付风险双重最优混合策略。模型（7）、（8）的求解十分简单，实际上只要依次求解两个线性规划问题即可，当然第一个线性规划问题为带参数的线性规划问题。定理4在n重赛马博弈中，G为其对应的策略式零和博弈，则局中人1、局中人2分别以相同的概率在各自的策略集中选取各个策略，那么该策略是n重混合赛马博弈支付风险双重最优混合策略。证明：设，由文[1]的定理2知为该n重混合赛马博弈基于支付的最优策略，下面来证明其为支付风险双重最优混合策略。要证明为支付风险双重最优混合策略，只要证明（7）中的和（8）中的即可。首先证明，即要证明与同时成立。设B矩阵的第一行的和为sumv，则由定理3知B矩阵的每一行以及每一列的和为sumv，所以当局中人2选择策略时，对于局中人1选择的任意策略x，有所以。当局中人1选择策略时，对于局中人2选择的任意策略y，有所以因此，成立，同理有成立。因此为支付风险双重最优混合策略。四、实证分析5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 在田忌赛马中，田忌的支付如表1，设其支付矩阵为。表1齐王的田忌策略的策略上中下下上中中下上上下中中上下下中上上中下-3-11-1-1-1下上中1-3-1-1-1-1中下上-11-3-1-1-1上下中-1-1-1-31-1中上下-1-1-1-1-31下中上-1-1-11-1-3设田忌采取的策略为，齐王采取的策略为，那么田忌的最优混合策略集为，齐王的最优混合策略集为（具体计算过程见文[1]），,然后计算混合局势的风险为：将代入(1a)得然后从田忌的角度出发，来对（7）进行求解。首先固定p，对即（6）进行求解。当，（6）的最优解为，（1b）化为，然后对（1c）在[0，1/6]求最小值，显然（1c）的最优解为，目标函数值为；当，（6）的最优解为，（1b）化为，然后对（1d）在[1/6,1/3]求最小值，显然（1d）的最优解为，目标函数值为；因此，为田忌的风险最小的最优混合策略，风险为；当时，不管取何值，目标函数值为，因此，，任意为（7）的最优解。同理，为齐王的风险最小的最优混合策略，风险为；当时，不管取何值，目标函数值为，因此，，任意为（8）的最优解。因此，，令，为田忌赛马风险最小的最优混合策略，也为支付风险双重最优混合策略。5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 从上述例子来看，仅从支付最大的角度考虑，最优混合策略很多，但从兼顾支付以及风险的角度考虑，最优混合策略唯一，并且实证结论和实际十分符合。五、结论与展望本文将风险引入n重赛马博弈，并证明在n重赛马博弈中支付风险最优策略的存在性。将风险引入n重赛马博弈，对n重赛马博弈乃至有限策略式博弈的理论研究具有十分重要的意义。实证分析证明，基于风险的n重赛马博弈比普通的n重赛马博弈更符合实际。当然，本文在将风险引入n重赛马博弈方面的研究仅做了初步的探索，很多方面有待进一步深入研究。参考文献[1]尹向飞，陈柳钦：《对“田忌赛马”类博弈的探讨》[J]，《工业技术经济》2006年第10期。[2]FrederickS.Hillieretc：IntroductiontoOperationsResearch[M]，Osborne，2005：989-1000。[3]周学松：《求矩阵对策全部解的单纯形法》[J]，《数学的实践与认识》2003年第9期。[4]《运筹学》教材编写组编：《运筹学》[M]，北京：清华大学出版社,2003年版第388-417页。Thegropingofriskinbeststrategyofthekindof“TianJiHorseGame”YinXiang-feiChenLiu-qin（InformationFacultyofHuNanBusinessCollege，ChangSha，410205）(TianjinAcademyofSocialScience,Tianjin，300191)Abstract：Byimportingrisktontimehorsegame,ariskmodelbasedonpaymentisbuiltandtheexistenceofbeststrategybasedonpaymentandriskinntimehorsegameisproved.Attheendofthepaper,ademonstrationisstudied.KeyWord:ntimehorsegame；Risk；limitaryclosedconvexset；Mixedstrategiesbasedonpaymentandrisk5.1-9,,services,andmakethecitymoreattractive,strengtheningpublictransportinvestment,establishedasthebackboneoftheurbanrailtransitmulti-level,multi-functionalpublictransportsystem,thusprotectingtheregionalpositionandachieve7 查看更多

“田忌赛马”类博弈的最优策略风险的探讨

资料简介

相关资料