于倩倩,李小南
(西安电子科技大学 数学与统计学院,陕西 西安 710071)
2009年Yao[1]提出了与人类决策思维相似的三支决策模型。三支决策[2-3]不仅是对粗糙集的上、下近似模型的自然扩展,还是一种三分而治的思想策略, 更是粗糙集理论和决策理论的融合。三支决策为粗糙集理论在实际决策问题中的应用建立起一座桥梁[4],并在推荐系统、风险决策、医疗诊断和模式识别等领域都得到了广泛应用。
近年来,对三支决策的研究可以总结为以下三个方面: 一是将三支决策推广到不同信息系统上。如在完备信息系统下, Li等[5]为0-1信息表和一般信息表[6]上的三支决策提供了统一模型, 并结合售楼推荐的应用背景, 为推荐系统提供了一个贴合人脑思考模式的数学模型。这里0-1信息表就是属性值只有两种选择的特殊信息系统, 一般信息表指属性值可以有多种选择的信息系统。Liang等[7]以直觉模糊集为代价敏感函数, 提出基于决策理论粗糙集的直觉模糊三支决策。在不完备信息系统下, Chen等[8]介绍了集值信息表上的三支决策。二是对信息表的决策属性约简、规则获取以及相似相容关系改进等进行研究[9-14]。如Luo等[12]研究了当目标集变化时, 如何在不完备信息下更新三支决策,文献[13]研究了集值信息系统上的三支决策并进行了规则提取。Liu等[14]通过对比序三支决策与决策理论粗糙集, 构建了序三支决策模型。三是将三支决策应用到不同的实际问题中[15-18]。如在中东地区冲突的背景下, Yao[15]和Li等[16]先后提出和扩展了三支冲突。Yue等[18]将三支决策应用到肝癌诊断领域, 提出了一种数据-人-驱动的三支FLL诊断模型, 能够有效地处理不确定的医疗案例。
在完备信息表中, 如果对象x和对象y的每一个属性值都相等, 则称x和y的关系(x,y)为等价关系[19-20],同时称x、y属于同一个等价类。在不完备信息表中[21-24], 若除缺失值外的其他属性值都相等, 则称对象x和y具有相似关系。但是,这些信息表中讨论的相似关系的要求比较严格, 即当两个对象在每个属性都相等或至少有一个可能值相等时, 才认为它们是等价或相似的。为了解决这个问题, 我们提出用基于风险偏好的L水平相似关系来度量两个对象之间的相似性。同时,我们将区间值损失函数和贝叶斯最小风险理论结合起来, 确定了阈值的求解方法。
综上, 本文将区间值信息与三支决策理论结合, 提出了基于L水平相似关系下不完备区间值信息表上的三支决策。
1.1 信息表
对于完备信息表来说, 任取属性集A的一个子集都有二元等价关系与之对应。
定义2[20]给一个完备信息表TⅠ=(U,AT,V,F),其上的等价关系IND(A)可以定义为
IND(A)={(x,y)∈U×U|∀a∈A,
fa(x)=fa(y)}。
只有当2个对象的每个属性值都相等时才认为它们是等价的。在不完备信息表上, 由于等价关系不成立, 为了处理这种情况,Luo等[13]基于4种不同语义的缺失值定义了一个相似关系。
考虑更一般的情况,本文将这些缺失信息归纳为两类:NA和*分别表示不存在和不知道。例如男性不存在怀孕属性, 可以将这类属性值记为NA;而*表示不知道但存在,可以被估测。
定义4[13]对应不完备的混合信息表, 不同对象间相似关系定义为
RIA={(x,y)∈U×U|∀a∈A,
Pa(x)∩Pa(y)≠∅},
MA={(x,y)∈U×U|∃a∈A,fa(x)∈Va,
fa(x)=fa(y)}。
其中:IU={(x,x)|x∈U}是U上的恒等关系;
Pa(x)⊆V表示对象x在属性a上的所有可能属性值的集合。
1.2 三支决策模型
三支决策是三分而治和分而治之, 其主要思想是将对象集划分为三个不相交的部分, 然后用不同策略分别处理这三部分。它为解决复杂问题提供了有效的策略。
定义5[22]TI=(U,AT,V,F),任取论域U的子集X,X的补集表示为┐X。设R是U上的一个等价关系, 那么正域、负域和边界域可以表示为
可得x的等价类,根据设置的阈值α、β进一步可得一个基于条件概率f的三支决策
注2根据对象的上述三个状态,可以得决策规则:(A)如果x∈POS(X),那么接受x;(R)如果x∈NEG(X),那么拒绝x;(N)如果x∈BND(X),那么既不接受也不拒绝x。
注3相似函数和阈值是该模型两个重要的组成部分。相似函数已经在前面讨论过了。对于阈值,Yao[22]提出可以根据贝叶斯最小风险决策理论设计一个优化框架来计算阈值。另外,文献[5-6]提出了基于最大加权信息熵求解阈值方法。在风险项目投资的背景下, 本文将区间值损失函数和贝叶斯最小风险决策相结合求三划分和阈值。并且,通过与用最大加权信息熵求解阈值方法的对比分析,进一步说明该方法的优势。
L水平相似关系
本节讨论如何构造一个L水平相似关系, 使之能够度量区间值信息表上不同对象间的相似性。
2.1 不完备的区间值信息表
如前所述,某些属性值往往不是一个精确的数字, 而是一个可能的度数范围。例如, 描述父子之间的相似度,可以用[0.8,0.9]表示该父子相像的程度在80%到90%之间。
定义6[25]设TIVI=(U,AT,V,F)是区间值信息表,其中F={fa:U→Va|a∈AT},fa:U→I[0,1],fa(x)∈Va⊆I[0,1],I[0,1]是介于[0,1]之间的全体区间数的集合。若属性值存在缺失值, 则称其为不完备的区间值信息表, 用TIVII表示。
注41)这里的空值有两种不同的语义:一种用NA表示该缺失值没有意义;另一种用*表示该缺失值是有意义的, 可以通过其实际含义进行估测, 如人的体温。
2)由于实数t可以表示为[t-,t+],t=t-=t+,所以实数是特殊的区间数。又因为实数域和闭区间[0,1]是一一对应的, 所以任意信息都可以用区间数代替, 即无论是0-1信息表还是多值信息表都可以转化为区间值信息表。
定义7设A=[a-,a+],B=[b-,b+],C=[c-,c+]是区间数,k是实数,则其运算法则和关系有
1)k[a-,a+]=[ka-,ka+];
2)A=B⟺a-=b-,a+=b+;
3)A>B⟺a+>b+,a->b-;
4)[a-,a+]+[b-,b+]=[a-+b-,a++b+];
5)[a-,a+]-[b-,b+]=[a--b+,a+-b-];
6)[a-,a+]⊗[b-,b+]=[min{a-b-,a-b+,
a+b-,a+b+},max{a-b-,a-b+,a+b-,a+b+}];
7)[a-,a+]∨[b-,b+]=[max{a-,b-},max{a+,b+}];
8)[a-,a+]∨[b-,b+]∧[c-,c+]=[min{max{a-,b-},c-},min{max{a+,b+},c+}];
9)x+y⟹∀ai∈A,fai(x+y)=fai(x)+fai(y)。
其中,x和y是任取的区间值模糊集的综合评价对象。例如,在手写识别的背景下,如果对图像x和y加入相同的干扰, 则x和y的相似度不会发生变化。
2.2 L水平相似关系
下面讨论如何定义两个区间值模糊集的综合评价对象间的相似度。
定义8设TIVII=(U,AT,V,F)是一个区间值信息表,U是非空有限论域,AT是非空属性集,∀x、y∈U,A⊆AT,ai∈A,则x、y在ai处的属性值为
fai(x)=[x-(ai),x+(ai)],
fai(y)=[y-(ai),y+(ai)],
则x、y在A上的相似度定义为
(1)
其中:|·|是绝对值算子,|A|表示A的基数。
注51)当A是单属性集时,即A={a},公式(1)变为
SDa(x,y)=1-((|x-(ai)-y-(ai)|2+
|x+(ai)-y+(ai)|2)/2)1/2。
2)在不完备区间值信息表上,对任意对象x、y∈U,∀a∈A,使得fa(x)=*或fa(x)=NA。
i)如果fa(x)=NA且fa(y)≠NA(即fa(x)≠∅,fa(y)≠∅),认为x、y在a上不相似,SD{a}(x,y)=0。
ii)如果fa(x)=NA且fa(y)=NA(即fa(x)=∅,fa(y)=∅),认为x、y相似,SD{a}(x,y)=1。
iii)如果fa(x)≠NA且fa(y)≠NA(即fa(x)≠∅,fa(y)≠∅),根据两种不同语义的缺失值,可以分为以下3种情况:
a)fa(x)=*且fa(y)≠*,
b)fa(x)≠*且fa(y)=*,
c)fa(x)≠*且fa(y)≠*。
根据*的语义,在这3种情景下可以根据实际意义估出缺失值, 所以x、y在a上的相似度为
SDa(x,y)=1-(|x-(ai)-y-(ai)|2+
|x+(ai)-y+(ai)|2)/2)1/2。
以上讨论了单个属性值上的相似度, 下面讨论属性集A包含多个属性的情况。
注61)若fai(x)=NA且fai(y)≠NA,ai∈A,那么
y-(aj)|2+|x+(aj)-
2)若fai(x)=NA且fai(y)=NA,那么
3)若fai(x)=*且fai(y)=[y-(ai),y+(ai)],根据*的语义,fai(x)≠∅且fai(y)≠∅,故
定义9设TIVII=(U,AT,V′,F)是一个区间值信息表,∀A⊆AT,L∈[0,1],L水平的相似关系定义为
SDA(x,y)≥L}。
(2)
显然,L越接近1,x和y就越相似。
定义10设TIVII=(U,AT,V′,F),∀x∈U,x的L水平相似类定义为
(3)
定理1设TIVII=(U,AT,V′,F),∀ai∈A,A⊆AT,x、y∈U。设fai(x)=[x-(ai),x+(ai)],fai(y)=[y-(ai),y+(ai)],有如下结论:
1)0≤SDA≤1;
2)当fai(x)=fai(y)时,SDA(x,y)=1成立;
3)SDA满足反身性和对称性,但不满足传递性;
4)SDA(x+z,y+z)=SDA(x,y)。
由DA(x,y)≥0,知SDA(x,y)≤1。∀ai∈A,又由0≤x-(ai)≤x+(ai)≤1,知0≤|x-(ai)-y-(ai)|≤1,0≤|x+(ai)-y+(ai)|≤1。所以
于是,得到SDA(x,y)≥0,故0≤SDA(x,y)≤1。
2)若∀ai∈A,x-(ai)=y-(ai),x+(ai)=y+(ai),显然有SDA(x,y)=1。
3)因为SDA(x,x)=SDA(x,x),SDA(x,y)=SDA(y,x),所以反身性和对称性成立。
4)∀ai∈A,z∈U,由
fai(x+z)=[x-(ai)+z-(ai),
x+(ai)+z+(ai)],
fai(y+z)=[y-(ai)+z-(ai),
y+(ai)+z+(ai)],
可得
|(x-(ai)+z-(ai))-(y-(ai)+z-(ai))|2=
|x-(ai)-y-(ai)|2,
|(x+(ai)+z+(ai))-(y+(ai)+z+(ai))|2=
|x+(ai)-y+(ai)|2,
故
SDA(x+z,y+z)=
SDA(x,y),
证明1)显然成立。
例1表1是一个不完备的区间值信息表。由表可知U={x1,x2,…,x10},AT={a1,a2,a3,a4,a5,a6},若已知
表1 不完备区间值信息表
1)Vai=[0,1],∀ai∈AT;
2)由fa3(x4)=[0.1,0.2],fa7(x4)=[0.3,0.35],相似度如下(aij表示xi和xj的相似度):
假设决策者的风险偏好是L=0.8, 即要求两个对象的相似度在80%以上,于是得到L相似类
注8文献[14]的相似关系是定义8的特殊情况, 即
(x,y)∈RIA⟺{(x,y)∈U×U|∀a∈A,
fa(x)=fa(y)},
等价于
本节引入一个区间值损失矩阵, 在三支决策中同时考虑区间值信息表和区间值损失函数的综合策略, 由“信息表”和“成本表”组成的混合信息表, 来计算三支决策模型中的阈值和三划分。
在不完备区间值信息表中, 相似类[x]中所有元素有相似的描述, 对于一个给定的子集X⊆U,近似算子将论域U划分为3个不相交的类:POS(X)、BND(X)、NEG(X)。根据条件概率决定将x分配到3个区域,故贝叶斯最小风险决策可以应用到这个过程中,帮助我们推导出三划分的阈值。不同的相似类可能有不同的损失函数。设3种行动为P、B、N,其中P、B、N分别表示x∈POS(x)、x∈BND(x)和x∈NEG(X)。假设λ*P(*=P,B,N)表示对象实际上属于X采取行动存在的风险,λ*N(*=P,B,N)不属于X时采取行动存在的风险。
(4)
定义12设TIVII=(U,AT,V′,F)是一个不完备的区间值信息表,它的损失函数如表2所示。
表2 区间值损失函数的决策损失矩阵
X和┐X是x的两个状态,P、B、N表示对x采取的3种行动,λPP、λBP、λNP、λPN、λBN、λNN满足如下条件:
λPP-<λBP-<λNP-,λNN-<λBN-<λPN-,
λPP+<λBP+<λNP+,λNN+<λBN+<λPN+,
(λPN-λBN)(λNP-λBP)>
(λBN-λNN)(λBP-λPP)。
以λPN=[λPN-,λPN+]为例,λNP表示对x在x实际属于状态X(P)时采取措施N的损失,那它显然要比x在x实际属于状态X(P)时采取行动P的损失λPP大。
于是,采取单个动作的相关预期损失可以表示为
由贝叶斯风险决策过程[26]导致了以下最小风险决策规则:
(P1)若
(5)
则x∈POS(X);
(B1)若
(6)
则x∈BND(X);
(N1)若
(7)
则x∈NEG(X)。
下面定义一个转化函数将区间值损失函数转化为一个实数, 代表平均损失。
定义14设λ=[λ-,λ+]为区间值损失函数,θ∈[0,1],则λ的转化函数定义为
(8)
由于在定义12条件下,λNN越远离λPN,λNP越远离λBP,与将对象x分到不正确区域的损失相比,将x分到边界域的损失越接近将x分到正确区域的损失[24],我们将决策规则定义如下。
则TIVII的决策规则如下:
例2(继例1) 设X={x2,x3,x6,x7,x8},且该信息表的损失函数如表3所示。
表3 损失函数
由定义14、15计算可得α=0.612,β=0.438。又因为
|{x2,x3,x6,x7,x8}∩
{x1,x2,x3,x5,x6,x7,x8,x10}|/
|{x1,x2,x3,x5,x6,x7,x8,x10}|=
0.625。
类似地,
所以由决策规则(P1)~(B1)可得
POS(X)={x1,x3,x6,x7,x8},
NEG(X)={x2,x4,x5,x9,x10}。
表4 L变化时,x4状态的变化情况
考虑到对象的属性值有可能是多个区间值,如某地房价在[15 000,30 000]或[50 000,80 000],它可以表明东城区价格房价比较贵、西城区比较便宜,与[15 000,80 000]相比, 前者表达的信息要更丰富。我们希望能够保留更多的信息去做决策,所以本节将讨论离散区间值信息表上的三支决策。
其中t是fai(x)的基数。
例3如表1所示,fa3(x4)和fa4(x7)是可以被估测的缺失值。设fa3(x4)是[0.1,0.2]和[0.5,0.5],fa4(x7)是[0.3,0.35]和[0.4,0.45],那么将这些信息补全就可以得到一个离散区间值信息表。
基于决策者的风险偏好, 我们利用不同水平的强弱相似关系[11]度量不同对象间的相似性。
定义17设TD=(U,AT,V,F)是TDIVII的补全信息表,并称TDIVII的全体可能补全信息表为补全信息表族,用TD表示。其中值域V由值域V′根据其缺失值*的语义估测值得到。
注9在例3中,根据fa3(x4)和fa4(x7)估测值,可以得到4个补全信息表,如表5~8。
(9)
受不完备区间值信息表的语义启发, 这里引入一个区间值损失矩阵, 在三支决策中同时考虑信息表和损失函数的综合策略, 由“信息表”和“成本表”组成混合信息表, 来计算三支决策模型中的阈值和三划分。
定义19称五元数组THIVII={U,AT,V′,F,λ**}是一个混合不完备区间值信息表,(*=P,B,N)。给定风险偏好L,任取X⊆U,那么悲观策略定义和乐观策略如下。
悲观策略:
乐观策略:
于是,混合不完备区间值信息表的三支决策模型如下:
算法1 混合不完备区间值信息表的三支决策模型 输入 混合不完备区间信息表THIVII={U,AT,V′F,λ∗∗};输出 POS(X)、BND(X)、NEG(X)和决策规则;步骤一 补全不完整的属性并写出表的所有补全信息表;步骤二 计算L水平的相似度、相似类[x]LSD和α、β;步骤三 根据信息表缺失值的实际含义,计算强、弱相似类SDSLA、SDWLA;步骤四 根据定义19给出决策结论。
下面在风险投资的具体背景中说明整个模型的计算过程。
例4以风险投资为例, 考虑如下6个属性: 市场风险、技术风险、管理风险、环境风险、生产风险、金融风险,简记为A={a1,a2,a3,a4,a5,a6}。假如信息库中有10个项目U={x1,x2,…,x10}可供投资者选择。表5是关于这10个项目的信息, 这些数据可根据专家打分、股市参数和投资者评价等途径产生。例如fa3(x4)=[0.1,0.2]表示x4项目在市场风险方面的投资风险是10%~20%。
若某公司想投资一批项目,其偏好类型的集合为X={x2,x3,x6,x7,x8},L=0.8表示该公司能接受与理想投资项目至少80%相似的其他项目,下面给出如何找到信息库中符合投资者风险偏好的项目。
步骤一根据市场实际情况估测表5中的缺失信息所有可能值, 得到4个信息表TD1、TD2、TD3、TD4。
表5 TD1
表6 TD2
表7 TD3
表8 TD4
步骤二以x4为例,由(2)、(3)和(9)式知
步骤三由于该公司希望尽可能多地抓住值得投资的项目, 所以选择乐观策略。由(4)式知
|{x2,x3,x6,x7,x8}∩{x2,x4,x5,x10}|/
|{x2,x4,x5,x10}|=0.25。
假设该信息系统的损失函数如表3所示,由定义15有α=0.612,β=0.438,故x4=NEG(X),即不推荐该公司投资x4。
类似地,计算可得
SDW(x1)={x1,x2,x3,x5,x6,x7,x8},
SDW(x2)={x1,x2,x3,x4,x5,x7,x10},
SDW(x3)={x1,x2,x3,x6,x7,x8},
SDW(x4)={x2,x4,x5,x10},
SDW(x5)={x1,x2,x4,x5,x7,x10},
SDW(x6)={x1,x3,x6,x7,x8},
SDW(x7)={x1,x2,x3,x5,x6,x7,x8,x10},
SDW(x8)={x1,x3,x6,x7,x8},
SDW(x9)={x9},
SDW(x10)={x2,x5,x6,x7,x10}。
步骤四于是,在乐观策略下可以得到如下决策建议:
POS(X)={x1,x2,x3,x6,x7,x8,x10},
NEG(X)={x4,x5,x9}。
(P)若x∈POS(X),那么建议该公司投资;
(N)若x∈NEG(X),那么不建议该公司投资;
(B)若x∈BND(X),那么既不建议投资也不建议放弃, 需进一步分析。
下面将本文所提方法与用信息熵确定最优三划分和阈值的决策方法进行对比分析。
设e是论域U上的相似度量函数,其中U是非空有限集合,R={R1,R2,…,Rn}是论域U上的一个划分,则R上的加权信息熵[6]定义为
(10)
设P和Q是U上的两个划分,如果∀Pi∈P,∃Qi∈Q,使得Pi=Qi,则称划分Q比划分P粗糙。从知识粒划分角度出发知,当划分越细时, 知识的表达越精确, 加权信息熵越大。此时,求得加权信息熵值对应的阈值和三划分就是所需要的。不同的阈值会导致不同的三划分, 因此需要用加权信息熵将得到的三划分进行度量, 求出最优的三划分。
设Wij是阈值α=αi,β=βi对应的加权信息熵, 根据所有对象xi∈U和偏好类型的风险项目的相似度,计算出各种三划分的加权信息熵W(见表9),这里投资公司的偏好类型有5个{x2,x3,x6,x7,x8}。
表9 偏好类型ξ=x2时阈值与三划分
表10 阈值与三划分
本文提出了不完备区间值信息表上的三支决策。首先,根据缺失值的不同语义,利用L水平的相似关系去度量不同对象间的相似度。然后,将区间值损失函数和概率决策粗糙集结合获得阈值, 给出了不完备区间值信息表(离散的或非离散的)的一般处理方法, 在贝叶斯最小风险决策理论下,保证当前的决策是损失或成本最小的策略。最后,通过风险投资项目的实例阐述了具体的计算过程,并与用加权信息熵确定信息表三划分和阈值的方法进行了对比分析。
在未来的研究中, 我们将继续研究不同水平相似关系对三支决策的影响:1)将离散区间值信息表的乐观和悲观策略进行整合, 考虑综合决策策略, 优化三支决策规则;2)继续探索关于三划分所需阈值的确定方法, 例如将三支决策与博弈论相结合, 通过不同对象之间的互相影响和互相博弈达到求解三划分所需的阈值的目的;3)在不同实际应用背景中改进三划分结果, 将三支决策和粗糙集理论方法与其他学科交叉融合。
猜你喜欢信息熵区间损失你学会“区间测速”了吗中学生数理化·八年级物理人教版(2022年9期)2022-10-24基于信息熵可信度的测试点选择方法研究军民两用技术与产品(2022年1期)2022-06-01胖胖损失了多少元数学小灵通·3-4年级(2021年5期)2021-07-16全球经济将继续处于低速增长区间中国外汇(2019年13期)2019-10-10玉米抽穗前倒伏怎么办?怎么减少损失?今日农业(2019年15期)2019-01-03一种基于信息熵的雷达动态自适应选择跟踪方法雷达学报(2017年6期)2017-03-26区间对象族的可镇定性分析北京信息科技大学学报(自然科学版)(2016年6期)2016-02-27基于信息熵的IITFN多属性决策方法池州学院学报(2015年3期)2016-01-05一般自由碰撞的最大动能损失广西民族大学学报(自然科学版)(2015年3期)2015-12-07损失读者·校园版(2015年19期)2015-05-14