下面是小编为大家整理的CHL论文1(完整文档),供大家参考。
届. 别.
2009 届
学 号
200514100131
毕业设计(论文)
网民访问 6 8e86 网站原因的粗糙集分析
姓
名
陈海林
系
别
专
业 数学系
信息与计算科学
导 师 姓 名、职 称
张家录 教授
完
成
时
间
2009年4月
目
录
摘要 ······················································································· Ⅰ
Abstract ················································································· Ⅱ
1 1 引言 ······················································································· 1
2 2 背景介绍 ················································································· 2
3 3 粗糙集的基本概念 ····································································· 3
3.1
粗糙集 ················································································ 3
3.2
条件属性和决策属性
·································································· 3
3.3 核 ······················································································· 3
3.4
约简 ··················································································· 4
3.5
依赖度
················································································· 4
4 4 网民访问(8e86)网站原因的粗糙集分析 ······································· 4
4.1 问卷 ···················································································· 4
4.2 数据调查表 ··········································································· 5
4.3 数据分析 ·············································································· 6
4.4 约简 ···················································································· 7
4.5 决策规则提取 ········································································ 8
5 5 结论 ······················································································· 9
参考文献 ················································································· 10
致谢 ······················································································· 11
I
摘
要
利用粗糙集理论,分析本地网民访问郴州 8e86 购物网站原因与网站各体系及自身建设的潜在联系,通过对部分网民的数据调查分析,发掘作为地方性网站的各体系建设和服务需要完善部分,寻找自身发展的方向,为日后地方性网站的发展提供可靠的理论依据和参考意见。
关键词:粗糙集理论;访问 8e86 网站原因; 数据调查;理论依据和参考意见
II
ABSTRACT
The use of rough set theory, analysis of local Internet users visit Chenzhou 8e86 site to site and reasons for self-construction of the system and the potential links to some Internet users through the survey data analysis, to explore the site as a local system and the services they need to improve some of the search self-development direction for the future development of local Web site to provide a reliable theoretical basis and reference.
Key words:Rough Set Theory; The causes of visiting website 8e86;
Data survey;
theoretical basis and Reference
1 1 引言
高访问量是网站建设的动力之源和最终目标,影响网站访问的原因是多方面的,网站本身的建设和网民的主观感受以及各体系服务因素的影响都会对网民的访问产生作用。作为网站工作者,完善网站自身及服务具有积极的作用,对网站发展也是最关键的因素。在此,将网站自身建设及各体系服务作为研究对象,探讨其对网民访问网站兴趣的影响,有直接意义。此分析的结论将有助于其他网站强化自身建设,优化网络服务,为网站的发展和壮大提供有用的必要的引导和数据分析理论参考。
2 2 背景简介
公司介绍:8e86.com 是百易百乐互联网信息服务有限责任公司旗下网站,创办于 2008 年 3 月,是郴州目前唯一一家拥有互联网经营许可证的商务性网站。
8e86.com 始终以“诚信”作为服务的核心,不仅从支付途径上确保用户在线购买的安全,并将商店地理位置以点对点的方式展示,让用户与商家在网络间建立起相互的信任,为建立纯净的互联网环境迈出了重要的一步。
8e86 提倡建立信任的交易环境,化繁为简,以技术的创新带动信用体系完善的理念,并以稳健的作风、先进的技术、敏锐的市场预见能力及强烈的社会责任感获得了商家与消费者的肯定。
8e86 以城市为轴心,模拟商场经营模式,为广大商店与同城消费者之间搭建起便捷、诚信的桥梁。8e86 将不断根据客户需求推出创新产品,以更好地为广大消费者服务。
3 3 粗糙集的基本概念
波兰科学家 Z. Pawlak 教授 1982 年发表的《粗糙集合》标志着粗糙集理论研究的开始,经历了近 30 年的发展。粗糙集方法作为一个处理不确定、不精确、不完备信息的数学工具在人工智能和认知科学等领域得到了广泛的应用。粗糙集方法与概率统计方法、模糊集方法和证据理论方法等其它处理不确定性问题的方法不同,它无需提供问题所处理的数据集合之外的任何先验信息。因此对问题的处理比较客观。本文基于这样的观点来研究影响网民访问 8e86 兴趣的原因。
1 3.1 粗糙集
定义:设 U 为非空有限集,称为论域,空间, R U U 是 U 二元等价关系, 称 A(U,R)空间,[x]为对象所在的 R 等价类.对于任意的 X U ,
X 不一定能用近似空间的知识来精确地描述,于是就用 X 关于 2z 的一对下近似和上近似来描述
RX x U x xRX x U x x RX 解释为根据现有知识判断肯定属于大的那些对象的全体,RX 解释为根据现有知识判断可能属于 X 的那些对象的全体.当 RX RX 时,称.t"关于近似空间 A 是可定义的,否则称 X 关于 A 是不可定义的,称 X 为粗糙集.X 关于近似空间的正域,边界和负域分别定义为
2 3.2 条件属性和决策属性
定义:四元组 s=(u,A,V,I)是一个信息系统,其中 U 为表示所要讨论对象的非空有限集合,也称为论域,即 1 ,,nU X X ; A C D 是有限属性集合, 1 ,,nA a a 子集C 和 D 分别称为条件属性和决策属性;na AV V 是属性值的集合; : f U V R 是一个信息函数,它指定 U 中的每个对象 x 的属性值,对于这样的信息系统,每一个属性子集 B,可定义了论域上 u 上的一个二元等价关系(不可分辨关系) IND (B), 即
显然,IND(B)是一个等价关系,且 b BIND B IND b
等价关系 IND B B A 构成论域 U 的一个划分,记作 U IND B ,简记为 U/B。
3 3.3 核
定义:设 U 是一个论域,P 是定义在 IJ 上的一个等价关系簇, R P 。如果
4 IND P R IND P ,则称关系 R 在 P 中绝对不必要的(多余的);否则,称 R 在 P 中绝对必要的。
绝对不必要的关系在知识库中是多余的,如果将它们从知识库中去掉,不会改变知识库的分类能力。相反,若知识库中去掉任何一个绝对必要的关系,一定改变知识库的分类能力。
设 U 是一个论域,.P 是定义在 U 上的一个等价关系簇, R P 。
如果对每个关系 R P 在 P 中都是绝对必要的,则称关系簇 P 是独立的,否则,称 P 是相互依赖的。
设 U 为一个论域,P,Q 是定义在 U 上的两个等价关系簇 , 若 P P rPOS Q POS Q ,则称 r 为 P 中相对于 Q 不必要的,否则称 r 为 P 中相对于 Q 绝对必要的 P 中所有 Q 绝对必要的关系组成的集合称为 P 的 Q 核,记为 QCORE P .
3.4 约简 :
定义:设U为一个论域,P, Q是定义在U上的两个等价关系簇,若P的Q独立子集 S P 有 S PPOS Q POS Q ,则称 S 为 P 的 Q 约简。
3.5 依赖度 定义:设 K=( U, R)为知识库,且 , P Q R 当 p Pk Q card POS Q card U 时,称知识 Q 是 k 度可导的 0 1 k ,记为kp Q 。其中 Pcard POS Q 表示根据 P, U中所有一定能归入 Q 的元素的数目,所求出的 K 值用于表达 P 和 Q 之间的依赖度。
(依赖度 , , , S U AV f 是一个信息系统,设 P,Q c A,当 P Pk Q POS Q U 时,称知识 Q 是 k 度依赖于知识 P,记kP Q ,即对象的 100% k 可以通过知识划分到 U / Q 的模块中。当 k 二 1 时,称属性集 Q 完全依赖于 P。当 0<k<1 时,称属性集 Q 部分依赖于属性集 P。当 k =o 时,称属性集 Q 完全独立于属性集 P。而属性子集 p c 关于的重要性定义为,特别地,当 P={a}时,属性 a 关于 D 的重要性定义为 在决策表中,不同的属性可能有不同的重要性.为了确定某个属性在系统中的重要性,可以从表中去掉这个属性,再来考察没有这个属性后系统分类会发生怎么样的变化.若去掉该属性后相应的分类变化较大,则说明该属性在系统中是比较重要的,反之,说明该属性不那么重要。
5 4 4 网民访 问( 8e86 )网站原因的粗糙集分析
1 4.1 问卷
利用百易百乐网站工作的便利,我通过公司的在线客服 QQ 随机对访问本网站的 100位网民进行了访问因素问卷调查,其中包括网民对访问本地购物网站的兴趣的起源因素,题目如下: 1 1.对网上购物和获取商品信息是否感兴趣:
(1)非常感兴趣;
(2)感兴趣;
(3)不太感兴趣;
(4)不感兴趣. 2.你认为 8e86 网站设计水平如何: (1)非常有水平;
(2)有水平;
(3)一般;
(4)没水平 3.你认为 8e86 网站的客服服务态度和如何: (1)服务态度非常认真;
(2)服务态度认真; (3 服务态度还行;
(4)服务态度不认真. 4.你认为 8e86 网站提供的特价商品信息和休闲娱乐点评对你有用吗? (1)非常有用;
(2)有用;
(3)没有用处;
(4)极其无用. 5 5.网站通过每月定期定量的商讯对加盟商家和网站做宣传以及不定期联合商家举办的现场活动是否能提高网民访问网站的兴趣:
(1)很大程度上能提高访问的积极性;
(2)能暂时提高访问的积极性; (3)很少能提高访问的积极性;
(4)不能提高访问的积极性.
6 6.对访问 8e86 网站是否感兴趣: (1)非常感兴趣;
(2)感兴趣;
(3)不太感兴趣;
(4)不感兴趣.
4.2 数据调查表 设 C 表示条件属性集合,由1 2 3 4 5, , , , X X X X X 构成,分别代表问卷的第 1,
2,
3,
4,
5 号问题,D 为决策属性,即问卷的第 6 号问题.各属性值为选择答案编号.经过收集整理共获取有效完整数据调查表 100 份,因篇幅问题本文只对从中随机抽样的 20 份数据进行处理,如表 1.
表 1
编号 C D 1X
2X
3X
4X
5X
1 1 2 1 1 1 4 2 2 2 1 3 1 2 3 1 3 2 1 1 1 4 2 4 1 1 2 3 5 1 1 2 2 2 2
6 6 1 2 1 1 1 1 7 2 2 2 2 1 1 8 1 1 3 4 1 2 9 2 2 2 1...