当前位置:舍宁秘书网 > 专题范文 > 公文范文 > 数据挖掘技术下医院项目施工过程结算模块设计

数据挖掘技术下医院项目施工过程结算模块设计

时间:2024-01-03 16:00:03 来源:网友投稿

徐 丹,张玉彬,赵奕华,韩若祎,郑胜强

(1.江苏省人民医院,江苏南京210036,2.常州世茂新城房地产开发有限公司,江苏常州 213002)

建筑项目施工过程结算是为防止建设周期较长、施工量巨大、耗用资金数额较大的施工项目出现资金断流情况,而施行的一项工程款结算方案[12]。医院工程项目施工执行该方案可及时补充施工项目资金,有效避免拖欠工程款问题[3-4]。为提高项目施工过程结算系统在医院项目施工结算中的适应性与精准性,根据医院项目施工特征,基于数据挖掘技术设计了施工过程结算模块:利用数据挖掘技术采集多元化渠道的材料价格信息,构建工程造价预测模型[5];
对比计价结算结果与项目工程造价预测结果,深入审核不符合结算标准的计价部分,避免医院项目施工过程结算误差。

专业性、多样性、复杂性是医疗体系的显著特征,医院项目施工内容除基础性建筑施工以外,还包括医疗废物回收系统、放射性废液处理系统、医用物流传输系统等项目的建设,这些设施的技术应用性较强,投入施工时间更长、造价颇高,需要高标准结算技术完成施工过程结算,以节约医院项目工程建设成本。因此基于数据挖掘技术设计了区别于一般项目施工的过程结算模块,使用J2EE 布局结算模块的业务逻辑,利用数据挖掘算法辅助得到精准结算结果。

1.1 医院项目施工过程结算模块的技术支撑

J2EE 架构下分JSP、Servlet、Webservice 等高性能开发技术,支持动态Web 页面显示与数据输出,其稳定性优、兼容性强、安全系数高等优势为医院项目复杂的结算过程提供了可靠的架构技术支撑。

为此基于J2EE 技术开发设计的医院项目施工过程结算模块架构,如图1 所示。其优点是可以跨系统操作与运行,用户访问的客户端形式多元化,施工关联的各方人员可动态掌握项目施工结算信息[6]。

图1 基于J2EE的医院项目施工过程结算模块架构设计

所设计的医院项目施工过程结算架构中,J2EE应用构架功能发挥依赖于多层次模型构建:1)用户层。用户登录结算模块的入口为浏览器,以HTTP协议形式访问结算模块,采用B/S 模式登录模块,首先需要解析HTTP 协议请求的参数;
随后,用户通过浏览器发送请求由JSP 创设的控制组件进行响应,后台基于JSP、Servlet、Html 等视图形式将得到的请求处理结果发送至用户。该过程提供生成用户访问日志信息、验证用户身份信息等基础性服务[7]。2)业务逻辑层。业务逻辑层集成在J2EE 应用服务器中,保障医院项目过程结算产生的业务管理、逻辑处理工作,安全把握项目工程量、工程款等业务数据的传输,例如数据流向、页面跳转等服务[8]。该层具有封装各个独立功能的能力,以组件形式系统化呈现架构功能,在减少资金开销的前提下扩充了医院项目过程施工结算模块的功能,加强模块系统性。3)数据层。包括模块数据库(MySQL 技术)、基础数据存储、医院项目施工信息存储、信息管理目录等关键性内容,主要负责模块数据的访问、显示、安全保存,数据层与数据库的连接基于connector 对象来构建[9]。

数据库技术是医院项目施工过程结算模块运行的重要技术支撑,为此选用功能完善、运行高效、安全系数优的MySQL 关联数据库管理系统作为结算模块开发的数据技术支撑[10]。MySQL 数据库集成了丰富的表结构、索引、存储过程等工具,集存储关系型数据、高效检索数据记录、定期运行指定数据存储过程脚本等功能于一身,生成符合用户期望的项目施工过程结算报表数据。MySQL 关联特征可以大批量访问与处理大规模数据信息,工程量计算、造价计算参数配置的灵活性大幅提高。

1.2 医院项目施工过程造价预测

此次医院项目施工过程结算模块设计融入了工程造价预测功能,目的是对比“预测造价”与“工程结算计价”,判断当前计价结果是否存在较大偏差,提高过程结算的精准度[11]。具体方法是基于数据挖掘算法构建工程造价预测模型,预设一个阈值,用于评估“预测造价”与“工程结算计价”差值,差值超过阈值则需对“当前工程结算计价”进行深度审计与核算。

此次医院项目施工过程造价预测应用k 均值聚类算法(k-means)与支持向量机模型完成[12-13]:1)利用k-means 算法对广泛采集的医院施工项目造价信息的类别进行高效精准聚类[14],按照医院施工项目定义造价预测的项目数据集,包括门诊楼项目、医技楼项目、住院楼项目、综合楼项目、院内生活楼项目、地下室项目、感染病区项目、综合管网项目、医疗及垃圾间项目、基坑支护项目、新建附属配套工程项目,总计11 项。2)采用支持向量机参数构建造价预测模型,根据造价管理需求对某项费用造价进行预测,将该类费用数据作为样本输入支持向量机预测模型中获得工程造价预测结果。该方法的优势是对医院项目施工过程各类别费用实施造价预测,预测结果细分程度高且更加可靠。

1.2.1 基于k-means算法的项目施工造价数据聚类

基于k-means 聚类算法将医院施工过程中的全部造价信息进行分类,细分造价预测内容,相比以全部工程造价数据作为预测样本的做法,聚类后再进行项目造价预测的结果更加精准。定义S=s1,s2,…,sn表示原始采集的全部医院施工项目造价信息,kmeans 算法中施工造价数据聚类的类别用k表示,聚类类别k即为施工项目类别,取值为11,基于k-means算法对医院施工项目造价信息进行聚类处理过程如下:

Step 1:在样本数据随机选取k个样本点,即k个类别的原始聚类中心;
由于传统随机选取聚类中心的方法花费大量时间才能完成聚类,且降低聚类精度,此处基于密度思想科学确定聚类中心,具体方法是找出聚类样本的核心点、边界点、孤立点[15],除去边界点、孤立点后得到核心点将其作为算法的初始聚类中心[16],分别命名为ε1,ε2,…,εk。

Step 2:求取全部医院项目施工造价数据样本点si到中心的距离,即欧氏距离作为两个样本相似程度的评价指标,其中i的取值为1~n范围内的整数,样本点的最终类别为与其距离最小中心所属的造价信息类别[17]。样本点si、sj之间的欧氏距离计算方法如下:

Step 3:全部样本点聚类完成后更新施工造价数据类别的中心,更新结果为包含于该类别样本点的均值,当平方误差准则函数稳定在最小值时终止更新,平方误差准则函数见公式(2):

其中,第i个类别中样本数量为ti,第i个类别样本均值为ni。

Step 4:循环执行Step 2 与Step 3,当全部医院项目施工造价数据造价信息类别中心变动在预设阈值之下时终止,输出聚类结果。

1.2.2 遗传支持向量机造价预测模型构建

k-means 算法将结算过程涉及的医院施工项目数据划分为11 个类别,设计预测模型对11 个类别的造价数据一一进行预测,作为过程结算的数据依据。以“综合楼项目”类别为例,根据聚类结果提取“综合楼项目”相关信息作为造价预测的样本数据。所以此处定义(xi,yi)表示医院项目施工中的“综合楼项目”造价信息,其中xi是经过k-means 算法聚类处理后的信息数据样本,为影响医院项目工程造价的变量,即模型的输入向量;
工程造价成本值用yi表示,构建支持向量机预测模型的方法是基于φ(·)对xi实施映射操作,公式(3)为医院项目施工造价预测模型表达式:

公式(3)预测模型明确显示,模型预测的精度较大程度上取决于参数ω与b的设置,前者表示权向量,后者表示偏差,两种参数设置达到最优才能呈现最佳的预测效果。为此,采用松弛变量ξi对预测模型进行约束,变换后的公式如下:

其中,正则化参数用χ表示。此处定义拉格朗日乘子μi(i取值为1~N之间的整数),基于拉格朗日函数求解上述约束公式[18],构建如下方程:

根据非线性规划问题中为求取最佳解设置的约束条件,对支持向量机问题进行变换[19],如公式(6)所示:

其中,M=[1,1,…,1],μ=[μ1,μ2,…,μn],Z=[Z1,Z2,…,Zn],K(x,xi)为核函数。

基于以上描述最终构建的医院项目施工造价预测模型如公式(7)所示,支持向量机预测模型的结构如 图2所示[20]:

图2 支持向量机预测模型的结构

基于支持向量机模型得到医院施工的11 个项目造价预测结果,将其作为过程结算的重要参数数据,结算人员组成专家评审团队根据造价预测与结算计价对比差值判断是否对结算内容进行深度审计,以约束模块当前计价结算的精准度,确保结算过程合理、可靠,具体编制流程如图3 所示。

图3 基于施工造价预测的过程结算编制流程

基于上述模型构建过程得知,正则化参数χ是影响支持向量机模型预测结果的重要参数,若χ存在偏差,将极大降低模型预测施工造价的精准度,为此引入遗传算法优化支持向量机模型的参数χ[21],构建GA-SVM 预测模型,提高医院项目施工造价预测的精准度,保障医院项目施工过程结算的可靠性。基于遗传算法寻优参数χ的步骤如下:

1)生成初始种群。随机生成n个具有串结构的原始数据,这些数据构成了遗传算法迭代的种群。

2)确定适应度函数。将公式(8)作为遗传算法寻优的适应度函数:

式中,测试集样本数量用n表示,该公式是求取测试集数据的均方误差倒数。

3)选择、交叉、变异操作。首先求取全部个体适应度总和H,以此计算种群中个体的相对适应度,即个体遗传到下一代的可能大小,计算方法见公式(9):

个体选中的次数基于模拟赌轮选择法随机生成,适应度值与个体被选择的概率成正比;
个体遗传基因在种群中扩大的前提是该个体的适应度值足够大[22-23],相应地,该个体被选择作为参数χ的概率提升。

此外,使用单点交叉算子与单点变异算子完成遗传算法的交叉与变异操作。

4)最后输出迭代寻优后的参数χ,提升GA-SVM模型预测医院项目施工造价的精度。

将施工过程结算方法用于医院工程施工项目实践,以验证此次设计的项目施工过程结算模块的有效性与可靠性,工程实践过程中严格按照约定实验步骤逐步实施,制定了全面的医院项目施工过程结算计划,经过层层审核后执行。为确保测试结果的准确性与权威性,从模块功能、性能等多个角度设计测试方案,最后汇总测试结果并展开深度分析与评价。

2.1 模块功能测试

首先对设计的医院项目施工过程结算模块基本功能进行测试,结果如表1 所示。

表1 结算模块基本功能测试结果

根据表1 结果可知,所设计的过程结算模块功能可顺利实施,具有结算管理权限的人员登录相应界面即可执行对应的信息修改、项目导入、参数调整、报表打印等操作;
功能测试过程中未出现明显的卡顿、请求响应迟缓现象,基本可以满足医院工程施工人员对款项结算的需求。

2.2 模块结算精度测试

以此次医院项目建设实例中的三个子项目作为对象,测试该模块计价结算的精准度,将三个子项目分别命名为A1、B1、C1,从材料款项与人工款项两个方面进行过程结算。人工计算出各个子项目建设所需款项(经过多方人员精准计算与审核,视为标准结算结果),同时使用数据挖掘过程结算模块、基于BIM 的项目施工过程结算模块、基于GIS 的项目施工过程结算模块进行自动化结算,统计各种方法结算结果如表2 所示。

表2 各方法的项目款项结算结果统计/万元

由表2 不难看出,数据挖掘技术的过程结算模块结算结果基本与人工结算结果一致,最低可将款项结算误差降低至0 万元;
其中,只有A1项目人工款项、B1项目材料款项上存在微小的结算偏差,仅分别存在0.01 万元、0.10 万元的误差;
总体而言,该模块实施的医院项目施工过程结算结果较为理想。相比之下,基于BIM 的项目施工过程结算模块、基于GIS的项目施工过程结算模块的结算结果偏离人工结算结果较远,且不存在结算结果与人工结算一致的情况,说明这两种方案求取的医院项目过程结算结果不能满足管理人员对施工结算的精准度需求,有待改进与提高。

数据挖掘过程结算模块在项目施工过程结算方面具有优势,所以取得了理想的结算效果:使用数据挖掘分析方法实现预测工程造价信息,而BIM 结算模块、GIS 结算模块缺乏对工程造价的预测,对于结果精准度的把握不够严格,当结算结果与预测造价偏离较大时数据挖掘过程结算模块要求相关人员对项目实施深入的审计与调查,避免结算过分偏离真实情况,也是该模块开发的创新所在。此外,模块构建GA-SVM 模型预测医院项目施工造价,由于支持向量机模型的正则化参数基于经验确定,导致预测结果存在一定的偏差,此处引入遗传算法迭代寻优获得合理的正则化参数χ,提升了医院项目施工造价预测的精度。可见,该施工结算模块不仅增加了造价预测功能,优于BIM 结算模块与GIS 结算模块,并且使用先进算法对预测效果实施优化,令医院项目施工过程结算结果更加可靠。

研究基于数据挖掘分析技术,设计开发了医院项目施工过程结算模块,其优势是引入了数据挖掘技术广泛结合项目施工材料信息,有效约束施工过程结算出现的计价误差,对于医院项目施工过程结算具有重要意义。工程建设领域全面实施施工过程结算是建筑行业发展的必然趋势与要求,对于工程项目管理优化大有裨益。医院项目施工过程结算模块开发可以大量避免人工费用拖欠、工程款项结算不及时等问题,是优化现代建筑工程管理与施工效率的基本保障,对于建筑施工模式转型升级、推动建筑企业现代化建设发展进程产生积极影响,可更好地服务社会民生。

猜你喜欢数据挖掘聚类预测无可预测黄河之声(2022年10期)2022-09-27选修2-2期中考试预测卷(A卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25选修2-2期中考试预测卷(B卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25探讨人工智能与数据挖掘发展趋势大众投资指南(2021年35期)2021-02-16基于DBSACN聚类算法的XML文档聚类电子测试(2017年15期)2017-12-18基于并行计算的大数据挖掘在电网中的应用电力与能源(2017年6期)2017-05-14不必预测未来,只需把握现在中学生数理化·八年级物理人教版(2017年11期)2017-04-18基于高斯混合聚类的阵列干涉SAR三维成像雷达学报(2017年6期)2017-03-26一种基于Hadoop的大数据挖掘云服务及应用信息通信技术(2015年6期)2015-12-26一种层次初始的聚类个数自适应的聚类方法研究电子设计工程(2015年6期)2015-02-27