下面是小编为大家整理的图6.53,输入文本内容-电子商务数据概念及意义,供大家参考。
电子商务数据的概念及意义 电子商务是与数据分析关系非常紧密的重要行业之一,也是数据分析广泛应用的行业之一。通过数据分析对数据进行有效的整理和分析,为企业经营决策提供参考依据,进而为企业创造更多的价值,是数据分析在电子商务领域应用的主要目的。
电子商务数据分析的相关概念 电子商务数据分析是运用分析工具研究电子商务数据信息,搭建数据分析与电子商务管理的桥梁,指导电子商务决策的一门新兴学科。通常概念下,电子商务数据分析指的是对电子商务经营过程中产生的数据进行分析,在研究大量的数据的过程中寻找模式、相关性和其他有用的信息,从而帮助商家做出决策。通过对相关数据的有效统计、分析和使用,形成多种模型,促进客户、商业伙伴之间的沟通及优化应用,通常需要计算机软件的支持。
数据分析 “数据”是人们通过观察、实验或计算得出的结果。数据有很多种,最简单的就是数字,也可以是文字、图像、声音等。数据可用于各类研究、设计、查证等工作。“分析”是将研究对象的整体分为若干部分、方面、因素和层次,并分别加以考察的认识活动。分析的意义在于细致地寻找能够解决问题的主线,并以此解决问题。
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析可帮助人们做出正确的判断,以便采取适当行动。数据分析的数学与统计学基础在 20 世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广。数据分析是数学、统计学、计算机科学等相关学科相结合的产物。
数据分析的目的 数据分析的目的是把隐藏在大量看来杂乱无章的数据中的信息集中和提炼出来,从而找出所研究对象的内在规律。在实际应用中,数据分析可帮助人们做出判断,以便采取适当的行动。数据分析是有组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。例如,设计人员在开始一个新的设计以前,要通过广泛的设计调查,分析所得数据以判定设计方向。因此数据分析具有极其广泛的应用。
数据分析的分类 一般把数据分析分为三类:探索性数据分析(Exploratory Data Analysis,EDA),验证性数据分析(Confirmatory Data Analysis,CDA)和定性数据分析。①EDA 是指对已有的数据在尽量少的先验假定下进行探索,侧重于在数据之中发现新的特征。本质上是从客观数据出发,探索其内在的数据规律,让数据自己说话。②CDA 是指在进行分析之前一般都有预先设定的模型,侧重于已有假设的证实或证伪。③定性数据分析是依据预测者的主观判断分析能力来推断事物的性质和发展趋势的分析方法。
数据可视化 数据可视化旨在将数据分析的结果通过表格、图标和信息图的方式直观地展示出来,使他人更容易、更快速得到并理解数据分析结果。数据可视化工具有很多,如 Tableau、Power BI、Python、Excel、World、PowerPoint 等。现代社会已经进入一个速读时代,好的可视化图表可以清楚地表达数据分析的结果,节约人们思考的时间。
数据分析的使用者有大数据分析专家和普通客户,他们对于大数据分析最基本的要求就是数据可视化,因为数据可视化能够直观地呈现大数据的特点,让观者直接看到结果,发现数据规律,获取敏锐洞察,让数据分析更简单、更智能。
大数据 大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的特点 IBM 提出大数据的 5V 特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。①Volume:数据量大,即采集、存储和计算的数据量都非常大。真正大数据的起始计量单位往往是 TB(1 024GB)、PB(1 024TB)。②Velocity:数据增长速度快,处理速度也快,时效性要求高。比如,搜索引擎要求几分钟前的新闻能够被用户查询到,个性化推荐算法尽可能要求实时完成推荐。这是大数据区别于传统数据挖掘的显著特征。③Variety:种类和来源多样化。种类上包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等,数据的多类型对数据处理能力提出了更高的要求。数据可以由传感器等自动收集,也可以由人类手工记录。④Value:数据价值密度相对较低。随着互联网及物联网的广泛应用,信息感知无处不在,信息量大,但价值密度较低。如何结合业务逻辑并通过强大的机器算法来挖掘数据的价值,是大数据时代最需要解决的问题。⑤Veracity:数据的准确性和可信赖度高,即数据的质量高。数据本身如果是虚假的,那么它就失去了存在的意义,因为任何通过虚假数据得出的结论都可能是错误的,甚至是相反的。
大数据的作用 ①对大数据的处理分析正成为新一代信息技术融合应用的结点。通过对不同来源数据的管理、处理、分析与优化,将创造出巨大的经济和社会价值。②大数据是信息产业持续高速增长的新引擎。面向大数据市场的新技术、新产品、新服务、新业态会不断涌现。③大数据利用将成为提高核心竞争力的关键因素。各行各业的决策正在从“业务驱动”转变为“数据驱动”。数据分析可以使零售商实时掌握市场动态并迅速做出应对;可以为商家制定更加精准有效的营销策略提供决策支持;可以帮助企业为消费者提供更加及时和个性化的服务。④大数据时代科学研究的方法手段将发生重大改变。在大数据时代可通过实时监测、跟踪研究对象在互联网上产生的海量行为数据进行挖掘分析,揭示出规律性的东西,提出研究结论和对策。
【知识拓展】
对大数据常见的两个误解 数据不等于信息。经常有人把数据和信息当作同义词来用。其实不然,数据指的是一个原始的数据点(无论是通过数字,文字,图片还是视频等),信息则直接与内容挂钩,需要有资讯性(informative)。数据越多,不一定就能代表信息越多,更不能代表信息就会成比例增多。有两个简单的例子,一是备份,很多人如今已经会定期的对自己的硬盘进行备份。每次备份都会创造出一组新的数据,但信息并没有增多。二是多个社交网站上的信息,当人们接触到的社交网站越多,获得的数据就会成比例的增多,获得的信息虽然也会增多,但却不会成比例的增多。因为很多网站上的内容十分类似。
信息不等于智慧。通过技术手段可以去除数据中所有重复的部分,也整合了内容类似的数据,这样的信息对我们就一定有用吗?不一定,信息要能转化成智慧,至少要满足以下 3个标准:①可破译性。这可能是大数据时代特有的问题,越来越多的企业每天都会生产出大量的数据,却不知该如何利用,企业就将这些数据暂时非结构化(unstructured)的存储起来,但这些非结构化的数据却不一定可破译,因此不可能成为智慧。②关联性。无关的信息,至多只是噪音。③新颖性。例如,某电子商务公司通过一组数据/信息分析出了客户愿意为当天送货的产品多支付 10 元,接着又通过另一组完全独立的数据/信息得到了同样的内容。
这样的情况下,后者就不具备新颖性。因此,很多时候只有在处理了大量的数据和信息以后才能判断它们的新颖性。
云计算 云计算(cloud computing)是一种分布式计算技术,通过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,再交由多部服务器所组成的庞大系统经搜寻、计算分析之后将处理结果回传给用户。云计算是一种资源交付和使用模式,通过网络获得应用所需的资源(硬件、平台、软件),提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取。通过这项技术,网络服务提供者可以在数秒之内达成处理数以千万计甚至亿计的信息,达到和“超级计算机”同样强大效能的网络服务。目前云计算包含三个层次的内容:IaaS、PaaS 和 SaaS。①IaaS(Infrastructure as a Service):基础设施即服务,指把 IT 基础设施作为一种服务通过网络对外提供,并根据用户对资源的实际使用量或占用量进行计费的一种服务模式。②SaaS(Software as a Service):软件即服务,即通过网络提供软件服务。SaaS 平台供应商将应用软件统一部署在自己的服务器上,客户可以根据工作实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用,并通过互联网获得 SaaS 平台供应商提供的服务。③PaaS(Platform as a Service):平台即服务,即把服务器平台或者开发环境作为一种服务提供的商业模式。
【数据视野】
云计算的实际应用 在 2020 天猫双 11 全球狂欢季纪录之夜,据双 11 实时交易数据显示,11 月 1 日至 11日,2020 天猫双 11 订单创建峰值达 58.3 万笔/秒。成功扛住大规模流量、支撑各大电商平台“双 11”购物盛况的正是背后的阿里云、腾讯云等各大云计算服务平台。有了云计算,用户可以不用关心机房建设、机器运行维护、数据库等 IT 资源建设,而可以结合自身需要,灵活地获得对应的云计算整体解决方案。阿里巴巴、腾讯、华为等行业领先企业在满足自身需求后,又将这种软硬件能力提供给有需要的其他企业。云平台的成本、安全和管理集约优势可以降低 IT 架构和系统构建的成本并按需提供弹性的 IT 服务。云计算已被广泛应用在互联网、金融、零售、政务、医疗、教育、文旅、出行、工业、能源等各个行业,并发挥了巨大作用。如,铁路 12306 系统就使用阿里云平台支撑春运等购票峰值的 IT 需求,保障系统在高峰期的稳定运行。另一方面,云计算也成为城市、政府和各行业数字化转型的基础支撑。当前无论是电商平台,还是网上外卖平台、在线游戏中心、热点网站,或是工业互联网都离不开云计算。
数据挖掘 数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征提取、变化和偏差分析、Web 文本挖掘等。
分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类。其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而增加了商业机会。
回归分析。回归分析方法反映的是事务数据库中属性值在时间上的特征,产生一个将数据项映射到一个实值预测变量的函数,发现变量或属性间的依赖关系,其主要研究问题包括数据序列的趋势特征、数据序列的预测以及数据间的相关关系等。它可以应用到市场营销的各个方面,如客户寻求、保持和预防客户流失活动、产品生命周期分析、销售趋势预测及有针对性的促销活动等。
聚类分析。聚类分析是把一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。它可以应用到客户群体的分类、客户背景分析、客户购买趋势预测、市场的细分等。
关联规则。关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在客户关系管理中,通过对企业的客户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响市场营销效果的关键因素,为产品定位、定价与定制客户群,客户寻求、细分与保持,市场营销与推销,营销风险评估和诈骗预测等决策支持提供参考依据。
特征提取。特征分析是从一组数据中提取出关于这些数据的特征式,这些特征式表达了该数据集的总体特征。如营销人员通过对客户流失因素的特征提取,可以得到导致客户流失的一系列原因和主要特征,利用这些特征可以有效地预防客户的流失。
变化和偏差分析。偏差包括很大一类潜在有趣的知识,如分类中的反常实例,模式的例外,观察结果对期望的偏差等,其目的是寻找观察结果与参照量之间有意义的差别。在企业危机管理及其预警中,管理者更感兴趣的是那些意外规则。意外规则的挖掘可以应用到各种异常信息的发现、分析、识别、评价和预警等方面。
Web 文本挖掘。随着 Internet 的迅速发展及 Web 的全球普及,使得 Web 上的信息量无比丰富,通过对 Web 的挖掘,可以利用 Web 的海量数据进行分析,收集政治、经济、政策、科技、金融、各种市场、竞争对手、供求信息、客户等有关的信息,集中精力分析和处理那些对企业有重大或潜在重大影响的外部环境信息和内部经营信息,并根据分析结果找出企业管理过程中出现的各种问题和可能引起危机...
推荐访问:输入文本内容-电子商务数据概念及意义 文本 输入 意义