技术研发 Vo1.20。No.6。2013 大数据下可视化分析 郑昌璇,陈 洋 (重庆工商大学会计学院,重庆摘400067) 要:“大数据”是由数量巨大、结构复杂、类型众多的数据构成的数据集合,是基于云计算的数据处理与应用模式,通 过数据的整合共享,交叉复用,形成的智力资源和知识服务能力。微软对公众开放了面向Excel 2013下的“GeoFlow”。 作为一个创新性的大数据分析方式,GeoFlow让我们看到了借助地理位置信息、在线地图服务对分散性较强的数据进行 集中型分析的又一种可能。 关键词:大数据;可视化分析;云计算;数据处理 doi:10.3969/j.issn.1006—8554.2013.06.015 1“大数据”来临 进入21世纪,信息的爆炸式增长带来了数据的海量化。 统计显示,互联网一天产生的全部数据内容可以刻满1.68亿 张DVD;发出的邮件有2 940 ̄L封之多;发出的社区帖子达200 万个,相当于《时代》杂志770年的文字量;卖出的手机为37.8 万台,高于全球每天出生的婴儿数量37.1万。2011年,全球 产生的数据量高达1.82ZB,相当于全球每人产生200GB以上 的数据。而到目前为止,人类生产的所有印刷材料的数据量 是200PB(1024TB=1PB),全人类历史上说过的所有话的数据 量大约是5EB(1024PB=1EB)。 大数据开启一个前所未有的信息大爆炸时代,它所带来 的变革也是空前的。2013年,大数据技术肯定会继续发展和 进步,而且它的新业务应用也一样,虽然还存在不确定因素。 在当今环境中,大数据已经将我们对分析的认识从向后分析 变成向前分析。大数据向我们提出了数据采集、分析和使用 等难题。 全球知名咨询公司麦肯锡称:“数据,已经渗透到当今每 一个行业和业务职能领域,成为重要的生产因素,人们对于海 量数据的挖掘和运用,预示着新一波生产率增长和消费者盈 余浪潮的到来。” 2“大数据”难题 大数据技术的战略意义不在于掌握庞大的数据信息,而 在于对这些含有意义的数据进行专业化处理。换言之,如果 把大数据比作一种产业,那么这种产业实现盈利的关键,在于 提高对数据的“加工能力”,通过“加工”实现数据的“增值”。 “大数据”是需要新处理模式才能具有更强的决策力、洞察发 现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据分析相比于传统的数据仓库应用,具有数据量大、查询 分析复杂等特点。 大数据的海量数据信息带来的更多的是数据价值,但我 们也不能忽视数据分析的重要性。提高数据分析的效率,对 大数据信息进行剔除、筛选,建立“大数据战略”体系,其首要 实现的是数据分析,因为企业对各类数据的解读与应用都必 须是在有价值的数据上进行,只有通过对所需数据的全面准 确分析,形成数据流规模,这样的数据结果对决策行为才有指 导性作用。这样我们才能抓住大数据的机遇,而不会被大数 据时代湮没。 3不可忽视的可视化分析 近日,微软对公众开放了面向Excel 2013下的“GeoFlow”, 这款3D数据可视化工具。作为一个创新性的大数据分析方 式,GeoFlow让我们看到了借助地理位置信息、在线地图服务 对分散性较强的数据进行集中型分析的又一种可能。它通过 从网页中直接提取结构性数据,对人物建立索引,以帮助信息 工作者对其进行分类检索。 数据可视化技术的主要特点: 1)交互性。用户可以方便地以交互的方式管理和开发数 据。 2)多维性。可以看到表示对象或事件的数据的多个属性 或变量,而数据可以按其每一维的值,将其分类、排序、组合和 显示。 3)可视性。数据可以用图象、曲线、二维图形、三维体和 动画来显示,并可对其模式和相互关系进行可视化分析。 数据分析是从大量的、不完全的、模糊的、随机的数据中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信 息和知识的过程。原始数据可以是结构化的,如关系数据库 中的数据,也可以是半结构化的,如文本、图形、图像数据,甚 至是分布在网络上的不同构型数据。通过数据分析可以发现 多种类型的知识,包括反映同类事物共同性质的广义型知识; 反映事物各方面特征的特征型知识;反映不同事物之间属性 差别的差异型知识 反映一事物和其他事物之间依赖或关联 的关联型知识;根据当前历史和当前数据推测未来数据的预 测型知识。为了使发现知识的过程和结果易于理解和在发现 知识过程中进行人机交互,要发展发现知识的可视化方法。 为了了解数据之间的相互关系及发展趋势,人们可以求助于 可视化技术。信息可视化不仅用图像来显示多维的非空间数 据,使用户加深对数据含义的理解,而且用形象直观的图像来 指引检索过程,加快检索速度。 (下转第34页)