摘要:随着信息技术的不断发展,近些年来,海量的数据成为最具价值的财富。在信息传播极其迅速的今天各种数据渗透着我们的生活,它们以指数级的速度增长,数据爆炸将我们带入大数据时代。大数据开始蔓延到社会的各行各业从而影响着我们的学习、工作、生活以及社会的发展,因此大数据的相关研究受到中央和地方政府、各大科研机构和各类企业的高度关注。本文将从大数据时代的背景入手,引入大数据的相关定义,探讨大数据的特征以及大数据在现实中的应用,并对大数据未来的发展趋势进行分析。
中国论文网 /3/view-6811976.htm
关键词:大数据;大数据时代;数据分析;云计算
一、大数据时代的背景介绍
最早提出大数据时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”此后,大数据的发展和研究成为了各行业的热门话题,从而带动了政府、企业和研究机构对大数据研究热情。2008年Nature杂志推出的专刊从互联网科技、自然与环境、网络经济和金融等多个方面介绍了海量数据带来的挑战;2012年2月,《纽约时报》中一篇专栏写到在商业、经济金融和其他多方面领域中,管理者更倾向于通过大数据分析来作出决策;2012年3月,以奥巴马为首的美国政府发布了“大数据研究和发展倡议”;2012年5月,联合国通过了政务白皮书《大数据促发展:挑战和机遇》来探讨大数据的作用和影响;在过去几年,欧盟对大数据基础建设投资大约1亿多欧元,世界各国都在加大对大数据的分析和研究。而在中国,2012年10月,第十七次全国统计科学讨论会开幕,其主题就是大数据背景下的统计;2014年2月在北京召开了以“科研大数据与数据科学”为主题的“科学数据大会”,研讨了大数据时代下数据的分析和应用,以及科研数据带来的挑战和机遇。
二、大数据的定义和特征
大数据所涉及的内容和方面过于广泛,其中包括政治、教育、金融、传媒、医学、商业、工农业、互联网等方面,因此对于大数据的定义,不同的学者基于不同的背景和不同的理解有着不同的定义方式。大数据的发展是建立在较早经历信息爆炸学科的基础上的,用于“描述数据总量规模远远超出常用硬件环境和软件工具的处理能力的情形”。其中维基百科上“大数据的定义是指大数据指的是所涉及的资料规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯”。而全球知名咨询公司麦肯锡是这样定义大数据的,“大数据是指无法在一定时间内用传统数据库软件工具对其进行抓取、 管理和处理的数据集合”。
大数据的特征大致可以划分为四个方面:
(1)大数据的规模性,即大数据具有相当的规模,其数据量非常巨大。数据的数量级别可划分为B、KB、MB、GB、TB、PB、EB、ZB等,而数据的数量级别为PB级别的才能称得上为大数据。在2011年,全球产生了1.8ZB的数据总量。根据IDC公司的最新研究,未来10年,全球的数据总量将会增长50倍。而以此推算,数据产生的速度越来越快,而且数据总量将呈现指数型的爆炸式增长。
(2)大数据的多类型性,即大数据的数据类型呈现多样性,数据类型繁多,不仅包括结构化数据,还包括非结构化数据和半结构化数据;其中结构化数据即音频、图片、文本、视频、网络日志、地理位置信息等等。传统的数据处理对象基本上都是结构化数据,而在现实中非结构化数据也是大量存在的,所以既要分析结构化数据,又要分析非结构化数据才能满足人们对数据处理的要求。
(3)大数据处理的快速性,即处理大数据的速度越来越快,处理时要求具有时效性,因为数据和信息更新速度非常快,信息的价值存在的时间非常短大数据时代摘要,必须要求在极短的时间下在海量规模的大数据中摒除无用的信息来搜集具有价值和能够利用的信息。所以随着大数据时代的到来,搜集和提取具有价值的数据和信息必须要求高效性和短时性。
(4)大数据的预测性和潜在性。大数据的预测性即通过对一系列大数据进行分析,联系不同类型的大数据之间的关系,能够有效的对事件或事物的走向或者趋势进行预测,以便管理者做出决策。大数据的潜在性即从大数据的表面数据进行分析,进而得到大数据背后重要的有价值的信息,例如事物间错综复杂的联系,最后可以精确的理解数据背后所隐藏的现实意义。
三、大数据的应用
大数据应用的基础是对数据的分析与挖掘,通过对数据的处理可以使大量的数据转化为多种具有价值的信息,进而为用户的决策提供帮助。总之,大数据时代给社会发展带来了多方面的影响。
(1)新浪微博是大数据时代典型的产物,微博颠覆了传统意义上普通信息媒介的传播方式,它具有传播速度快,传播范围广的特点,能在短时间形成飓风的传播效应,进而形成广泛的影响力。微博充分利用大数据的优势,它每一刻都在收集、整理、分析、储存海量的数据,在同一时间里所创造的数据总量是传统报纸、杂志、报刊的数倍,这是传统媒介传播方式所不能与之相比的,而且微博还通过众多用户的数据来分析、对比、跟踪用户行为和偏好,进而来制定更加符合用户的产品。新浪自从推出微博以后,新浪集团的股价从原来的长期横盘变为一路走高大数据时代摘要,给新浪带来了巨额的财富。
(2)美国有同样在大数据时代背景下成长起来的互联网公司――Google,这是一家致力于互联网科技、云计算、广告技术的互联网巨头。Google所有的产品都是免费使用的,如日历、联系人、Gmail、Google+以及Android系统,但是Google的盈利方式是什么呢?因为Google的所有应用都是需要联网在线使用的,用户在线使用时,这些软件就会把用户的相关信息发送给Google,例如,用户的个人行为、偏好等。这样的话,Google的产品越丰富,它对用户的信息掌握的越多,就能更加准确的针对不同
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。