2013是一个有趣的年份,有人说,2013年是进入大数据时代元年。大数据(BigData)在信息时代并非什么特别新鲜的事物,Google的搜索服务就是一个典型的大数据运用,在全球几十亿人参与的网络世界、智能系统随时都在吐纳着大数据。2013年前后,在我国瞬时间,大数据不仅成了IT行业中最摩登的词汇,也成了经济、政治、文化领域说事的流行语言和对未来社会预测的抢眼根据。
这种现象的出现和三件事情有关:第一,2012年3月,美国奥巴马政府宣布投资2亿美元启动《大数据研究和发展计划》,并将大数据定义为“未来的新石油”,希望增强政府收集、分析和萃取海量数据的能力。第二,是被誉为“大数据时代的预言家”英国维克托·迈尔-舍恩伯格着《大数据时代》和《删除:大数据取舍之路》,2013年1月由浙江人民出版社出版中文译本,将大数据由IT行业扩散到大众文化,使人们感到无比的新颖。第三,2013年6月斯诺登用41张幻灯片,让美国大数据监控项目“棱镜”浮出水面,令人对网络安全不寒而栗。数字化记忆的两大威胁:一个没有安全与时间的未来,直接面对人类。“在信息权力与时间的交汇处,永久的记忆创造了空间和时间圆形监狱的幽灵”,引发了因不甚了然网络生存的人群对未来的忧虑甚至恐怖。这些事件叠加在一起,风生火起,热闹非凡,大数据就成了世界特大事件。
面对大数据风潮,笔者就《大数据时代》和《删除》两本书产生如下认知和思考。《大数据时代》从当下信息技术迅猛发展及其所引起的社会深刻变革入手,运用商业典型个案进行分析、做出解读,并提出对未来的预测及其对策。它使人们强烈感受到世界的变迁,当今工业化、信息化的推进是何等神速,催人奋进。同时从中也可获取许多关于IT技术新发展的走向及其对社会生活带来深刻影响的信息,对深化世界变革的认知,加速人类文化品位的提升,都大有禆益。
《删除》中关于人类从‘记忆难忘却易’走到了向‘记忆易忘却难’的转变触动很大,深感既庆幸又悲凉。庆幸的是人类文化找到了储存的路径,历史可以凝固并在虚拟世界中重现,免除了人类在记忆上所耗费的海量劳动。悲凉的是如果不能删除,人们都将沦为数字王国的奴隶,赤裸裸地跪拜数字王面前,没有任何权利和隐私。当然也想到,今日世界只是贮存了部分上网人群的信息,是否能收集人类活动所有信息,还是一个难题。何况世界是人的世界,人是主体,人脑的智能还只开发了20%,数字王国只是人的一种虚拟,人总会想出有效监控网络的办法。庆幸和悲凉只是一纵即逝,但还是要感激作者对网络安全的警示。
由于书的内容涉及面十分宽广,论及的又是关于时代性的人类问题,自然就涉及科学技术和社会生活诸多方面知识的综合运用,更离不开哲学的思辨。虽然作者是IT行业顶尖专家,但毕竟是从行业视野看世界,当刻意凸显思维方式的变革而不能不涉足哲学时,由于哲学的繁杂,不免会留下值得商讨之处。最为突出的是:在张扬IT技术的进步中添加了一些界定不很清晰的哲学概念。
大数据(或数据大)是信息科学技术发展到云计算阶段出现的新现象,是信息时代的一个新表征,不宜用大数据来标识我们时代。上世纪五十年代以来,在系统科学群中信息理论和信息技术领先蓬勃发展,信息通信技术按照自身技术发展的逻辑,向更高级智能阶段繁衍和演进,是技术生态的正常过程。近二、三十年以来,由于信息高速公路建成和互联网构筑,信息感知和采集终端获取了海量的数据,又以云计算为代表的计算技术提供了强大的计算能力,一个空前巨大的、日益清晰的数字世界或网络世界耸立在世人面前,对人类社会的发展和走向产生全面的、风暴式的强大影响。
自然受到全球人们,特别是未来学家的关注,如托夫勒、奈斯比特、福来斯特以及当下的舍恩伯格等等。舍恩伯格说:大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。确然如此大数据时代论文,大数据的根基是IT系统,大数据将驱动IT产业新一轮的架构性变革是无疑的。但是否就由此而推论出社会走向了一个新的时代---大数据时代,却需要思量。
自从上世纪五十年代信息科学技术的产生和发展以来,就开启了世界观念的转型,从认为世界是物质、能源的变换,向世界是物质、能源和信息的变换,并确认了信息是这一变换的灵魂。物质生产方式和人们的生活方式都已转入到信息世界之中,堪称为一个新的时代---信息时代,以示其与物质和能源时代相区别。正因为如此,全球都认同人类进入了信息时代。尼古拉·尼葛洛庞帝(NicholasNegro-ponte)在1995年出版的《数字化生存》中就说过“计算不再只和计算机有关,它决定我们的生存”,“数字化生存使人挣脱了时间、空间的限制和‘原子’的束缚,得以遨游更为广阔的世界,接触更广泛的人群。”
他这些概括性的说法,已经表明信息时代的某些基本特征。舍恩伯格指出了数字化和数据化的区别,“数字化指的是把模拟数据转换成用0和1表示的二进位制,这样电脑就可以处理这些数据了。数据化是指一种把现象转变为可制表分析的量化形式的过程”,提升了数字化的内涵,反映了技术进步。比尼葛洛庞帝的数字化生存进了一步,或许可以称,当今人类处于数据化生存更为真切。虽然舍恩伯格引述了近一、二十年来计算机技术的新进展,主要是云计算及其带来的人类社会生活、工作和思维方面的新资料,值得人们关注,但只是进一步证实了关于信息时代的预言,在总体方面却没有超出尼葛洛庞帝等的看法。最多也只能说,大数据是信息时代面临的新现象和新阶段。说2013年是大数据时代元年就更不符合历史事实。
数据逐渐成为重要的生产要素,人们对海量数据的运用将预示着新一波生产力增长和消费者盈余浪潮的到来。大数据将会创造一个新的经济领域,该领域的全部任务就是将信息或数据转化为经济利益。数据对于企业而言是一种重要的战略资产,谁能把握这一机遇并迅速行动起来,就能在未来的竞争站得先机至关重要。现在关于大数据的热门是IT行业,因为他们面临着处理现实大数据技术上的直接挑战,竞争十分激烈,关系它们的生存和发展的命运。大数据中,结构化数据只占15%左右,其余的85%都是非结构化的数据。如何处理非结构化和半结构化数据,如何把通过数据挖掘,将粗糙知识与被量化后的主观知识相结合,转化为“智能知识”;如何根据大数据复杂性、不确定性对其进行刻画并为大数据系统建模等等,都是大数据现象提出需要深入探索的深层技术问题。我们这类发展中国家IT技术尚处初级阶段,更是应当奋起直追,迎头赶上世界先进水平。在这一行业排难解惑中,由于商业利益而做些鼓动,使用一些过分夸张的广告语言是可以理解的。但学界更富有理性,目前人们还很难从学理上论证信息时代与大数据时代在质地上的区别,不宜于跟随商业的宣传而将大数据时代扩展到所有社会领域,随意使用时代这个相当严格严肃的词汇。如果时代的提法过多,将某一时代的某一阶段、某一现象也说成一个新时代,未免将时代太碎片化了,而模糊人们的大视野。
大数据不能删除精确性、因果性和‘为什么’的追求。舍恩伯格《大数据时代》中关于思维变革共有三章:第1章更多,不是随机样本,而是所有数据;第2章更杂,不是精确性,而是混杂性;第3章更好,不是因果关系,而是相关关系。大数据时代最大的转变就是放弃对因果关系的渴求,只要关注相关关系。
也就是说只要知道“是什么”,而不需要知道“为什么”.并认为这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。如果我们面对的只是一堆大数据,这样的想法是合理的、有效的。如果我们进入到物理世界、现实生活,我们不能满足于数据本身,而是要对数据进行的分析与处理,将粗糙知识转化为智能知识,对现实生活中将要发生的事件做出预测。在这一过程中,还是不能删除精确性、因果性和‘为什么’的追求。
诚然计算机网络的建成和繁衍,构建了一个数据高速增长的世界,数据达到海量,有价值的和没有价值的数据浑然杂呈,网络数据呈现出混杂性。但是并不能因此而放弃对精确性和因果性的追求,更不能说人类的认识停留在“是什么”就够了。舍恩伯格书中明确指出:“大数据的核心就是预测”.预测不是算命,是以事实为依据的,只有依据科学规律做出的预测才能保障预测的实现。规律就是最为本质的相关性,相关性并不一定是因果关系,但因果性却必定是一种相关性。人类是有理性的,总是凭着理性追求现象背后的本质和规律,即事件之间的相关性、恒常性及其所蕴含的因果关联(线性的和非线性)。理性思维是实践中产生的以一定的‘格’固定下来的思维惯例和逻辑思维能力。信息科学和计算机技术无时无刻在运用着数理逻辑的支撑,如果放弃逻辑思维和逻辑程序的设计,大数据便不复存在。
数学是关于数量和空间关系的科学,其特点是抽象性、精确性和应用的广泛性。虽然[美]M·克莱因《数学:确定性的丧失》一书否定了关于数学确定性的‘神话',然而绝大多数人,今天仍然认为数学是关于物质世界的不可动摇的知识体系。他强调了数学不合逻辑的发展方式,应用数学反对“纯”数学的问题以及在二十世纪数学逻辑结构的连贯性遇到的挑战等事实,令人振聋发聩,从迷信数学中惊醒。
然而翻阅数学发展史,人们不难发现,数学危机是多次发生的,史上就发生过三次大的危机。数学公理体系的无矛盾性始终是数学的追求,然而每一次危机都表现为悖论的出现,新的数学体系又以悖论的破解应运而生。每一次危机都带来了一次新的发展,数学发展呈现为连续和间断的统一。因此当数学遭遇危机的时候,决不是悲观地放弃精确性,而是从公理系统中解决悖论,提出新的公理系统。人们面对的现实世界是灰色的,是混然杂呈的现象世界。生活中有许多模糊现象,应对具体的生活,使用模糊语言和大概的估算是必须的,可以节省许多不必要的精确计量,不必要饭也一粒粒数着吃,规定每顿吃多少粒。但是,人类进步,科学发展,文明的演进,就在于对这一混沌世界中的现象进行辨析,确定现象的性质和数量以及它们的关联。近代科学技术史就是实验分析和数学方法相互结合的历史。科学研究中必须做到十分精确,只有这样才能预测未来,并规范人类行为以实现生存发展的目的。
地震预报就是根据大数据而做出的,人们努力的目标就是力求做到更加精准。人类探月活动中各种装置就必须设计得十分精密精准,一个数据上的错误,甚至误差,都会导致行为的失败,造成灾难性的后果。数学中有句警言:差之毫厘,失之千里。1965年美国控制论学者L.A.扎德发表论文《模糊集合》,标志着模糊数学这门新学科的诞生。但实际运用中还是要还原于精确数学,通过常规计算才能解决实践问题。世间现实的事物都有质和量的属性,没有无质的量,也没有无量的质。如同数学中的点、线、面在现实中是不存在的,只是几何学中的虚拟,
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。