1. 链一财经首页
  2. 资讯

大数据(一):人类社会会被彻底淹没在数据的海洋之中 | 连载七

大数据 文字 数字

我们今天处在一个信息爆炸的时代,微信、微博客和视频网站总能在近乎第一时间为我们带来各式各样的资讯;打车、吃饭和购物的时候,支付宝、app和小程序们也会有五花八门的推荐。回到公司,我们需要从大量电子化的文件、合同中翻阅我们希望找到的资料;工厂车间的进度相对慢一些,但我们还是能见到逐步普及的传感器,工程师们会根据控制屏上传回的代码操控机器进行工作。

这一系列事件背后的基本元素就是数据,通过计算机键盘、手机和车载蓝牙,数据源源不断地产生和流转,仿佛一夜之间就占据了我们的世界。我们早就在佛罗伦萨美第奇家族的财产登记册,以及第一台计算机绘制的炮弹射击图表中见过各种数据,但直到近些年才发现原来它们远不止是一串冷冰冰的符号。数据不仅仅属于专业人士和科研机构,它已经和我们每一个人息息相关。它走进了我们生活和工作的方方面面,有时候甚至已经到了和我们形影不离的程度。

过去由于没有发达的传递和存储数据的载体,人类能够获取的数据非常有限,加上只有在很少的情况下能够单纯依靠数据解决复杂的问题,我们并没有充分意识到它的价值。伴随着2000年以来互联网尤其是移动互联网的发展,数据量得以快速增长,很多以前没有办法解决的问题通过数据的运用得到了解决,媒体上也开始频繁提及数据的概念。西方学者用“big”来形容这一时期数据大量出现和被广泛应用的情形,也被翻译成汉语“大数据”。

如今大数据已经成为了一个非常时髦的概念,从机场广告到商务会议,我们时不时就可以见到它的身影。原来的数据加上了“大”字以后似乎就变得魅力无穷,一切商业和公共行为只要重新用数据记载,就都可以借助它实现升级。我们不禁会问,为什么数据存在了这么多年却对我们没产生什么大的影响?今天这个所谓大数据究竟又和以往有什么不同?我们说未来会是一个数字的世界,是不是指的就是这种数据量足够大,大到一切都是数据的情形呢?

故事还得从数字的起源说起。我们的祖先居住在地球上,对于这个陌生的土地充满了未知,为了更多了解这个世界,迅速学习新鲜事物,人类逐渐发明了语言和文字。至今可考的最早的文字是公元前32世纪左右苏美尔人(居住在两河流域,文明的中心在今伊拉克首都巴格达一带)创造的楔形文字。在人类文明的传递过程中,文字起到了至为关键的作用。

起初,数字和文字是不分的——如果说文字是伴随记录信息的需求而诞生的话,数字则仅仅是因为人们存放在山洞里的财产多到需要数一数才弄得清楚,因而在文字中加入的一种计数工具而已。

后来随着人类开始拥有越来越多的财产,我们开始为这种工具制定了十进制、乘法、加减等一系列规则。在这一过程中,古代印度人发明了描述一套数字的方法,也就是今天全世界通用的包括0在内的10个阿拉伯数字(因为是借由阿拉伯人传入欧洲并得到普及的,因而欧洲普遍认为它们是来自阿拉伯人的创造)。

大数据(一):人类社会会被彻底淹没在数据的海洋之中 | 连载七

这项发明意味着数字和文字的分离,在这之后人类开始用一种独立的记录方式承载客观世界的信息。这种叫做数字的全新记录规则的出现,也构成了我们今天所讨论的数据的基础。通过数字符号,我们将过去的所见、所闻,对未来的预测通过石板、纸张以及计算机网络保存了下来。此外还有一些特别的部分,它们是人类通过对事情的抽象提炼,用数字编写成的具备完整逻辑的理论,诸如勾股定理、麦克斯韦方程和狄拉克公式等等,由此产生了数学这一学科。

我们将这些方程和公式的原理应用到人类历史进程的方方面面,从电气工程的设计、运载火箭的升空到互联网搜索网站的诞生,同时也把对很多事情的处理过程编写成数据。人类一点点地丰富着自己的数据资料,并借由它向下一代传递智慧和思考。

很长时间以来,由于记录规则不够丰富,尤其是成本较高等原因,数据只是零碎地散布在不同的领域,人类拥有的数据量也长期停留在很小的水平。计算机尤其是互联网的普及大大改变了这一状况,借助该技术,数据的生产门槛被大大降低,大量信息开始被转换成数据在网络上进行传递。在互联网蓬勃发展的短短十几年间,我们所创造出的数据就已经超过了人类历史以往的数据总量。

维克托·迈尔在《大数据时代》一书中曾预测,到2013年世界上存储的数据将达到约1.2ZB。这样的数据量意味着如果把这些数据全部记在书中,这些书可以覆盖整个美国52次;如果将之存储在只读光盘上,这些光盘可以堆成五堆,每一堆都可以伸到月球。

事实上,2013年的全球数据总量达到了4.4ZB,几乎是维克托·迈尔当时估计值的4倍。在这之后的数据量更是增长惊人,据统计,过去几年数据存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度比世界经济的增长速度快9倍。随着网络连接的深入,人类数据库的规模仍将保持高速增长,IDC公司就在报告中做出过预测:到2020年全世界的数据总量预计为40ZB,而在2025年更会达到163ZB。按照这种发展趋势,人类社会在不久的将来就会被彻底淹没在数据的海洋之中。

*文章为作者劫波李凯龙(ID:KalpaTech)原创独立观点。 未经授权, 禁止擅自转载。 

*李凯龙,数字机构劫波科技创始人兼CEO。

李先生就读于清华大学经济管理学院和法学院获得硕士学位,拥有香港中文大学mba及北京外国语大学语言文学学士文凭,并被公派到欧洲多个国家留学。李先生曾供职中美顶级的一/二级市场投资及基金;曾于腾讯从事研究与投资工作,期间在腾讯研究院担任首席研究员;曾出任中国五百强佳兆业金融控股总裁助理职务,负责战略业务规划及金融/科技/消费板块的投融资和运营管理。李先生还是清华-伯克利深圳学院和香港中文大学博士及研究生课程讲授学者,并为清华大学院系校友会之理事。

根据国家《关于防范代币发行融资风险的公告》,大家应警惕代币发行融资与交易的风险隐患。

本文来自LIANYI转载,不代表链一财经立场,转载请联系原作者。

发表评论

登录后才能评论

联系我们

微信:kkyves

邮件:kefu@lianyi.com

时间:7x24,节假日bu休息

QR code