1. 链一财经首页
  2. 资讯

大数据(三): 数字无界,或许就在眼前 | 连载九

日心说 数字乐谱 概率

为了走到大数据的今天,人类经历了重重磨难,我们通过将世界一一写入数据,解决了无数个困扰我们的疑惑和难题。让我们从宇宙和天文学的例子中领会一下这当中的不易。事情照例从混沌开始,日月星辰斗转星移,早期的人类看着这些自然现象,会产生一个理所当然的疑问——我们居住的地球在宇宙中处于一个什么样的位置?我们是宇宙的中心吗?

最初颇受欢迎的是地心说的言论,它是由古希腊时期的米利都学派形成初步理念,哲学家欧克多索于公元前4世纪提出几何模型,并经由亚里士多德、托勒密进一步发展而逐渐建立和完善起来的。该学说认为地球是宇宙的中心,是静止不动的,其它的星球都是环绕着地球运行,人类是宇宙万物的主宰。

由于地心说契合了古代教会关于上帝造人的宗教理念,自公元2世纪被体系化以来,它就一直被视为能够揭示宇宙运转规律的客观真理。虽然比欧克多索略晚一些出生的阿基米德早在公元前3世纪就建立了日心说(认为太阳是宇宙的中心,地球围绕太阳运转)模型的原型。但由于古人很难接受大地是运动的观点,加之缺乏翔实的观测数据和长期以来教会的压制,日心说一直支持者寥寥。

在之后漫长的岁月里,地心说一直是西方世界的正统,直至16世纪才有人重拾日心说的科学研究。最早复兴日心说理论的是波兰天文学家哥白尼,在其临终前出版的《天体运行论》一书中,哥白尼对日心说进行了较为详细地数学阐述。哥白尼之所以能够推动进一步的研究,主要是因为近代科学的发展,人类从最初只能通过肉眼和感觉判断,开始可以借助更多的观测工具和计算推理来分析这一问题。

然而事情并没有一下子就完成演化,由于日心说与教会思想之间存在矛盾,在哥白尼之后的支持者布鲁诺被宗教裁判所判为“异端”烧死在罗马鲜花广场。1609年,伽利略通过自制的望远镜观测到了佐证日心说成立的重要证据并将之公布于众,为此他遭受到教会的威胁和迫害,并被软禁起来逼迫其与哥白尼学说决裂。

大数据(三): 数字无界,或许就在眼前 | 连载九

矛盾被集中在“地心”还是“日心”的论战中久久无法被解决,除了教会的原因,还有一个非常重要的就是日心说迟迟拿不出一个让所有人心服口服的准确模型(这里的模型运算和前面数据驱动的方法不同)。哥白尼和伽利略的研究虽然相比前人有了很大的进步,但是并不能从数据角度完整地证明地心说的错误。最终完成使命的是开普勒,通过创造性的提出椭圆状的行星运动模型,以及开普勒三大定律,彻底战胜了一千多年来的地心学说。

事实上,日心说最终能够在欧洲被广泛接受,还存在相应时代背景——15、16世纪的欧洲正是从封建社会向资本主义社会转型的关键时期,新兴的资产阶级为自己的生存和发展,掀起了一场反对封建制度和教会迷信思想的斗争,出现了人文主义的思潮,这就是震撼欧洲的文艺复兴运动。与此同时,当时出于对外贸易目的兴起的远洋航行,也迫切需要许多的天文和地理知识。通过在这些航行中的积累,人们也愈发发现“地静天动“的宇宙学说是值得怀疑的,这些都为后来日心说确立主导地位奠定了基础。

矛盾双方在长期的论战过程中,不仅仅是诋毁,它们之间也往往可以相互促进。在很长一段时间内,由于围绕在地心说周围的都是一批非常杰出的数学、天文和哲学学者,他们通过长期的深入研究,建立起对天体观测的一整套详细的科学方法论。比如地心说主要的支持者托勒密,他继承了毕达哥拉斯的一些几何思想,通过发明40-60个小圆套大圆的方法,精确地计算出了所有行星运动的轨迹——今天即使在大型计算机的帮助下,我们也很难解出40个套在一起的圆的方程。

后来复兴日心说的哥白尼正是采用了这种简化的圆的方程来进行他理论的阐述。虽然最后开普勒发现行星围绕太阳的运转轨道实际上是椭圆形的,但其在数学计算上也多处借鉴了托勒密的研究,而且他本人也不清楚为什么行星的运动轨迹会是椭圆而不是圆——直到牛顿提出万有引力定律,人类才最终弄清楚形成椭圆的真正原因。

就这样,演化在人类历史中跌跌撞撞的发生。它不似诗歌那般激昂,那些曾经的刀剑划过和血肉横飞的场面也会逐渐模糊。然而它又是那般执着和深邃,不容得我们一丝的狡辩与怯懦。演化永存,它看似悄无声息,却如洪流般浩浩汤汤,裹挟着一切向前。

在上面的例子中,我们已经能够时不时看到数据发挥的作用。到了今天,在爱因斯坦、霍金等人的努力下,人类建立起了相对完整的宇宙、天文知识体系,与之伴生的数据量的积累也达到了前所未有的水平。根据统计,在21世纪伊始,位于美国新墨西哥州的望远镜在短短几周收集到的数据,就已经比天文学历史上总共收集的数据还要多。中国在2016年建设的被誉为“天眼”的世界最大的500米口径球面射电望远镜,甚至可以探测到最远1000光年以外的声波,每天传输数据可达5兆字节。

天文学的的故事让我们看到了人类探索宇宙的雄心,我们同样对居住的四周充满了好奇,而音乐就是表达这一好奇心的重要载体。利用声音高低、强弱的变化,人类可以模拟大自然的美妙之音,并将我们对世界的感知记录下来,用来抒发爱慕、喜悦和悲伤之情。我们今天欣赏各种古典、爵士和流行音乐,通常会将其视为一门颇带主观色彩的人文艺术,但事实上,音乐与数字之间的联系也颇为密切。

文字记载最早发现它们之间联系的是前面我们提到的古希腊数学家毕达哥拉斯,他发现音响的和谐与发声体体积的一定比例有关,并可以用数字记录,于是编制了早期的音乐记录规则,这也为后来通行的五线记谱法的出现奠定了基础。

五线谱的发展如日心和地心的争论一样,同样经历了上千年的演化历史。从最初只能进行简单的记载,五线谱通过不断完善各种表达符号和规则,逐渐发展到可以精细地标记音量、速度和音色变化,也即将整个音乐作品完整无误的进行数据化的描述。

物极必反,后来由于五线谱太过细致入微,挤压了演奏者即兴发挥的空间,于是记谱法又发生了方向上的转变,仅仅会编辑进必要的部分,留出一定的弹性空间。这样就将音乐的最终解读权交还到表演者手中,使得每一次演奏都变得独一无二。

相比西方,中国古乐谱没有形成音高和节奏的精确量化和数字符号转码,仅仅会记录传统乐曲或唱腔的基本轮廓,它给予演奏和演唱者创作的自由度和不确定性比西方乐谱要大得多,因而又被称为“框架谱”。这当中体现了东西方对于艺术差异化的理解,同样的情况也可以在西方的素描和中国的水墨画中见到。

大数据(三): 数字无界,或许就在眼前 | 连载九

回到最初的理想模型,天文只是其中一个颇具代表性的案例,在化学、生物等各个基础学科的研究和形形色色的商业、生活应用中,一组组数据承载着人类对完美世界探究的理想被挖掘和计算着。我们不知道有一天真的实现万物数据化后,这个世界会变成什么样子?或许到了那一天我们可以借助数据医治癌症?又或者现在世界上选举和议会制度将会消亡——因为一切皆数据的时候,现在任何组织机构运转的效率都会远远比不上依赖数据来做决策。

然而在五线谱的发展历程中可以看到,即使数据真的可以帮助我们精确记录所有的演奏,甚至有一天所有的音乐和艺术创作都可以用数据和机器替代,但人类真的不需要留一些自己主观发挥的空间?全部的数据描述就一定意味着美好么,是否不确定本身也是一种美?大数据教会我们要放弃对因果性的执着,让数据发声,在事情中“是什么”比“为什么”重要——如果所有问题都用这种方式解答,世界是不是又显得有些索然无味了呢?

从另一个角度来看,如果万物数据化真正降临,人类是不是可以进化成为先知?因为那时候我们将拥有无穷无尽的资源,可以无限制地将公式推演下去。我们知道各种数学模型的基础都离不开概率论和统计学,但是很多研究纯数学的数学家都不把概率论当做数学,因为他们认为数学的确定性和概率的不确定本质上是存在冲突的。

如果样本本身是没有限制的,大到可以包含所有的真实信息,那么这个世界是否就不存在概率,所有的随机性也会消失?这样的话现在我们理解的所谓大数据的核心涵义:相对精确和相关性,是否就显得不再必要,又是否会消失在文明的长河之中?

或许真的有完美世界的存在,只是暂时我们心智不够,但终有一天会到达?又或许这样理想的未来仅仅只能存在于我们的想象中?无论如何,人类追寻梦想的脚步不会停止,我们也会用尽全力不断前行。

为了建设这个理想的世界, 人类又开始思考各种各样的方法。 在不断受益于这些数据组成的模型和公式之后, 我们逐渐将愿望寄予一种叫做智能的方式——今天对此有很多酷炫的名词, 人工智能、机器和深度学习等等, 其实说的都是这种方法, 我们期盼算法模型足够强大之后, 人类可以驾驭整个数字世界的运转。

我们认为,数据终将解决所有我们遇到的问题。虽然前面说到的切比雪夫不等式告诉我们在数据无限多后误差可以忽略不计,但是追求完美的人类总是期望有一天能够真正找到那个绝对无误的模型。在拥有了更多数据之后,我们还将创造越来越多漂亮的算法,并交给智能的机器去自动执行。这样看来,如果现在暂时还存在某些问题解决不了,那只不过是模型不够完善,计算还不够智能而已。

在通往未来理想世界的道路上,除了万物数据化之外,我们还需要开发出许许多多复杂精确的模型,并搭配上超级的计算能力,帮助我们将一切障碍全部扫除。通过智能的模型算法加上客观数据的采集,人类将拥有更高等级的智慧,我们将朝着更为浩瀚的宇宙深入进发,我们有机会让世界变成我们所期待的完美样子。

数字无界,或许就在眼前!

*文章为作者劫波李凯龙(ID:KalpaTech)原创独立观点。 未经授权, 禁止擅自转载。 

*李凯龙,数字机构劫波科技创始人兼CEO。

李先生就读于清华大学经济管理学院和法学院获得硕士学位,拥有香港中文大学mba及北京外国语大学语言文学学士文凭,并被公派到欧洲多个国家留学。李先生曾供职中美顶级的一/二级市场投资及基金;曾于腾讯从事研究与投资工作,期间在腾讯研究院担任首席研究员;曾出任中国五百强佳兆业金融控股总裁助理职务,负责战略业务规划及金融/科技/消费板块的投融资和运营管理。李先生还是清华-伯克利深圳学院和香港中文大学博士及研究生课程讲授学者,并为清华大学院系校友会之理事。

文章声明:本文为火星财经专栏作者作品,不代表火星财经观点,版权归作者所有,如需转载,请提前联系作者或注明出处。

根据国家《关于防范代币发行融资风险的公告》,大家应警惕代币发行融资与交易的风险隐患。

本文来自LIANYI转载,不代表链一财经立场,转载请联系原作者。

发表评论

登录后才能评论

联系我们

微信:kkyves

邮件:kefu@lianyi.com

时间:7x24,节假日bu休息

QR code