1. 链一财经首页
  2. 资讯

人工智能(二):理想模型=理想数据模型+算法+算力 | 连载十一

算法算力 AlphoGo 数字编码

关于未来会不会有替代人类智能的机器出现,这是一个老生常谈,且一直存在争议的话题。但至少目前可以比较肯定的是,我们现在还处在弱人工智能的时代,只能依赖AI解决一些局部的问题。虽然AI已经在围棋中获胜,但这并不代表它能够在各个方面都超过人类——从某种角度来说,那只不过是通过给机器“喂”数据得到的暴力破解结果而已。

判断AI是否超过人类的更为核心的标准在于其是否能够具备跨领域推理、抽象和尝试的能力。考虑到目前的AI在这些方面还相当稚嫩——比如懂得下围棋的程序并不能欣赏棋局中的博弈之美,也不能将之抽象出来用于商业决策,人类距离开发真正能够达到甚至超越自身智慧的物种还有相当长的路要走。

但无论如何,我们已经切身体会到AI带给我们的便利。借助对大数据的使用,世界被亚马逊、腾讯们的算法围绕着。它们精心计算着人类社会发生的一点一滴,并且小心翼翼地进入到我们的生活。AI会根据你过往的消费记录,智能的计算出你的消费倾向,并据此推送旅游折扣券或者促销信息给到你,你甚至会惊奇地发现它能够预测到你下个月国外旅行的计划;AI还可以帮助我们翻译论文、查找资料,以及在不久的将来为所有人驾驶汽车。人类开始有能力把自己从日常琐事中解放出来,从事一些更加高级的工作,并拥有更多时间去娱乐和享受生活。

在这个智能的世界,一切将会变得更加高效。AI会帮我们寻找复杂问题的解决方案,从而省去许多无谓的奔波;AI将会朝着越来越接近人类智慧的方向发展,直到有一天带给我们目前无法想象的繁荣……说到这里,我们似乎找到了之前文章中提出的问题的答案,脑海中再一次涌现出完美世界的图景。我们知道AI是在大数据基础上建构的一整套算法模型,既然如此,我们是不是可以把这个理想的世界简单表述为下面的公式:

理想模型=(万物数据化+相对精确+相关性)+算法

似乎还缺点什么?对了,我们还需要很多很多这样的机器,开足马力去计算所有复杂的数学方程,也就是被全部数据化了的世界,然后只需给到人类一个简洁优美的答案。按照严谨的计算机语言,能够支撑这个世界高速运转的机器的能力被统称为“算力”。我们再将前三项合并为“理想数据模型“,这样公式就可以被写作:

理想模型=理想数据模型+算法+算力

因为算法和算力作用的发挥非常依赖大数据的搜理想模型=理想数据模型+算法+算力集和发展,因而我们暂时没有在公式中给它们加上任何限定的词汇。在算法方面,目前的AI实际上是以大数据的相对精确、相关性为底层,比如AlphaGo和它之后的改进版本主要都是通过不断丰富数据实现迭代升级的,虽然模型本身也会调校,但相比早先的算法改进并不大。而且AlphaGO在下棋的时候,算法也不会告诉它为什么要下这一步,只是程序的计算结果说明这样走更合理而已。

从算力角度,AI也在不断地提升,以匹配持续增加的数据计算量。AlphaGo的计算能力已经是1997年战胜当时国际象棋世界冠军的IBM计算机“深蓝”的3万倍。而即使是二十多年前的深蓝,每秒钟的计算就已经达到两亿步,并且输入了一百多年来优秀棋手的两百多万盘对局。

人工智能(二):理想模型=理想数据模型+算法+算力 | 连载十一

正如有一天随着大数据“大“到一定程度之后,相对精确和相关性可能会显得不再必要,我们现在对于算法和算力的理解也可能随着技术的进步而产生改变。在未来的某个时候,人类可能会掌握更精确的算法模型,即使在小数据的场景中也能够解决问题;在这种情况下,算力也就不会无限地增长下去,而是在达到新的临界点后开始下降。这样计算资源是否就能被极大地节省下来?我们又会将这些剩余的资源投入什么新的领域呢?是用于人类大脑和基因的改造?还是去探索无尽的宇宙?

我们暂时还无法完整地回答这些问题, 但是我们可以从智能的发展历史中找到一些脉络。 以语义理解为例, 我们的故事仍旧从熟悉的混沌-矛盾-演化模型开始。 我们的祖先在五千多年前发明了最早的文字, 而后又经过漫长的历史演变, 逐渐形成了较为完善的语言表达和语法的规则。

人类主要就是通过学习语言、文字来了解新知识的。后来我们知道数字从中分离出来,并且在之后的几千年与文字越走越远。但二者之间并不是毫无联系的,由于数字具有一些文字不具备的属性,比如更有利于确保信息传递的无误,早在公元前4世纪,我们就已经开始尝试将一些语言和文字转化为数字进行表达。例如当时犹太人为了避免圣经在抄写中的错误,会将每一个希伯来字母对应成一个数字,这样每行文字加起来便得到一个特定的数字,以此作为这一行的校验码。

进入到20世纪,人类又将大量文字转换成数字编码写入计算机,并通过智能的模型对其进行理解和推演。AI最基本的应用场景就是让机器模仿人类去理解这些文字和它背后所表达的语义,也就是我们常常听到的自然语言理解。

语义理解的历史由来已久,中国汉代许慎的著作《说文解字》,就是对汉字字形、来源及词意的解析;北魏郦道元编写的《水经注》,也是对先人地理古籍《水经》进行框架上的陈述和表意上的解释扩展。

除了对文字和语句进行解析之外,广义的自然语言理解还包括机器翻译,以及语音识别和知识理解等等。制作于公元前196年的古埃及罗塞塔石碑,用希腊、古埃及和当时的通俗体文字记载了国王托勒密五世登基的诏书,从1798年被人发现到1822年法国语言学家商博良对其破解翻译,前后花费了整整21年的时间。虽然在AI出现之后的翻译方法并没有比19世纪先进多少,但因为有了数据和计算模型,现在我们翻译石碑所需要花费的时间会远远少于当时。

人工智能(二):理想模型=理想数据模型+算法+算力 | 连载十一

时至今日,对于绝大多数不是特别复杂的论文、外文资料等,我们都能够借助机器进行理解和翻译。我们通过发明语音识别的程序,将国际会议演讲者的内容实时转换成多国语言;我们还可以借助余弦定理、贝叶斯网络等数学模型对文献资料进行分类,并从中抽取概念和分析主题。伴随着AI的发展,我们正在挣脱巴别塔的束缚,让思想和灵魂彼此碰撞。

*文章为作者劫波李凯龙(ID:KalpaTech)原创独立观点。 未经授权, 禁止擅自转载。 

*李凯龙,数字机构劫波科技创始人兼CEO。

李先生就读于清华大学经济管理学院和法学院获得硕士学位,拥有香港中文大学mba及北京外国语大学语言文学学士文凭,并被公派到欧洲多个国家留学。李先生曾供职中美顶级的一/二级市场投资及基金;曾于腾讯从事研究与投资工作,期间在腾讯研究院担任首席研究员;曾出任中国五百强佳兆业金融控股总裁助理职务,负责战略业务规划及金融/科技/消费板块的投融资和运营管理。李先生还是清华-伯克利深圳学院和香港中文大学博士及研究生课程讲授学者,并为清华大学院系校友会之理事。

文章声明:本文为火星财经专栏作者作品,不代表火星财经观点,版权归作者所有,如需转载,请提前联系作者或注明出处。

根据国家《关于防范代币发行融资风险的公告》,大家应警惕代币发行融资与交易的风险隐患。

本文来自LIANYI转载,不代表链一财经立场,转载请联系原作者。

发表评论

登录后才能评论

联系我们

微信:kkyves

邮件:kefu@lianyi.com

时间:7x24,节假日bu休息

QR code